它的创作者透露,新版本的Chatgpt可以阅读面部表情,模仿人的语音模式并进行几乎实时的对话。
Openai在周一(5月13日)的明显实时演示中展示了即将推出的人工智能(AI)聊天机器人,称为GPT-4O。聊天机器人通过电话大声与演示者大声说话,似乎对人类对话及其微妙的情感提示&Mdash有着令人毛骨悚然的指挥。在命令时在机器人和唱歌声音之间切换,适应中断,并在视觉上处理其对话伙伴的面部表情和周围环境。
在演示期间,AI语音助手通过完成诸如实时语言翻译之类的任务,解决写在纸上的数学方程以及指导伦敦街头的盲人来展示其技能。
演讲结束后,Openai的首席执行官Sam Altman在社交媒体平台X上的单词帖子中写道。该帖子是对2013年同名电影的引用,其中一个孤独的男人爱上了AI助手。
为了展示其阅读视觉提示的能力,聊天机器人使用了手机的相机镜头来阅读一位Openai工程师的面部表情并描述他们的情绪。
有关的: 麻省理工学院通过创建混合体系结构赋予人工智能“像人类”的力量
“啊,我们去了,看来您的笑容和兴奋的氛围看起来很开心,开朗,”该机器人回答了Chatgpt这个名字。“发生了什么事,看起来您的心情很好。要分享这些良好共鸣的来源?”
如果演示是对机器人能力的准确表示,那么新功能将在公司以前的型号中的有限语音功能&Mdash&Mdash;无法处理中断或响应视觉信息。
OpenAI首席技术官Mira Murati在新闻发布会上说:“我们正在研究自己和机器之间互动的未来。”“我们认为GPT-4O确实在改变这种范式。”
新的语音助手将在接下来的几周内以Alpha Testers的限制形式发布,随后将从支付Chatgpt Plus Plus订阅者开始的更广泛的推出。该公告还遵循了彭博社报告,该公司正在与Apple达成协议,以在iPhone&Mdash上集成Chatgpt;打开GPT-4O可以用来升级iPhone语音助手Siri的可能性。
但是新技术带来了重大安全问题。该机器人处理实时文本,音频和视觉输入的能力意味着可以用于间谍。而且它令人信服的情感模仿也可能使其擅长进行骗局电话或以令人信服的方式提出危险的错误信息。
为了应对这些问题,穆拉蒂(Murati)表示,Openai正在努力建立对新技术的“减轻滥用”。