登录注册
【国盛计算机】OpenAI发布GPT-4o,多模态实时交互能力重大突破
步步高升哥
只买龙头的龙头选手
2024-05-14 09:17:10

【国盛计算机】OpenAI发布GPT-4o,多模态实时交互能力重大突破

[太阳]太平洋时间5月13日10点,OpenAI召开春季更新发布会,直播发布GPT-4o

[太阳]发布会直播展示惊艳多模态交互能力,可以进行实时视频交互。GPT-4o(“o”代表“omni全能”)接受文本、音频和图像的任意组合作为输入,直播中GPT-4O展示了实时语音交流能力,响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

[太阳]GPT-4o 的文本和图像功能今天开始在 ChatGPT 中推出。GPT-4o会 在免费套餐中提供,向 Plus 用户提供高达 5 倍的消息限制。在未来几周内OpenAI将在 ChatGPT Plus 中推出带有 GPT-4o 的新版本语音模式。开发人员现在可以在 API 中将 GPT-4o 作为文本和视觉模型进行访问。与 GPT-4 Turbo 相比,GPT-4o 的速度快 2 倍,价格减半,速率限制高出 5 倍。

[太阳]我们认为,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化,利好智能终端Agent、机器人等方向。

风险提示:AI技术迭代不及预期;算力紧缺的风险;宏观经济下行的风险。


作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
国光电器
S
声迅股份
S
中胤时尚
S
网达软件
工分
1.67
转发
收藏
投诉
复制链接
分享到微信
有用 1
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据