【小熊团队】继续多模态+机器人
9月25日openai又在chatgpt终端增加了 看听说三维一体的功能!
ChatGPT 中推出新的语音和图像功能。它们提供了一种新的、更直观的界面,允许客户进行语音对话或向 ChatGPT 显示您正在谈论的内容。
通过拍照、圈出问题集,并让它分享提示来帮助孩子解决数学问题。
进展:接下来的两周内向 Plus 和 Enterprise 用户推出 ChatGPT 中的语音和图像。语音将在 iOS 和 Android 上提供(在您的设置中选择加入),并且图像将在所有平台上提供。
[玫瑰]
点评:1)一款典型的多模态混合模型,我上上周就说过,四季度就是拼命推多模态模型时间,11.6日开发者大会openai 开放视觉api接口!抢在google Gemini之前!
2)chatgpt 网页端,移动端日活,用户时长会更明显增加,无论是多模态分享日常,还是辅导还在 作业需求。
3)Openai 多模态模型用的MoE架构,同等参数情况下,为保证输出体验,算力需求增加50%。
4)多模态会强力支持机器人,8月deepmind 团队推出RT2 模型,将动作解析成模型可以理解的向量语言,进步飞快,多模态模型进一步促进发展!
5) 利好各种多模态 图片类 语音类 +文本应用!
越接近12月底,越是多模态+机器人!
利好个股:
算力:租赁,云赛智联 中贝通信 恒为科技 鸿博股份,恒润股份 ,九联科技,神州数码等,包含英伟达链条,升腾链条!
多模态:金山办公(打开它app,里面图片 视频处理功能齐全);
美图公司,对标美ai app上升最快的应用facetune ,图片处理国内no1
其它 万兴科技,虹软科技,大华股份,航天宏图等。
图片识别教育培训需求预计大幅上涨,科大讯飞 佳发教育。
机器人:宝信软件(深度报告,工业机器人),萤石网络(有深度报告,家用儿童陪伴机器人)