登录注册
大模型高速迭代,多模态时代到来
剩者为王
超短低吸
2023-03-11 18:40:29
事件
ChatGPT关注度持续,海外和国内迎来技术的快速迭代推进。其中,谷歌3 6 日发布跨模态模型PaLM-E,而百度和微软也各自计划在未来一周召开发布会,GPT-4 也将在下周发布。

这些消息引起了业内外的广泛关注,表明人工智能技术和应用正在高速发展,不断突破技术天花板。

评论
谷歌发布 5620 亿数的跨模态超大模型,并搭载于机器人以执行复杂任务。谷歌于 3 6 日发布了视觉语言大模型PaLM-E,参数量达到 5620亿,是已知的最大的VLM(视觉语言模型),相比国内的图文多模态模型主要用于图文生成和检索,该模型具备多模态推理和分析能力,并集成了可控制机器人的视觉和语言能力,能在日常生活中完成人类给出的指令;

百度将在 3 16 日发布“文心一言”,将能够提供多模态生成能力。百度2 28 日晚在其官方微信发布消息,计划于 3 16 14 时在北京总部召开主题为“文心一言”的新闻发布会。百度创始人、董事长兼首席执行官李彦宏和百度首席技术官王海峰将出席发布会;

微软整合ChatGPT技术和应用开发平台,并在 3 16 日召开发布会。软于 3 6 日宣布将ChatGPT技术与其低代码应用平台Power Platform合,可以在很少编码的情况下开发应用。微软同样将于 3 16 日举办一场名为“与AI一起工作的未来(The Future of Work with AI)”的在线活动讨论“用人工智能重塑生产力”,并展示其在人工智能领域的最新成果,例ChatGPTTeamsWordOutlookOffice生产力套件中的应用;

Visual ChatGPT和待发布的GPT-4 将加入视觉功能,拓展多模态应用。微软在 3 8 日发布并开源了Visual ChatGPT,该模型包含不同的视觉基础模型,用户可以通过图像与ChatGPT进行交互,并提出复杂的视觉问题
或编辑指令。微软德国CTO Andreas Braun也在 3 9 日的名为“AI inFocus-Digital Kickoff”的活动中表示GPT-4 将在下周发布,该模型提供多模态功能,其中包括视频方向应用。

我们认为,以ChatGPT为代表的大模型技术突破和应用落地,关键在于弱人工智能向强人工智能的更近一步,有望打开中长期场景想象空间。在大模型路径下,多模态模型在海外已经推出,我们认为国内互联网公司和AI龙头也具备布局跨模态模型的技术基础,为生态打磨做好铺垫未来将会有更多智能化的应用和产品出现,人工智能也将进入新的阶段。

风险:技术进展不及预期,行业竞争加剧,商业化落地节奏不及预期。 
作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
海天瑞声
S
汤姆猫
S
万兴科技
S
当虹科技
工分
6.76
转发
收藏
投诉
复制链接
分享到微信
有用 6
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(3)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2023-03-11 21:28
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-03-11 20:52
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-03-11 20:15
    多模态潜力牛墒基科技
    0
    0
    打赏
    回复
    投诉
  • 1
前往