登录注册
中信建投:传媒行业简评-GPT-4发布 图片/视频应用-游戏和虚拟人有望加速融合
侃侃同学
全梭哈的散户
2023-03-17 12:26:03
 核心观点:GPT-4在理解能力、图片和文本的综合理解、定制个性等方面具有显著提升。对于应用领域而言,我们已经可以看到多模态模型帮助应用同时实现增收、降本增效的可能性。我们此前将现在类比为移动互联网爆发前夕,预计GPT-4将加速这一进程。其中我们认为“多模态+图片/视频应用” 是应用发展的基座,“+游戏”将从改善需求看实现增收,同时为大型游戏减少研发费用,为中小型游戏减少营销费用,“+虚拟人”将解决行业发展受限于套皮等“伪需求” 问题。
  事件:OpenAI在3月15日正式发布GPT-4。据OpenAI,GPT-4是多模态模型,可以理解文字和图片,并反馈文字,其理解能力较GPT-3和ChatGPT更强。目前GPT-4的文字输入和反馈功能已经在ChatGPT更新,并开放了API接口,而图片输入功能将会和BeMy Eyes合作。据Be My Eyes官网,Virtual Volunteer功能将会结合GPT-4,iOS和安卓应用已开放该功能的预约。
  简评:据OpenAI官网,相较ChatGPT和GPT-3,GPT-4主要在一下6个方面有较大改进:1)GPT-4的理解能力有重大优化,我们预计将显著改善办公等生产力场景的用户体验。据OpenAI官网,在模拟AP、SAT、GRE和美国法考等大部分考试中,带视觉能力的GPT-4可以获得更好的成绩。26门模拟考试中,GPT-4在17门获得了更好的成绩,特别是在微积分、化学和物理等理科领域有近40%,甚至更高的排名提升。据The Verge报道,此前ChatGPT在数学推算过程中时常会出现错误。而从此次OpenAI展示的结果看,数学逻辑的推理能力已明显提升。此外排名提升最大的是美国司法考试,GPT-3.5排名仅列后10%,而GPT-4.0可以达到前10%的排名。
  2)多模态模型可以综合理解文本和图片,从而优化反馈,我们预计更有助提升教育领域的用户体验。GPT-4的多模态模型可以提取图片和文字中的标签,以统一的数据进行处理,并给予文字反馈。因此在OpenAI的测试中,GPT-4可以理解搞笑图片中iPhone的数据线不合常理得大的梗。我们认为图片和文本的综合理解能力可以优化交互场景体验。比如在教育场景中,从此前单纯的文字/语言互动,发展成结合视觉和语言的理解,给予更好的反馈,预计丰富教育形式,从而提升教育质量。
  3)GPT-4在非英语场景下表现得更好。OpenAI使用Azure Translate将57门学科的14,000道选择题翻译成了26种语言,并给予GPT-4测试。结果显示,GPT-4在其中24种语言的正确率高于GPT-3.5、Chinchilla、谷歌的PaLM等LLM的英文测试表现,包括拉脱维亚语、威尔士语、斯瓦西里语等预料资源稀缺的小语种。从另一层面可见GPT-4对于语言的理解能力也要由于其他LLM。
  4)GPT-4的“可操纵性”(Steerability)将赋予AI不同的个性,预计将进一步推动虚拟人成为“人”的可能。相比ChatGPT固定的语言风格,GPT-4将允许接入API的用户定制AI的“性格”。我们预计将进一步优化虚拟人的反馈机制,类似于国内AI对话应用Glo可以让用户与“钢铁侠” Tony Stark等不同背景、场景的虚拟人对话,将相关技术带入虚拟人场景中,是虚拟人成为真正的“人”。
  因此,我们认为ChatGPT使虚拟人摆脱动捕仅,获得AI反馈机制,成为“人” 是第一步,而GPT-4解锁了虚拟人发展的第二部,使其成为个性迥异的“人”。这有助于解决虚拟人发展受限于套皮、性格等造成与虚拟人对话、互动是“伪需求”的问题。
  5)在体验方面,GPT-4在安全、道德、法律等方面的防范意识更好。OpenAI的研发人员基于在开放后,用户不断提出的有害信息、诱导性问题,对模型进行了优化,因此现在GPT-4在安全、道德、法律等方面的防范意识更强。
  6)GPT-4允许用户输入更长的内容。相较GPT-3.5和ChatGPT约4,096 tokens/约8,000单词的限制,GPT-4允许用户最多输入32,768 tokens/64,000单词,是过去的8倍。因此,GPT-4可以更持续性地与用户进行更多轮的对话,而不会很快“忘记”之前的对话内容。
  风险分析:生成式AI技术发展不及预期、各领域技术融合进度不及预期的风险、算力支持程度不及预期、数据质量及数量支持程度不及预期、用户需求不及预期、技术垄断风险、原始训练数据存在偏见风险、算法偏见与歧视风险、算法透明度风险、增加监管难度风险、政策监管风险、商业化能力不及预期、相关法律法规完善不及预期、版权归属风险、深度造假风险、人权道德风险、影响互联网内容生态健康安全风险、企业风险识别与治理能力不足风险、用户审美取向发生变化的风险。
作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
视觉中国
工分
1.09
转发
收藏
投诉
复制链接
分享到微信
有用 0
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据