登录注册
久其软件——谷歌合作+女娲多模态平台
凌晨十二点
春风吹又生的韭菜种子
2023-12-08 09:15:42

谷歌深夜放复仇杀器Gemini,最强原生多模态史诗级碾压GPT-4!语言理解首超人类

谷歌的复仇大杀器Gemini,深夜忽然上线!

被ChatGPT压着打了整整一年,谷歌选择在12月的这一天,展开最强反击战。

多模态Gemini,迄今规模最大、能力最强的谷歌大模型,在文本、视频、语音等多个领域超越了GPT-4,是真正的一雪前耻。

人类有五种感官,我们所建造的世界、所消费的媒体,都是以这样的方式所呈现。

而Gemini的出现,就是迈向真正通用的AI模型的第一步!
Gemini的诞生,代表着AI模型的巨大飞跃,谷歌所有的产品,都将随之改头换面。
塞进多模态模型的搜索引擎、广告产品、Chrome浏览器……这,就是谷歌给我们的未来。

多模态的史诗级创新


以前,多模态大模型就是将纯文本、纯视觉和纯音频模型拼接在一起,就像OpenAI的GPT-4、DALL·E和Whisper那样。然而,这并不是最优解。
相比之下,在设计之初,多模态就是Gemini计划的一部分。
从一开始,Gemini就在不同模态上进行了训练。随后,研究人员又用额外的多模态数据进行了微调,进一步提升了模型的有效性。最终,实现了「无缝」地理解和推理各种模态的输入内容。
从结果上来看,Gemini的性能要远远优于现有的多模态模型,而且它的功能几乎在每个领域都是SOTA级别的。

而这个最大、最有能力的模型,也意味着Gemini可以用和人类一样的方式理解我们周围的世界,并且吸收任何类型的输入和输出——无论是文字,还是代码、音频、图像、视频。
Google DeepMind首席执行官兼联合创始人Demis Hassabis表示,谷歌一直对非常通用的系统感兴趣。
而这里最关键的,就是如何混合所有这些模式,如何从任意数量的输入和感官中收集尽可能多的数据,然后给出同样多样化的响应。
DeepMind和谷歌大脑合并后,果然拿出了真东西。
之所以命名为Gemini,就是因为谷歌两大AI实验室的合体,另外也一个解释是参考了美国宇航局的Gemini项目,后者为阿波罗登月计划铺平了道路。

首次超越人类,大幅碾压GPT-4

虽然没有正式公布,但根据内部消息,Gemini有万亿参数,训练所用的算力甚至达到GPT-4的五倍。
既然是被拿来硬刚GPT-4的模型,Gemini当然少不了经历最严格的测试。
谷歌在多种任务上评估了两种模型的性能,惊喜地发现:从自然图像、音频、视频理解到数学推理,Gemini Ultra在32个常用的学术基准的30个上,已经超越GPT-4!
而在MMLU(大规模多任务语言理解)测试中,Gemini Ultra以90.0%的高分,首次超过了人类专家。

 

久其软件——子公司亿起联加强了业务线的布局,目前亿起联主营业务包含国内移动平台业务,海外移动平台业务及游戏发行业务。其中,海外业务发展迅速,已成为Google,Facebook及Twitter国内重要的合作伙伴,同时,充分发挥协同效应,除为游戏,电商等行业客户提供一站式出海营销方案之外,开始着手为政府客户,如各省市旅游局提供出海宣传推广方案。随着亿起联业务线的逐步完善,目前月平均流水约5000万元,较上年大幅增长。

 

从此处可以看到谷歌为第二大合作伙伴

 

久其女娲平台嵌入的AI技术涉及计算机视觉(人脸识别、对象识别)、语音识别、文本挖掘与自然语言处理、数据挖掘(传统机器学习)等领域,充分利用AI技术对公司产品功能进行改造和赋能,节省人工成本、控制业务风险、提升用户操作体验。

 

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
久其软件
工分
1.59
转发
收藏
投诉
复制链接
分享到微信
有用 4
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(3)
只看楼主
热度排序
最新发布
最新互动
  • 问初心
    互相伤害的老韭菜
    只看TA
    2023-12-08 21:41
    0
    0
    打赏
    回复
    投诉
  • 加油奥利给
    下海干活的韭菜种子
    只看TA
    2023-12-08 11:01
    0
    0
    打赏
    回复
    投诉
  • 瞧一瞧看亿看
    躺平的小韭菜
    只看TA
    2023-12-08 10:43
    很硬 
    0
    0
    打赏
    回复
    投诉
  • 1
前往