登录注册
宣亚国际:谷歌多模态--用“AI”理解视频
我爱掘金
2023-12-07 13:11:26
宣亚国际:公司控股子公司云目未来科技(北京)有限公司(以下简称“云目未来”)是一家依托深度学习与计算机视觉技术,AI理解”视频内容的科技公司。云目未来以海量图像训练的深度学习算法模型为基础,以AI视频技术为核心,推动政企提升在视频内容领域智能处理的效率,帮助政企克服未来海量数据对工作的挑战。性能超GPT-4!谷歌放出最强悍大模型Gemini

北京时间127日凌晨,谷歌CEO桑达尔・皮查伊和Deepmind CEO戴密斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。

Gemini 1.0
是谷歌筹备了一年之久的GPT4真正竞品,也是目前谷歌能拿出手的功能最为强悍、适配最为灵活的大模型,包括三种不同套件,分别是Gemini Ultra, Gemini ProGemini Nano。其中Ultra的能力最强,复杂度最高,能够处理最为困难的多模态任务;Pro能力稍弱,是一个可扩展至多任务的模型;Nano则是一款可以在手机端侧运行的模型。这说明,Gemini的触达范围很广,可以下探至数据中心,也可以上行至移动设备端侧。

谷歌的Bard聊天机器人,此番也已经升级到了Gemini,可以说Gemini的初始版本已于今日开始在Bard中提供。从5月的I/O大会之后,谷歌就将自己此前最强的人工智能模型PaLm 2融入了Gemini的能力之中。

在一段公布的演示视频中,桑达尔・皮查伊展示了Gemini对视频、图像的非同凡响的识别能力。在视频中,Gemini极为自如地在图像、音频、视频各模态之间的转换,展现了惊人的解锁应用场景与产品形态的潜力。

GPT4转向多模态,图像、视频等应用将层出不穷涌现。其使用场景将远远不仅限于文字、问答与办公,打开有望未来AI在下游千行百业的应用空间,进一步打开市场想象力。
作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者不持有相关标的。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
宣亚国际
S
网达软件
工分
2.42
转发
收藏
投诉
复制链接
分享到微信
有用 4
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(5)
只看楼主
热度排序
最新发布
最新互动
  • 小财圆滚滚
    春风吹又生的散户
    只看TA
    2023-12-07 14:31
    已上车 感谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-12-07 13:42
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-12-07 13:31
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 1
前往