登录注册
盘点国内大模型现状
韭研工具人
航行五百年的公社达人
2023-12-23 18:28:27
12月23日,国内首个官方“大模型标准符合性评测”结果公布,该测试由工信部中国电子技术标准化研究院发起,据了解,首批仅360、百度、腾讯、阿里通过。

国内大模型发展,从2月开始,不过10个月,众多模型已经公测。


1.百度--文心一言

1)2023   31 日,文心一言率先向全社会全面开放。

2)底层 AI 芯片:昆仑芯片,前身为百度智能芯片及架构部门,  2021 年完成独立融资,目前有昆仑芯 1/2 两代量产产品。

3)深度学习框架:飞桨平台,集核心框架、 基础模型库、端到端开发套件于一体。飞桨平台开发者数已达 800 万、模型数超 80 万。

4)9  日,文心一言插件生态灵境矩阵开启内测邀请,首批已有近百家企业入驻,如携程、WPSAI 爱奇艺、汽车之家、猫眼电影、懂球帝等。 

5)文心一言 PC 端已正式开放 个插件,为说图解图(基于图片进行文字创作)、言易图(基于数据提供洞察及图表制作)、览卷文档(基于文档的摘要与问答)。


2. 科大讯飞--星火认知2.0

1)2023   15 日,科大讯飞发布星火认知大模型 2.0 版本。

2)大模型同步到多个产品和业务中,包括iFlycode 智能编程助手、讯飞星火语伴 2.0、星火教师助手等。

3)星火大模型 2.0 提升了代码编写过程中代码生成、代码补全、代码纠错和单元测试生成功能。

4)编程助手iFlyCode1.0 根据讯飞内部研发效能平台对 2000 余名员工在 个月内测试使用iFlyCode1.0 的成效数据统计,代码采纳率达 30%,编码效率提升 30%,综合效率提升15%


3.360--智脑大模型4.0

1)6月13日,360集团正式召开“360智脑大模型”应用发布会。

2)360 智脑是全国首个原生安全的大模型,官方声称其拥有自研千亿参数规模,核心能力位居国内第一梯队。该大模型预训练超万亿 tokens,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,能够覆盖大模型应用的所有场景。

3)基于 360 智脑的企业级垂直大模型,已在金融、医疗、教育等近 20 个行业陆续落地。

4)360 智脑为上网体验引入更强的智能助手,可一键对浏览网页进行总结摘要、翻译、改写,结合图形化效率工具。

5)大模型数字人结合 360 搜索多年积累的垂直知识库,可智能优化用户输入 prompt,识别用户意图,AI 问答生成结果更加专业、优质。


4.阿里--通义千问

1)2022  月,阿里发布最新通义大模型系列。

2)通用模型层包含通义-M6、通义-AliceMind 和通义- CV 三类模型,覆盖多模态、自然语言处理、计算机视觉,专业模型层深入电商、医疗、法律、金融、 娱乐等行业。 

3)阿里内部,阿里所有产品将接入通义千问大模型全面升级。目前, 钉钉、天猫精灵等产品已接入通义千问测试。

4)对于开发者和企业,通义提供多种模型接入和调入方式,基于灵骏平台,其支持各种模型一键部署云上服务,灵活 API 调用、支持模型微调和定制化。

5.腾讯--混元大模型

1)2023   15 日,腾讯混元大模型首批通过备案。

2)腾讯混元大模型是由腾讯全链路自研的实用级大模型,拥有超千亿参数规模、预训练语料超 万亿 tokens,已深度应用到多个业务场景中,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、 腾讯文档、微信搜一搜、QQ 浏览器等在内的超百个业务和产品,已经接入腾讯混元大模型测试。

3)混元大模型背靠腾讯,拥有众多潜在的应用场景,落地的场景越多,用户产生的商业价值、 数据也就越多,通用大模型的训练成本及推理成本随之降低,但模型能力却会更强,从而形成飞轮效应。


6.华为--盘古大模型

1)2023年7月7日,盘古大模型在华为开发者大会上发布。

2)盘古3.0为客户提供100亿参数、380亿参数、710亿参数和1000亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。

3)L0层:包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。

4)L1层:是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。

5)L2层:是为客户提供更多细化场景的模型,更加专注于某个具体的应用场景或特定业务,为客户提供“开箱即用”的模型服务。


7.字节跳动--豆包

1)2023   17 日,字节跳动公测基于云雀大模型开发的 AI 对话产品豆包,有网页端、iOS 和安卓客户端,预置了英语学习助手和写作助手两个功能。

2)云雀大模型的定位是一个自然语言内容生成和内容理解的 AI 大模型,该模型基于字节机器学习平台开 发,它可以通过自然语言处理技术与用户进行对话,回答用户的问题,提供相关的信息和建议。

3)字节研究团队还曾公布一个多模态大模型的学术研究项目BuboGPT,该模型能够处理包括文本、图像和音频在内的多模态输入,即不仅可以理解图像、音频和文本,并将这些理解与文本输入和输出相结合,还可以定位和描述图像中的物体以及声音的来源。 

4)应用场景更偏生活化,主要围绕情感陪伴、旅行规划、日常写作等,应用场 景少于文心一言、讯飞星火。

5)为生成的事实性内容提供索引,提高可信度.根据用户需求,若生成的内容对真实性要求较高,豆包会在生成结果末尾附带引用链接,以便用户确认信息真实性,如专业术语、现实世界的事件或地理位置等。

8.商汤--日日新大模型

1)2023   10 日,商汤发布“日日新大模型体系。

2)商汤举行技术交流日,发布日日新 SenseNova”大模型体系,展示了问答、代码生成、2D/3D 数字人生成、3D 场景/物体生成等 AI 模型应用能力。

3)在落地场景方面,商汤语言大模型在专业文本理解、代码生成和辅助初步医疗问诊领域展现出较强的能力,生成式 AI 在电商、广告、文旅 等领域潜力较大。

9.百川智能大模型

1)2023   日,百川智能正式发布微调后的 Baichuan2-7BBaichuan2-13BBaichuan2-13B-Chat 与其 4bit 量化版本,均为免费可商用的开源大模型。

2)目前在主流中英文通用榜单上,Baichuan2 性能领 先于 Meta   19 日发布的 Llama2,其在中文对话理解方面表现优异,且在开源商用上更加彻底。

3)国内首发开源模型,文本能力表现较好 今年 6-8 月内,百川相继发布了 个参数级别的通用大模型,其中 70 亿、130 亿参数模型开源可商用, 为国内首家开源模型

4)百川智能创始人兼CEO是王小川,曾任搜狗公司CEO。

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
科大讯飞
S
三六零
工分
10.55
转发
收藏
投诉
复制链接
分享到微信
有用 9
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(3)
只看楼主
热度排序
最新发布
最新互动
  • 谢谢你
    只买龙头
    只看TA
    2023-12-25 10:35
    好的老弟
    2
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-12-24 08:59
    趴菜
    1
    0
    打赏
    回复
    投诉
  • 1
前往