登录注册
深度起底鹅厂混元助手(HunYuan Aide)项目组
观风听雨
全梭哈的半棵韭菜
2023-02-28 23:42:44
若要用一个词来形容2023年2月的国内大厂,那就是“不甘落后”。和2月公布“文心一言”的百度相比,腾讯相对低调,但也备受万众瞩目的压力。

腾讯针对类ChatGPT对话式产品已成立「混元助手(HunyuanAide)」项目组,该项目组Owner为张正友,PM分别为俞栋、王迪、刘田,目前该项目有至少7位组长、7位Sponsor。上述几乎每一位在腾讯都是重量级人物

该项目组将联合腾讯内部多方团队构建大参数语言模型,目标是“通过性能稳定的强化学习算法训练,完善腾讯智能助手工具,打造腾讯智能大助手,并能成为国内的业界标杆”。腾讯的底气之一,是手中“多样、高质的真实数据”


17级大牛带队,3位PM顶梁,

跨事业群精英集结


「混元助手(HunyuanAide)」项目组的一号位张正友,是腾讯史上最高专业职级拥有者。早年他曾就职于微软研究院,带领视觉团队从事大量学术研究,在Windows、Office、Xbox、Kinect、Skype for Business、Office Lens等诸多微软产品里都有其团队的贡献。张正友于2018年加入腾讯,带领创建了腾讯机器人实验室Robotics X,致力推进人机协作的下一代机器人研究。2021年1月8日,腾讯宣布张正友成为腾讯首位17级研究员/杰出科学家


“正友是位随和的大牛,”与其短暂共事过的人告诉职场Bonus,“但他擅长的方向偏计算机视觉、立体视觉、3D重建,而类ChatGPT工具要突破的技术领域应该在NLP自然语言处理。虽然都是人机协作的必备课题,但两类领域略有区别。”据此预测,该“智能大助手”产品未来极有可能出现类“DALL·E [1] ”等结合图像、视觉能力的功能和应用场景


学术背景方面,张正友于1985年本科毕业于浙江大学信息与电子工程系,1987年在南锡第一大学(现洛林大学)获计算机科学硕士学位,1990 年获巴黎第十一大学计算机科学博士学位。在国际顶尖会议和杂志上,张正友发表论文250余篇,论文引用次数51000多次,有超200项专利。其于1999年论文提出的摄像机标定法“张氏标定法”在全世界被普遍采用,获2013 IEEE Helmholtz时间考验奖。



3位PM的能力画像,分别侧重于算法、工程和商业化。职场Bonus获悉,3人当中,余栋或会主要负责强化学习和多轮对话,王迪主要负责大模型、预训练。


俞栋是将深度学习成功应用在语音识别领域的开创者之一,他提出的理论与模型已经广泛用于业界的语音识别和处理系统中。其主要研究的领域包括自动语音识别、语音处理和自然语言处理等,发明了100多项专利,曾获得IEEE、NAACL的多个论文奖项,谷歌学术引用量5余万次。


王迪作为2008年7月校招即加入腾讯的15年老员工,经历过重组、换团队的动荡。我们在其2016年为数不多的一次采访中得知,当时他与团队正在给公司内部其他BG的业务产品提供“搜索引擎检索系统”相关模块的开发。目前,王迪已是腾讯TEG-AI平台部的助理总经理。

 

 从组长的构成来看,「混元助手」项目的确做到了凝聚腾讯内部多个团队的能力。


其中Ying Shan(Dr. Shan)是腾讯PCG-ARC Lab(应用研究中心实验室)的杰出科学家和主任,在在线广告、计算机视觉、深度学习、文本挖掘和大数据分析领域拥有近22年的经验。和张正友一样,在加入腾讯之前他也在微软研究院(微软是AI华人黄埔军校实锤),并在Bing Ads担任首席科学家经理(Manager role),在ICCV、CVPR、ECCV、SIGGRAPH、KDD、PAMI、IJCV等顶级会议和期刊发表论文30余篇,拥有30项美国/国际专利。 


项目的赞助支持人员更是堪称腾讯豪华阵容。值得注意的是,除了能看到TEG、PCG、CSIG力量的参与,微信和互娱的也出现在名单人员的业务覆盖面内。

 

 低调布局争取来的“下注”时间


整份名单透露出的气息,可以用两个词来形容:押宝。


我们能在贯穿腾讯2022年的“降本增效”主题中找到鲜明的对比:上文提到的PCG(平台与内容事业群)、CSIG(云与智慧产业事业群)均在去年经历了公司范围内最大力度的裁员;AI Lab所挂靠的TEG(技术工程事业群)也曾被部分内部员工吐槽“穷”,被认为科研自由度不如百度。据晚点LatePost,去年腾讯除了砍掉十余款长期亏损的低战略价值产品、批评整治内部贪腐、调整多部门业务策略与考核重点,还通过转型深度自研来加速技术降本。


「混元助手」并不是混元AI大模型的第一次亮相。2022年6月,腾讯多模态AI大模型先被应用在了广告投放这一toB业务领域进行“降本增效”:先以腾讯混元AI大模型助力系统理解广告内容,其次以精排大模型提升广告和用户的匹配准确率,模型训练用的是腾讯机器学习平台太极。相比以前的小模型算法,腾讯广告精排大模型当时累计给广告主带来15%的GMV提升。


虽然对大模型早有布局,但如今,腾讯之所以能短时间内如此果断地往“大模型”上加注押宝,多是由于ChatGPT在用户增长和商业上摧枯拉朽的表现。用过的人或许知道,ChatGPT的交互界面极为简单,产品形态也相当原始。但上线5天后,ChatGPT注册用户便超过100万,2个多月后月活破亿,迅速超过了TikTok用9个月破亿的历史纪录。


在「混元助手」之前,腾讯最接近ChatGPT的项目或是智能创作助手文涌(Effidit)。「文涌」出自腾讯 AI Lab,部分功能的实现使用「混元」系列 AI 大模型作为底层预训练模型,具有智能纠错、文本补全、文本润色等功能。


“混元大模型本就是国内自然语言类中的最强者。”内部知情人士对腾讯混元助手项目的未来信心满满。去年4月29日,腾讯混元AI大模型在CLUE(中文语言理解评测集合)分类榜中取得第一并刷新该榜单历史纪录,分数突破80.888分,有相关分析文章认为,该模型在自然语言处理上的实力接近人类语言理解能力。


但模型本身还并不是唯一的挑战。上周36氪在有关字节跳动大模型上的独家报道中提到,英伟达A100显卡在国内停止供应后,训练大模型所需的高性能GPU成了不少公司稀缺的重要资源,但字节并不缺GPU。


“腾讯也不缺。”有自称目击者告诉职场Bonus,2月内的不久前,才看见某人工智能计算公司中国区负责人出现在滨海与刘炽平会面商谈。另有知情人士透露,腾讯在接下来2个月内将新增数千张基于新架构的加速计算卡储备。“我们很清楚友商们的储备情况,在国内能做到这一点的可能只有腾讯和阿里。”



作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者持有相关标的,下一个交易日内可能择机卖出。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
岭南股份
S
腾讯控股
S
海天瑞声
S
拓尔思
S
中科曙光
工分
11.41
转发
收藏
投诉
复制链接
分享到微信
有用 9
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(6)
只看楼主
热度排序
最新发布
最新互动
  • 小调C
    自学成才的老韭菜
    只看TA
    2023-03-22 15:14
    腾讯都没有出这方面的最新新闻吗
    0
    0
    打赏
    回复
    投诉
    于2023-03-22 16:48:06更新
    查看1条回复
  • 只看TA
    2023-03-06 07:58
    谢谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-03-01 17:46
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 老汉憨憨
    绝不追高的随手单受害者
    只看TA
    2023-03-01 08:59
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-03-01 07:32
    谢谢分享
    0
    0
    打赏
    回复
    投诉
  • 1
前往