【海通计算机】商汤大模型超预期
商汤推出日日新大模型sensenova,包括1800亿中文语言大模型、文生图、数字 人、场景生成,以及模型研发和感知模型标注服务。计算量基础优势的绝对优势,2.7w张gpu,5000+P算力,可支持20个千亿参数超大模型同时训练。
大语言模型—商量sensechat:1800亿参数,问答、理解,多轮对话,支持超长文本理解,中英文编程,在问诊等垂类表现突出;code能力40%humaneval测试集通过率,高于Copilot。知识更新,中文文本理解和逻辑推演能力突出。
多模态文生图大模型:文生图效果超过midjourney,现场生成6张图片速度仅需约2s,可以通过简单拖拽模式,导入图片进行lora训练(现场导入港星图片训练港风图片生成),3分钟内完成训练,效果提升显著。
数字 人、场景生成&琼宇、格物平台:商汤数字 人协调、交互、生动性突出;场景生成可实时编辑,应用场景包括城市、影视创作、文旅和电商。大模型已覆盖核心公司业务,已在20+场景落地交付大模型。日日新大模型开放三大API,图片生成、自然语言生成、视觉通用感知和服务。