登录注册
多模态模型概念梳理
韭研工具人
航行五百年的公社达人
2023-12-08 09:47:12
苏州科达:公司深入研发基于深度学习的AI技术,紧跟人工智能技术前沿趋势,于2023年7月正式推出了KD-GPT大模型,包括多模态大模型、AIGC图像大模型和行业大模型已经初具雏形,并开始在实际项目中投入应用。

网达软件:根据参股公司官网:上海蛙色网络科技有限公司产品可以实现AI抠图生成嵌入视频/图文,位置匹配系统可实现多模态动态交互,打造科技创意效果。

声讯股份:公司在多源多模态算法和模型上有长期的积累,在沉淀多年的行业大数据基础上,经过长期训练形成了安防、安检领域的行业化智能应用。

大华股份:公司发布了多模态融合的行业视觉大模型一一大华星汉大模型,通过融合图像、点云、文本、语音等多模态数据,大幅提升了视觉解析能力。

恒生电子:LightGPT是恒生自主研发的金融行业专属大模型,拥有更专业的金融语料积累处理和更高效稳定的大模型训练方式,使用了2000亿中文tokens语种强化数据作为二次预训练语料,并支持超过80+金融专属任务指令微调,在包括金融语义识别、金融专业问答、逻辑推理、超长文本处理能力、多模态交互能力、代码能力等在内的金融大模型能力评测中处于业内领先水平。

科大讯飞:公司发布“讯飞星火认知大模型 V2.0”,围绕本次重大版本升级对应的代码能力和多模态能力重大突破。

新大陆:公司和中科院自化所早在2022年年底就开始了关于紫东太初多模态大模型的合作,新大陆是紫东太初创始合作伙伴之一。

三六零:根据2023年半年报显示,360智脑4.0已经拥有了包括生成与创作、阅读理解、多轮对话、逻辑与推理代码能力、知识问答、多语种互译、多模态、文本改写、文本分类等十大核心功能。

中科创达:公司的人工智能技术.形成了包括视觉分析,AI图像生成,AI语音识别和降噪,多模态模型等多项先进的人工智能技术,并有多项业务落地。公司在上述方面已形成了相关收入。

昆仑万维:公司旗下的天工大模型保持高频迭代并取得重要突破,“天工”的逻辑推理能力、文本理解能力、多模态能力在多个全球知名测评集中表现突出。

捷成股份:公司研发的AIGC一键成片系统,基于多模态大模型能力,支持自动成片、长视频缩编等多和应用场景,可预设多种模版,有效提升视频生成效率。同时,该工具具备人工千预窗口,让作者可以对结果进行干预,一方面可以让结果更符合作者期望,另一方可以对模型进行持续训练与优化。

汤姆猫:公司国内研发团队与西湖心辰合作的多模态 AI 汤姆猫产品已初步实现拍照识物、英文口语启蒙、兴趣引导、科普教育、Al 生图、AI 生成绘本、情境对话等多个功能,近期公司协同西湖心辰团队在多模态、降低推理成本、对话时长等方向取得较大进展。

数字政通:“人和”行业大模型可帮助公司的政务客户提升城市管理和运行的效率,实现对城市治理、公共安全等关键基础设施进行精准的监测和管理,通过利用语音、视觉等多模态自动检测、语义分析能力,精准感知城市发生的各类事件,并快速、准确地进行根因分析,实现城市全域事件快速发现和高效处置。

风语筑:公司在数字人驱动、文生文、场景积极引入AIGC技术和产品,在文生视频、图生视频、视频转视频等生成式3D内容场景公司积极探索,公司目前已申请PIKA 1.0版本内部测试。

亿嘉和:公司发布的种基于多模态超融合技术的大模型YJH-LM,目前已在公司商用清洁机器人上完成功能测试。

易点天下:第一时间接入了GPT-4等领先大模型,形成了符合自身业务场景模型率先在行业内实现了包括营销数字人模型等业务场景模型,同时,搭建了基于AI大模型的整体产品技术框架并在此基础上构建了具备多模态能力的AI中台。

拓尔思:公司数字经济研究院及相关研发团队已经完成康养大模型第一版本的训练.加入了情感支持、主动问答以及多模态的能力,正在与虚拟人进行整合。

佳都科技:在上海人工智能实验室发布的多模态大模型榜单 MMBench 中,来自佳都科技中央研究院的TransCore-M超过LLaVA、mPLUG-Owl2Qwen-VL-Chat 等 20 余个来自世界一流大学和业界大厂的多模态大模型,分别在 4 个榜单中都高居第。目前,TransCore-M 的模型和推理 demo 已在huggingface 开源,并开放体验。

中文在线:发布“中文逍遥大模型。基于创作者的想法灵感,“中文逍遥”大模型大幅提升创作者的效率,可实现一键生成万字,一张图写出一部小说,一次读懂100万字小说。其中一张图写出一部小说即可根据图片内容撰写优质小说,展现出多模态能力,同时还为创作者提供“插画师”、“体系设定”、“文学评论”、“通识问答”等功能服务。

当虹科技:公司视觉多模态分析技术基于自主研发视觉多模态分析技术,对多媒体进行视频、语音、文本、图像等内容的多维分析,针对视频中出现的内容进行多模态融合的智能理解分析并进行结构化标签提取,包含视频中出现的人物、车、物体、地标建筑、文字等内容的识别。

因赛集团:公司基于各类第三方大型模型和自研营销领域专用的AIGC多模态模型,实现文本、图片、视频等多种形式的智能化内容生成,并应用于智能策划、文案撰写、平面设计、视频制作等具体的业务场景。

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
苏州科达
S
网达软件
S
因赛集团
工分
4.04
转发
收藏
投诉
复制链接
分享到微信
有用 6
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(1)
只看楼主
热度排序
最新发布
最新互动
  • 扫地僧
    满仓搞
    只看TA
    2023-12-08 12:24
    新的题材概念题材:多模型AI
    0
    0
    打赏
    回复
    投诉
  • 1
前往