具身智能
具身智能机器人则是具身智能的实体形态,它偏向于关注将智能与实际物理世界结合起来,使机器能够通过感知和运动与环境进行实时交互,从而更好地适应和解决复杂任务。要想实现具身智能,需要多个学科的交叉能力,包括:
1)机器人学,为具身智能提供机械身体与运动控制;
2)多模态:计算机视觉,为具身智能提供处理视觉信号能力;语音与自然语言处理,为具身智能提供理解与对话能力,实现与人类交互;3
)机器学习:神经网络,为具身智能提供推理能力;强化学习,从环境反馈中,帮助具身智能调优模型;
4)认识科学,帮助具身智能理解人类,构建认识与价值。
具身智能有三大模块,感知、想象、执行
上海交大卢策吾教授在机器之心科技年会演讲中提到具身智能的三个必须的模块是具身感知(Perception)、具身想象(Imagination)和具身执行(Execution)。
感知方面,具身智能需要知道这个世界各种概念与操作知识,包括外形、结构、语义、关节体类别等等。同时,通过视觉、触觉等与物体的交互感知,具身智能可以验证各种概念与知识。
想象方面,具身智能需要对感知到的物体进行仿真,能知道如何“操作”物体。操作方面,具身智能按照仿真情况,通过机器人去对物体进行实际的操作,根据实际情况反馈,让智能体学习,加强或者更新认知。这个过程与人类学习、实践的过程也十分类似。
建议关注产业链上的投资机会:
1)边缘 AI 部署和应用:科大讯飞(2035 超脑计划、机器人);中科创达(魔方 Rubik 大模型、TurboX 模组、智能硬件);
2)视频等多模态算法:虹软科技、海康威视、大华股份、当虹科技、商汤科技等;
3)机器视觉和传感器:奥比中光(3D 视觉)、奥普特、凌云光等
02
传媒板块逻辑