华泰电子：DriveGPT大模型赋能场景生成、轨迹预测、推理决策-韭研公社

登录注册

华泰电子：DriveGPT大模型赋能场景生成、轨迹预测、推理决策

夜长梦山

2023-04-13 21:22:21

华泰电子：DriveGPT大模型赋能场景生成、轨迹预测、推理决策　　毫末智行发布了其DriveGPT自动驾驶生成式大模型，具体逻辑：(1)感知环境离散化后作为token设计drive language；(2)输入大量驾驶场景数据，利用transformer模型生成系列决策结果；(3)RLHF:将人工挑选困难场景Clips(数据组)输入训练模型，对生成结果进行最优解排序；(4)Reward Model强化学习。DriveGPT目前可以根据历史一段时间驾驶场景序列数据，不断生成未来可能发生的多种驾驶环境并预测每种情况下车辆行驶轨迹。此外公司目前正设计利用prompt提示优化输出结果，并给DriveGPT加入思考链，使驾驶策略具备逻辑可解释性，解决transformer黑盒模式潜在问题。　　机会：大模型有望解决行业数据标注准确率及成本困境　　视觉识别是开发大模型的基础能力之一，识别传感器输入图像中的车道线、车辆、行人、交通灯等要素并进行数据标注才能获得大量的可用训练数据集。我们看到DriveGPT等大模型可以很好地自动识别图像以替代人工标注，据毫末会上表示，DriveGPT可以将交通场景图像的标注费用从行业平均约5元/张降至约0.5元/张，计划逐步向合作伙伴开放该服务。同时，我们认为近期Meta的CV模型SAM有望赋能自动驾驶行业，SAM无需额外训练即可自动完成分割，提升机器视觉，有利于自动驾驶可用训练集快速积累。　　挑战：国内AI智能驾驶大模型应用普及仍面临数据需求和算力等挑战　　(1)数据：DriveGPT目前参数量约1200亿，拥有约4,000万公里的量产车驾驶数据。参考行业龙头特斯拉2020年已有超48亿公里数据，大模型赋能下我们认为国内公司或将加快智能驾驶系统量产上车步伐，加快数据搜集回馈模型训练。(2)算力：特斯拉FSD背后拥有1.4W个GPU训练集群；毫末建设MANA OASIS中心给DriveGPT提供67亿次/秒的高性能浮点运算，2T/秒存储带宽，以及800G/秒通信带宽支持；小鹏计算中心“扶摇”提供算力达600PFLOPS.大模型、大数据驱动的智能驾驶对算力提出了更高要求，有望驱动算力基础设施需求。建议关注L2级自动驾驶/算力产业链。

作者利益披露：转载，不作为证券推荐或投资建议，旨在提供更多信息，作者不保证其内容准确性。

声明：文章观点来自网友，仅为作者个人研究意见，不代表韭研公社观点及立场，站内所有文章均不构成投资建议，请投资者注意风险，独立审慎决策。

特斯拉

工分