登录注册
某智能驾驶企业算法专家交流 -自动驾驶算法系列专家会议
金融民工1990
长线持有
2023-09-23 12:12:04

1.特斯拉自动驾驶算法方案

(1)优势

特斯拉在纯视觉自动驾驶解决方案方面的优势在于:

 

通过多次迭代,在2018年到2019年主要进行图像检测,2020年引入transport架构,实现了时空域上的融合。

 

特斯拉的自动驾驶方案基于占有网络的架构,并能进行时空融合。

 

该方案传感器要求较低,算法的可调节性强,并支持增加硬件。

 

(2)难点

特斯拉自动驾驶算法方案面临的难点包括:

 

对算法的要求较高,需要持续迭代。

 

存在解决长尾效应的难点。

 

2.特斯拉落地中国的障碍与解决方案

特斯拉落地中国面临的障碍主要是数据安全问题,解决方案如下:

 

特斯拉在中国建立数据中心,并接受中国监管,不通过远程获取数据。

 

在中国建立研发团队,包括数据超算中心和相关人才。

 

3.特斯拉在中国算法部署问题

目前特斯拉和中国工信部还在就算法部署问题进行沟通,具体结论尚不明确。根据传闻,可能在第二季度进行部署。虽然将北美算法落地到中国可能会面临问题,但先部署再解决问题可能会对中国自动驾驶领域产生推动作用。

 

4.特斯拉的自动标注工具和4D数据自动标注过程

特斯拉使用自动标注工具和4D数据自动标注过程进行自动驾驶算法训练,具体过程如下:

 

采集多个视角的视频数据,并进行联合优化,生成完整的三维数据地图。

 

这些数据地图用于训练车辆模型。

 

5.国内公司自动驾驶方案与特斯拉方案的差异

国内公司的自动驾驶方案相比特斯拉侧重于业务表现,较少注重技术积累。虽然国内公司主要依赖高精地图,但与特斯拉的纯视觉方案在效果上差距不大。不过,国内公司在交付业务和路径依赖方面仍存在问题,因此尚未完全转向特斯拉的方案。

 

6.新势力和华为企业的自动驾驶方案

新势力和华为等企业在自动驾驶方案方面表现出色。华为的技术实力和整个工具链更有优势,算力和整个数据闭环能力对于自动驾驶行业非常重要。华为未来有良好发展前景。大江在走农村包围城市的道路,寻求低成本车型的合作。对于大疆的发展也持乐观态度。关于传统主机厂如长城、长安和吉利等自建自动驾驶团队的情况不清楚。

 

Q&A

Q:特斯拉无图方案已经迭代多次,其他公司都在学习特斯拉的bv方案的改良版,但落地效果不如高精地图。华为、小鹏、理想等公司的无图方案有何不同?谁更加优秀?

 

A:在目前这个时间点很难评价谁更优秀,但从未来的预期来看,个人认为华为的自动驾驶方案会更好走一些。华为在算力和工具链方面的能力较强,而自动驾驶行业在算法方面是需要整个数据闭环能力的。此外,华为在未来还会走端到端的算法路线。另外,魏小李公司采取了低端车型去走量的策略,现在已经与上汽通用五菱合作,思考深入市场需求、成本区间和实际车型使用场景等方面的能力较强。所以,对于未来几年的发展,这两家公司的发展前景会不错。而像小鹏等公司,在财务状况更好的情况下,才能支撑自动驾驶解决方案的研发,并将其迭代到整车研发中。目前来看,传统主机厂如长城、长安、吉利等也在推进自动驾驶团队的建设,但具体进展和情况则没有详述。

 

Q:长安汽车在自动驾驶的技术方面做得不错吗?另外,长城汽车的自动驾驶方案有哪些问题?

 

A:长安汽车在自动驾驶方面的技术深度较高,在车企中算是做得很好的。而长城汽车的自动驾驶方案存在一些问题。首先,长城过分依赖拐杖(指高精地图),导致感知能力没有达到像特斯拉那样的水平。其次,长城的方案在使用拐杖方面过度,导致在产品效果上无法与其他竞争对手相抗衡。因此,长城的自动驾驶项目一直处于频繁迭代和修补的状态。

 

Q:吉利汽车在自动驾驶领域有哪些发展方向?与摩拜的合作有什么优势?

 

A:吉利汽车目前有两条发展线路。一方面与摩拜合作,在中国推广未来自动驾驶落地的相关工作,双方的优势都能得到有效利用。另一方面,吉利自研的自动驾驶部门主要使用了华为的高精地图方案,虽然目前的方案还没有完全成熟,但短期内与其他企业的合作还是会取得不错的效果。

 

Q:比亚迪在自动驾驶技术方面进展如何?是否学习特斯拉的方案?

 

A:目前对于比亚迪的自动驾驶部门了解有限,但我知道他们已经意识到了自动驾驶的重要性,并开始投入相关的研发工作。他们的目标是学习特斯拉的方案。不过,最近他们的进展并不算快,基础设施等方面还没有完全搭建起来。因此,我对比亚迪的细节了解有限。

 

Q:无论是特斯拉还是华为的车,在驶入一个没有构筑过空间地图的地方时,如何进行处理?

 

A:对于这个问题,可以用图像检测作为一个简单的例子来理解。图像检测中,通过训练一个神经网络模型,将输入的图片与标注结果进行比对,最终达到识别图片中物体的能力。类似地,自动驾驶的感知部分也是通过训练一个整体的模型来进行感知。通过大量的视频数据和4D空间数据训练感知模型,使其具备感知能力。当车辆进入一个未知路段时,感知模型会将8个摄像头的输入转化为整个4D空间的输出,从而具备检测能力。因此,在车端进行感知和决策规划时,都是通过训练模型来实现的。

 

Q:决策的过程中如何保持数据的一致性?

 

A:在自动驾驶解决方案中,决策规划是基于获取到的世界信息进行的。早期的解决方案是通过粗优化和精优化来进行决策规划。随后,又转向了角色规划,即蒙特卡罗素搜索的逻辑。在最新的方案中,决策规划变成了一个整体的神经网络,依赖于参数和感知方案。将角色规划转变为整个神经网络,网络中的参数可以识别当前场景,确定未来几秒的行驶方式。然而,目前感知和决策规划还没有完全整合成一个神经网络,整个流程中,控制的代码也需要加入,以形成一个完整的神经网络。因此,目前的规划控制仍然是独立的,但未来的方向是通过一个神经网络将感知、规划与控制整合,实现数据闭环的基础。

 

Q:数据处理和模型规模的增加会带来什么问题?

 

A:一旦模型规模变大,数据处理量也会增加,需要消耗大量的算力。为了让模型具备良好的泛化能力,处理大量数据是必要的。因此,特斯拉等公司就需要进行海量数据的处理和优化,以使模型能够更好地适应各种复杂的情况。

 

Q:未来在自动驾驶算法领域中,车辆的芯片和硬件与软件算法之间的关联有多大?

 

A:大量的算力在云端进行训练,并处理出来的模型用作工具来制造车辆端的模型。软硬件之间需要高度适配和耦合,因为部署在车辆上的模型需要考虑参数量的降低和工程化的过程,以降低部署难度和减少不重要的部分。所以软硬件的关联对于自动驾驶算法的部署是很重要的。

 

Q:车辆的芯片和硬件选择对于支架方案和软件算法有什么影响?

 

A:在前期的研发中,硬件和传感器的选型是很重要的,因为硬件需要和软件一起研发以应对研发过程中的问题。特斯拉可以选择其他公司的芯片作为车辆端的芯片,但需要早期介入。此外,车辆端的硬件需要适配支架方案和软件解决方案,而华为的支架和芯片是一个整体解决方案,车企只需要选定硬件即可,无需其他适配工作。所以对于车辆的芯片和硬件选择会对支架方案和软件算法的部署产生影响。

 

Q:车企在选择支架方案时是如何做出决策的?

 

A:具体的选择过程属于公司上层的商业问题,个人可能不太了解。但可以从个人角度提供一些见解。对于华为来说,可能不愿意提供硬件并适配其他公司的车辆,因为这样的工作量大且成长性差。对于车企来说,选择支架方案可能会考虑未来供应风险,不同的公司可能有不同的考虑因素。

 

Q:选芯片公司合作时,应该考虑哪些长期性因素?

 

A:在选择芯片公司合作时,应考虑长期性因素,并涉及到产品类型和所需芯片的匹配程度。比如,做功能较简单的无城市自动驾驶,可以选择一些性能较好的芯片如黑芝麻、地平线等,这些芯片具备支持车企研发的售后服务能力。而英伟达则属于更稳定的一种选择,具有较好的产能和品牌效应。这些因素都是值得考虑的。

 

Q:未来随着大型模拟环境训练的发展,行业水平是否会趋于一致?

 

A:数据在解决长尾效应方面起到了重要作用,但数据并不能解决算法的基础部分,也就是基线。而基线方案依赖于算力,在解决方案的开发中需要更多的算例和工程经验。所以整个行业的平均水平并不只是依赖于数据的规模,而是需要有创新性和工程经验的支撑。因此,行业的差距依然存在。

 

Q:占用网络算法在自动驾驶中的作用是什么?

 

A:占用网络算法在车端的应用中,是为了让模型具备对三维世界的感知能力,需要大量的3D视频数据和标注。在这个过程中,标注的质量是最重要的,主要取决于自动标注模型的好坏。而这个标注质量又关系到车辆在空间中的准确位置、速度和加速度等物理量的标注。如果没有处理好这些标注,将会影响数据的质量和训练模型的效果。因此,在自动驾驶中,占用网络算法对于3D空间的标注十分关键。

 

Q:对于同一个场景,如何通过不同车辆的提取信息来建立准确的4D场景模型?

 

A:对于同一个场景,通过不同车辆的数据提取信息,并将其转化为三维的场景模型,可以通过重复提高数据的精度和准确度来建立准确的4D场景模型。比如,在一个路口有多个车辆经过的数据中,可以通过建立稳定的三维空间模型,并将其作为参照,在标注新来的数据时,可以根据参照的模型判断物体在空间中的位置,从而实现对物理量的准确标注。这样的逻辑可以帮助建立精确的4D场景模型。

 

Q:通过后验数据不断补充整体模型的过程类似于贝叶斯吗?

 

A:是的,通过不断通过后验数据来补充整体模型的过程确实类似于贝叶斯估计的思想,通过不断的观测和更新数据,可以不断提高模型的准确性和精度。这种基于后验数据进行模型补充的方法是一种有效的方法。

 

Q:"请问您是如何将图像信息和激光雷达信息进行融合的?"

 

A:"感知所有的相机会先提取特征,然后将每个相机的特征与其他传感器的数据进行融合,例如激光雷达的数据。经过特征提取后,多个相机的数据规模降低,然后通过一个核心的时空联合网络进行融合。这个网络负责将各个相机的特征拼凑成一个相对完整的三维世界。同时,激光雷达的数据也可以作为输入,辅助各个相机的特征收敛。"

 

Q:"通过激光雷达的辅助,您是借助其距离信息来构建更好的三维地图吗?"

 

A:"是的,通过激光雷达扫描的点云数据,可以将其投影到二维坐标系中的每个像素点上,从而辅助纯视觉深度估计。通过第一个transformer网络,可以将纯视觉多个帧的结果收敛到激光雷达提供的信息,使得工作开展得更加顺利。"

 

Q:"相当于通过激光雷达的辅助,您可以构建另外一套更好的三维占用网络是吗?"

 

A:"是的,您理解得非常准确。通过激光雷达的数据,可以构建一套更好的三维占用网络,从而达到更好的路径规划和环境感知的效果。


作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
德赛西威
S
中科创达
工分
5.72
转发
收藏
投诉
复制链接
分享到微信
有用 2
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据