特斯拉FSD-12直播首秀！45分钟仅一次干预-视频“喂”出AI“代驾”

2023-08-28

正如之前承诺的一样，马斯克上周末用一辆搭载HW3的Model S，向外界直播展示了特斯拉FSD 12测试版。

在这场45分钟的直播中，坐在方向盘后、举着手机的马斯克仅干预了一次车辆行为，车辆在非预设道路上，便能自行礼让行人、避开路障、路口转向、在两条直行道中选择一条车少的。

马斯克表示，FSD 12可以在不熟悉的环境中离线使用；若有干预行为发生，系统会记录并发回特斯拉分析。

而在直播开始后约20分钟时，马斯克进行了全程唯一一次干预接管。当时，这辆Model S需要直行，因此停下等待红灯。但当左转信号灯转绿时，车辆竟然也紧跟启动，好在马斯克与一旁的工程师及时制止。

在这之后，马斯克表示，要给FSD“投喂”更多左转红绿灯的视频。

投喂视频就能“喂”出“AI代驾”？

实际上，在这场直播中，当车辆自行在减速带减速、避开滑板车骑行者时，马斯克多次强调，FSD 12中没有任何一行相应代码，人为设定车辆作出这些动作——其没有被训练过如何读取路标，也不知道什么是滑板车，FSD 12完成这些行为完全是大量视频训练的结果。通过视频训练数据，AI可以自己学习驾驶，“像人类一样做事”。

如果FSD在特定场景下没有作出正确决策，特斯拉便会向其神经网络训练投入更多数据（主要是视频）。

当然，平庸随意的数据是不够的，供给神经网络的数据需要精心挑选。马斯克也特别强调，来自优秀驾驶员的高质量数据，才是训练特斯拉自动驾驶的关键。

“大量平庸的数据并不能改善驾驶，数据管理相当困难。我们有很多软件，可以控制系统选择什么数据、训练什么数据。”

而对特斯拉而言，其数据的一大主要来源便是来自全球各地的车队。马斯克还透露，特斯拉在世界各地拥有多名FSD测试驾驶员，包括新西兰、泰国、挪威、日本等。

从2020年起，特斯拉便开始将Autopilot决策从编程逻辑转向神经网络与AI。经过3年的发展，从本次马斯克的FSD 12直播也能看到，几乎整个决策与场景处理已转移至特斯拉神经网络与AI上。

FSD 11独占控制堆栈中有超过30万行C++代码，而12中代码寥寥。之前马斯克也曾指出，车辆控制（vehicle control）是“特斯拉FSD AI拼图”上的最后一块拼图，其将使得这30万行以上的C++代码减少约2个数量级。

全AI端到端驾驶控制

特斯拉FSD 12是其最重要的一次升级，实现了全AI端到端的驾驶控制。

至于为何选择端到端方案？马斯克直播之前与WholeMars连线时，给出了更多细节。

“人类就是这么做的，”他表示，“光子输入，手脚动作（控制）输出。”——人类依靠眼睛和生物神经网络开车，对于自动驾驶而言，摄像头与神经网络AI便是正确的通用决策方案。

虽说AI神经网络难以解释具体细节，但相应地，人类乘客在打车时，也无法准确地知道司机在想什么，只能看到司机的评价。

券商指出，端到端方案与之前的关键区别之一就在于，传统的模块化架构是将智能驾驶拆分称单独任务，交由专门的AI模型或模块来处理，例如感知、预测、规划等；而端到端AI则是“感知决策一体化”，即将“感知”与“决策”融合到一个模型中。