美国当地时间9月30日,特斯拉于加州帕罗奥图举办2022 AI Day活动。特斯拉CEO埃隆·马斯克与特斯拉工程师团队现身会场,带来了Tesla Bot人形机器人“Optimus”原型机的全球首秀,率先进入科技“次世代”。马斯克还表达了对AI、机器人领域高端人才的欢迎,称:“我们希望通过展示新技术吸引全球人才加入,共同努力把人工智能做得更好,为全人类做出贡献。”
此外,特斯拉还公布了FSD(完全自动驾驶能力)和Dojo超级计算机的最新进展。目前,特斯拉已在超过16万辆车上进行了FSD Beta版系统测试,仅一年内就训练了7.5万个神经网络模型。
Optimus机器人原型机首秀,马斯克:最快3年量产
“今天是我们第一次将Tesla Bot展现给世人,准备好了吗?”在马斯克的话音中,Optimus原型机重磅登场,转身、停止、挥手问候等流畅动作引起观众欢呼。
这是Optimus第一次在无人操作的情况下自主行走,特斯拉没有为它安装外壳,而是直接将内部构造呈现出来,关节、骨骼、电缆等设备清晰可见,直观展示每个动作细节。特斯拉还在视频中展现了现实中Optimus的使用场景。办公室内,它灵活地提起水壶浇花、双手搬运物料至目标位置、准确定位周围人员并主动避让。据媒体报道,特斯拉弗里蒙特工厂中Optimus已经开始投入简单工作,并为其规划了相应行动路线。
马斯克表示:“我们的产量应该可以达到数百万台,预计它的价格比汽车便宜得多,预估机器人最终价格将达到2万美元以下。”他还预测,3-5年间Optimus即可量产上市。
“推不倒”的“擎天柱”:更高的自由度与更灵活的风险应对
去年AI Day后,短短6个月时间Tesla Bot就从一个概念迅速走向现实。今年活动现场上,特斯拉多位工程师讲解了Optimus机器人的设计原理与研发故事。
特斯拉在机器人的内部结构设计上,基于对人体特征的洞察,深度思考各执行器与电力系统布局。机器人躯干处搭载了2.3 kWh、52V电池包,高度集成了充电管理、传感器和冷却系统。“这意味着从传感到融合、再到充电管理,都汇集到这一系统内,这也是借鉴了我们在汽车设计方面的经验。”特斯拉工程师表示。
Optimus身体共有28个自由度,采用了更加灵活的弹簧负载设计与6种类型执行器,关节采用仿生学关节设计,模拟人类关节与肌腱形态,手部则采用人体工程学设计,拥有11个自由度。而在“感官”上,在经过完全自动驾驶能力系统的实际应用验证后,特斯拉强大的计算机视觉已可直接应用于机器人。
目前,Optimus已经可以完成行走、上楼梯、下蹲、拿取物体等动作,灵活的双手得益于合理的手指关节设置,柔韧性和强度表现俱佳,执行器既能够承受约半吨重的钢琴这样的重物,也可以完成轻薄物体抓取、操作机械装置、复杂手势等高精度动作。
行走,对于人类来说可能是再简单不过的日常动作,但机器人要实现稳定行走则充满巨大挑战。首先特斯拉需要让机器人具备物理层面的自我认知,保障运动能效、保持平衡以及迅速应对环境中的风险,同时也要兼顾四肢长度、重量等方面。“我们一直在从生物学中汲取更多灵感,”特斯拉工程师表示,“而在运动、规划和控制性上,我们在汽车领域已经积累了充分经验,在机器人上得以活用。”
同时,特斯拉还基于汽车安全模拟分析能力打造机器人安全性。在交通事故模拟中,特斯拉通过软件优化和改进车辆溃缩、电池保护等提升安全表现,而在机器人设计上,特斯拉也以同样的方式保障Optimus保护自身和周围人安全的能力。如在跌倒、碰撞等外部状况下,机器人将采取和人类一致的决策——最大程度优先保障“大脑”安全,其次是躯干电池组的安全,这两部分的重要性也不言而喻。
目前,Optimus不仅可以平稳行走,也能在少量外部干扰的情况下依旧保持平衡。现场视频中,特斯拉还展示了Optimus被工作人员用木棍戳刺上半身,但并未摔倒或长时间摇晃,仅稍微前倾后便稳住姿态,出色地应对了挑战。
应用FSD训练经验,高效构建机器人“大脑”
“机器人需要有‘大脑’,也就是人工智能。”马斯克说。在设计、训练与制造Optimus的过程中,特斯拉大量应用了人工智能技术,并在现场介绍了Optimus的中央计算机。
Optimus搭载与特斯拉车辆相同的FSD电脑以及Autopilot相关神经网络技术,自动驾驶技术上的研究成果也帮助特斯拉在人形机器人领域打下了坚实基础。“其实特斯拉车辆已经安装了FSD电脑,我们希望可以将自动驾驶经验与人形平台相结合,”特斯拉工程师表示,“但机器人的实际需求和形式都与汽车存在差异,所以我们还需要适当调整。”
特斯拉希望机器人的“大脑”要尽可能做到人类大脑所能实现的一切,比如处理视觉数据、基于多个传感器输入做出行动决策、支持通信交流等。Optimus采用了与Tesla车辆相同的芯片,支持Wi-Fi、LTE链接和音频交流,系统软硬件的安全性保障也再度提升。
同时,Optimus也通过动作捕捉“学习”人类。以搬运物品为例,特斯拉工作人员通过穿戴式设备输入动作,机器人通过神经网络学习,从在同一地点完成相同的动作,到进化推演出在其他场景下的方案,从而学会在不同环境中搬运不同的物品。
机器人将颠覆世界,推动社会与经济发展
从2021年8月概念初次发布,到2022年4月第一次“蹒跚学步”,再到如今的原型机重磅亮相,Optimus的到来将会是一座全新科技里程碑,为社会与经济发展带来重大积极意义。
“谈到机器人就会想到经济发展。经济的根本要素是劳动力,如果我们可以使用机器人来实现更低的劳动力成本,终将带来更快速的经济发展。”马斯克表示,将来在机器人的参与下,人们可以自由选择工作,其中简单的重复性工作可交由机器人完成,这类工作对于人类而言将成为一种选择,而不是必须。
马斯克认为,解决机器人核心的智能和执行器相关问题后,还可进一步“锦上添花”。将来Optimus在不断进化后,既能非常“有效”地完成任务,也可以成为我们的伙伴。人们可以带它出去吃喝玩乐、为它穿上各色服装、选择多种相处方式让它形成独特的性格。“我相信在每个人的创意下,将创造出缤彩纷呈的Optimus。”马斯克说。
FSD、Dojo超级计算机公布最新进展,训练效率千倍提升
不仅率先跨入了人形机器人领域,特斯拉在智能汽车领域也仍然快步前行。过去一年,在Dojo超级计算机的帮助下,特斯拉FSD取得了长足提升。
一年中,特斯拉FSD Beta测试版本的参与人数实现了80倍的增长。“2021年,有2000辆车参与了FSD Beta版本软件的测试,而目前我们已经把这个数据扩大到了16万辆。”特斯拉工程师介绍,2021年,特斯拉一共训练了7.5万个神经网络模型,相当于每8分钟就训练一个,并推送了35个版本更新。现在FSD Beta版本软件已经可以一定程度上实现完全自动驾驶,如从一个停车场导航到另一个停车场、制动等待交通灯、在十字路口和其他目标进行协调等。
而这些都得益于特斯拉应用Dojo超级计算机以来在神经网络训练上的进步。特斯拉从一开始就意识到高效率的芯片可以更好地为自动驾驶服务,特斯拉工程师表示,算力是自动驾驶的根本:“我们要让Dojo超级计算机成为在AI训练方面全球最强的超算系统。”
特斯拉不对Dojo的设计设限,它可以提供非常庞大且高效的系统。Dojo超级计算机投入使用后,特斯拉在代码、设计方面已经实现了30%的训练速度提升,如通过自动标注技术,特斯拉将训练场景的标注速度提升了1000倍,在人工操作的情况下这些或许需要一两周甚至几个月时间。
在超高算力加持下,Dojo运行“Stable Diffusion”完成如下几张图片的渲染只用了几分钟。接下来,特斯拉还将把强大渲染能力与特斯拉设计相匹配。
而只使用一个由25个D1芯片组成的训练模块,就能实现6个GPU Boxes的性能,且成本低于一个GPU Box。
只需要4个Dojo超级计算机机柜的算力,就能实现72个GPU机柜的自动标注性能。
在高效的神经网络训练下,特斯拉FSD软件在技术层面已经逐渐趋于成熟。马斯克表示:“目前FSD软件已经可以适用于全球各个地区的路况,如果地方监管政策允许,我们可以在今年年底面向全球推出FSD Beta版本软件。”
作为一家硬核的科技公司,特斯拉将以超级计算机Dojo引领行业发展。特斯拉表示将在2023年第一季度布置第一批10个Dojo超级计算机机柜,即算力超过1.1EFLOPS的ExaPOD,将自动标注能力提升2.5倍;将来,特斯拉共将在帕罗奥图布置7个这样的集群,提供难以想象的庞大算力。
马斯克称,此次AI Day活动目的是吸纳AI和机器人领域的工程人才,内容相当“硬核”。小到机器人的关节设计、人工智能的工作逻辑与训练细节,大到特斯拉的规划、机器人与智能汽车的前景都为公众一一呈现。
“我们希望不仅仅有好的想法,还要有好的结果,”马斯克说,“希望大家对特斯拉的认识跳出电动汽车的范围,我们在AI方面已经成为先行者,软硬件层面都进行了大量探索。我们也在构建更强的系统、全球最强的计算机结构。如果大家有兴趣可以加入我们,贡献自己的聪明才智,一起影响世界。”