21世纪经济报道记者 郑植文 上海报道
千呼万唤始出来。经过近一年的等待,北美时间9月30日,在特斯拉2022 AI Day上,马斯克终于揭下Tesla Bot的真实面纱。
在演示视频中,这款被命名为Optimus(下称“擎天柱”)的人形机器人可以直立行走、给植物浇水、移动金属棒。据马斯克透露“擎天柱”已经在特斯拉工厂中进行内部测试,人们有望在3-5年买到“擎天柱”,而其售价预计不到2万美元,“可能比汽车还便宜”。
这场 AI Day活动围绕人形机器人、FSD技术和Dojo超算系统三个关键词展开,马斯克表示,“从本质上来说,特斯拉是一家硬核科技公司,我们在努力做很多科学和工程相关的工作。希望大家对特斯拉的认识,能够超过电动汽车本身”。
“擎天柱”面世
特斯拉人形机器人对比图
去年AI Day上,特斯拉Tesla Bot人形机器人概念视频与图片首次亮相。尽管此次面世的“擎天柱”在观感上与概念图还有一定的差距,但特斯拉团队表示“擎天柱”在运动中有着非常好的功能,十分敏捷,甚至可以跳舞。这也是因为“擎天柱”拥有好几个自由度,可以提供更高的使用灵活性,比如拥有手指运动的能力,目前在手指上可以实现两个自由度,因此这款即将投入生产使用的机器人已经在特斯拉工厂投入测试,从事一些重复性的工作。
据介绍,特斯拉的FSD技术(“Full Self Driving”,即完全自动驾驶)直接被应用在“擎天柱”身上作为其大脑,简单来说它采用了与汽车一样的视觉感知,“它可以非常清晰地识别周围的物体。我们收集了非常多的数据,通过数据来训练机器人,我们对于汽车的训练是类似的。”但机器人的需求和形式也有别于汽车,比如需要支持通信,所以“擎天柱”有很多无线连接和音频支持,同时它的硬件也一定要非常安全能够保护机器人本身和周围的人,所以需要考虑四肢方面的内容。
“汽车是有轮子的机器人,而机器人是装上脚的汽车”,因为组件的相似性,机器人和汽车在设计上也具有相似性,可以进行技术的迁移。而在马斯克看来,和设计汽车的原则类似,以非常高的可靠性和非常低的成本来大批量生产机器人也非常重要。他对此表示信心十足,“我们觉得产量应该可以达到数百万台,并且它的价格比汽车便宜得多,按照我的猜测,一台机器人的最终价格不到2万美元。”
对此,有专家在媒体采访时表示,国内有企业研发的双足行走人形机器人成本价约在50万元,这一价格属于手工组装的价格,未来如果大规模生产,价格降至30万元左右是有可能的,但要达到15万元,成本压力还是很大。
但背靠着特斯拉工厂的规模化生产和同根同源的核心技术,马斯克对于特斯拉人形机器人的预估售价或许是有底气的。“擎天柱”头部配备与特斯拉汽车相同的摄像头等传感器阵列,算力支持由FSD芯片提供,同时与汽车共用AI系统,利用Dojo超级计算机的训练机制去提升机器人的功能。马斯克及其团队多次表示,特斯拉的技术进步不仅可以使用到汽车上,也可以使用到“擎天柱”上。
马斯克认为,尽管自动驾驶汽车为世界带来非常深刻的变化,在交通行业可谓是革命性的,运输生产效率至少可以提高一个数量级甚至更多,但机器人对于社会来说意义更大。“使用机器人可以实现更低的劳动力成本,让经济得以更好地发展。未来机器人可以无处不在,人们可以选择体力活,但这是一种选择而不是必须做的,大家都可以去做脑力工作。”
但马斯克也坦言,目前的机器人还不是非常完善,当前推出的是“擎天柱”第一个版本,接下来还要解决很多技术问题并不断进行迭代,要让机器人非常灵活、高效且安全。“但现在我们必须要先做一些技术选择,以便尽快量产出有用的机器人。”
同根同源的FSD技术和Dojo超算系统
特斯拉的机器人和汽车都离不开FSD技术,据特斯拉官方数据显示,目前Tesla FSD Beta拥有16万名用户,而在2021年只有2000名。“我们持续一年训练了75000个神经网络模型,基本上是每8分钟就训练了一个模型,我们发布了其中281个模型,它们也的确提升了汽车的性能。此外这些性能上的创新是全栈式的,所以目前 FSD Beta测试版可以实现一定程度上的自动驾驶,比如可以从一个停车场导航到另一个停车场,可以停下来等红绿灯,还可以在十字路口和其他目标进行一些协调,这些都得益于神经网络上的进步,才能实现FSD测试用户数量的大幅增长。”
马斯克表示,从技术角度来说,当前FSD Beta可以适应不同的路况,不管是在哪一国家或地区,“不过我们希望在不同的天气条件下来进一步去验证,比如大雨和大雪天气,同时我们也在考虑更多的场景,并对相关指标进行优化,确保汽车能够完全自动驾驶。”
他称,FSD Beta今年年底有望在全球推出,但面临不同国家的监管审批也具有非常大的挑战。“在美国和加拿大以外的国家和地区,我们需要和监管方保持更为密切的沟通,以获得这方面的批准。但有些国家和地区在此方面的监管其实是非常滞后的。”
据悉,此前特斯拉的自动驾驶团队依靠人工数据注释来识别和描述特斯拉汽车上的摄像头和传感器所拍摄的短视频片段中的物体。这些标记的片段用于训练特斯拉的神经网络,并改进驾驶辅助系统,使特斯拉汽车能够在驾驶者的监督下绕行,自动避开障碍。
而在本届 AI Day活动上,特斯拉方面称目前已经形成了非常复杂的自动标注系统,通过人机合作的方式,大量的数据输入汽车进行分析后形成训练数据,提供正确标注之后再让模型进行训练,而在过去一年的时间里,训练基础设施也扩展了40%-50%,才能对大规模的神经网络进行训练。
此外,面对复杂的路况,人类可以顺势做出关联判断,但是对于汽车和机器人来说这样的判断较有难度。汽车面对多智能体应该如何规划协调,也需要持续优化,特斯拉团队称,在此情况下的计算量十分庞大,随着情况愈加复杂,计算量更是指数级的增加,而对于汽车的规划器来说,需要非常快做出决定。
“随着互动关系的增加,计算量就会越来越大。所以我们要考虑的不仅仅是尺度问题,我们最终要建立的是一个轻量级的可变网络,可以进行循环地运行,这个过程中我们还需要再进行训练,现在我们每个操作的运行时间已经缩短到了100微秒,这是一个莫大的进步。”
为保证人工智能训练效率,同时扩展带宽、减少延迟、节省成本,特斯拉发展自研了Dojo超级计算机系统,特斯拉方面称,特斯拉的车队在日常行驶中积累了很多视频片段,每个视频有多帧图像,需要14亿帧才能训练一个神经网络,需要使用10万个GPU工时。而Dojo超算,能够提升30%的网络训练速度。
据介绍,只用4个Dojo机柜就能取代由4000个GPU组成的72个GPU机架。Dojo能将通常需要几个月的工作减少到了1周。“我们计划在2023年第一季度推出Dojo机柜,我想Dojo的算力是非常高的”,马斯克表示。
而在这场十分硬核的AI Day活动中,特斯拉方面频频发出招募人才的信号,马斯克也直言不讳,“举办这样的活动的目的就是为了展示特斯拉的技术以此吸引全球人才的加入。”而对于产品实际落地与上市,这一次马斯克的承诺能如期完成吗?
更多内容请下载21财经APP
本文来源:本站原创 作者:佚名