范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

回看自动驾驶十年,回答毫末智行DriveGPT是怎样炼成的?

  文|邻章
  "人们总是在短期高估一两年时间取得的成绩,而低估了五到十年能够取得的进展。"
  1997年,IMB的深蓝打败俄罗斯国际象棋大师卡斯帕罗夫。
  2016年,谷歌Deepmind的AlphaGo打败了人类围棋九段高手李世石。
  2023年初,ChatGPT彻底火爆全球,引发大众狂欢,比尔盖茨的这一判断被一再验证。
  大众的狂欢非常容易理解,因为AI的每一次出手都超过了大众心理预期。同时人们也很容易将人工智能捧上神坛,甚至很多乐观者认为"奇点"将至,悲观者又认为AI替代人类已近在咫尺。
  人工智能是一个长周期回报的技术。
  过去数十年间,AI技术经历了由专家系统、知识图谱到机器学习,再到深度学习,以及直到今天的大模型阶段。每一次技术跃迁的时间虽然在缩短,但仍然是一个需要前期积累、长期投入的过程。
  自动驾驶,这个被誉为人工智能王冠上的明珠,正是随着2012年深度学习技术的突破,才真正迎来产业化的可能。从过去十年进程来看,自动驾驶同样呈现出技术长周期的特征,并不会因为商业、资本、大众的期望而立即实现或者因为遭遇挫折而停滞不前。 一、你有你的计划,我有我的节奏
  经过十年技术的演进,自动驾驶迎来这样一个新阶段。
  首先是自动驾驶的算法训练正在从深度学习早期的CNN等神经网络模型转向以Attention注意力机制为特征的Transformer大模型的使用,自动驾驶在感知、认知乃至极端场景的仿真训练、大规模数据标注都有大模型参与其中。
  其次是围绕大模型训练的云端算力平台,以及与车端多模态、多数量、高质量传感器以及车端算法适配的高算力计算平台也已经纷纷落地,从理论上已经可以支持完全自动驾驶级别的算力要求。
  再次是乘用车辅助驾驶迎来爆发期,大规模多传感器、高算力车型的量产落地,使得"数据驱动"技术升级形成闭环,为自动驾驶算法和算力提供了源源不断的燃料。
  十年为期,这一数据闭环是如何发生的?
  这几乎是留给自动驾驶从业者的最后一道大题了。
  目前,行业里优秀的答案,就是特斯拉的Autopilot和FSD。
  尽管行业对特斯拉自动驾驶的故事已经非常熟悉,但这里仍然可以提纲挈领地总结几点成功经验。
  首先是Autopilot软硬件系统的快速迭代,确保了特斯拉车型实现规模量产的同时,其车端AP系统的数据积累能够保持同样的高速增长。
  而且从Autopilot2.0起,其感知系统就标配了8颗摄像头,确保了采集数据的一致性。为后面数据处理的成本打下基础。
  其次是特斯拉车端高端算力芯片的预埋和超算中心Dojo的建设。特斯拉不仅自研了FSD车端大算力芯片,而且实现了车端的预装,并通过软件售卖的模式来实现商业化。这一举措无形中确保车辆具备了实现高阶辅助驾驶的能力。
  同时,特斯拉在近两年加快了超算中心的建设,来进一步处理数十亿公里的辅助驾驶的行驶里程数据。这奠定了特斯拉自动驾驶技术的基础设施。
  第三就是特斯拉对以Transformer大模型为代表的最新AI技术在自动驾驶上的探索和应用。从连续两年的AI DAY看出,特斯拉找到了让视觉感知能力快速提升的方法,尤其是基于Transformer实现的BEV感知空间,如今已成为当前自动驾驶感知的主流。
  简单理解BEV的优势,就是基于BEV空间下的感知结果与决策规划所需的坐标系统是统一的,感知和下游的联系得到进一步增强。
  但很快,特斯拉从2D的BEV空间快速提升到带有时序特征的信息,使得FSD系统获得帧间连续的感知结果,从而获得了应对视野盲区和遮挡的能力。
  而到去年,特斯拉又带来了Occupancy Network,使得BEV感知又在高度方向进一步扩展,最终形成了带有4D(时序+3D栅格)结构的场景。通俗讲,这就几乎使得自动驾驶的感知系统实现向人类视觉一样的立体视野,可以更好地预测一般障碍物和运动障碍物的意图、速度等信息。
  总之,特斯拉的技术路线以及量产模式为全球自动驾驶行业打出一个"样板"。 二、特斯拉的模式是可以复制的吗?
  事实上,是可以的。
  如果盘点中国自动驾驶行业,我们可以发现一家非常典型的"特斯拉"路线的自动驾驶公司——毫末智行。
  今年初,毫末智行有两个动作,一个是发布了自动驾驶行业最大的智算中心,另一个则是发布了自动驾驶版的ChatGPT,毫末称之为"DriveGPT"。
  DriveGPT实际上是毫末在自动驾驶认知大模型上的成果,其核心是基于真实人驾数据,特别是将人驾接管数据引入大模型当中,持续优化自动驾驶的认知决策模型。
  为什么DriveGPT也能称之为"GPT"呢?
  首先,GPT是一个大规模的通用预训练大模型,而DriveGPT正是采用了与ChatGPT一样的具有Attention注意力机制的Transformer架构的大模型,其特点是随着模型参数规模、数据规模增加以及训练方法的提升,模型算法的效果也稳步提升,适应性更好。
  其次,DriveGPT与ChatGPT一样,都使用了通过人类反馈的强化学习算法RLHF,都会基于真实数据来训练奖励模型(reward model),最终得到最优结果。不同的是,ChatGPT使用的是人类的语言文本,而DriveGPT使用的是人驾数据。
  最后,DriveGPT也和ChatGPT一样,都属于生成式模型,都是基于历史序列预测未来序列,从而能够完成下一步的预测与规划的决策输出。
  据透露,毫末目前已经完成DriveGPT的模型搭建和第一阶段数据跑通,现在的参数规模可以对标GPT-2的水平。
  事实上,对于毫末智行这样一家自动驾驶初创公司,能够在ChatGPT这种超大模型应用推出之前,就已经开始对于大模型的应用,其技术布局和落地进度已经远超行业认知了。 三、毫末智行是如何将"DriveGPT"练成的?
  我们其实可以从刚刚对自动驾驶技术长周期的探索中找到回答这一问题的线索。
  第一,毫末用最快速度和最短时间实现了智能辅助驾驶产品的规模量产,同时打通了数据闭环。
  要知道,毫末智行仅仅是一家才成立三年多一点的科技公司。入局时间已经是自动驾驶行业跌宕起伏,行至中局的节点。好处是毫末可以避免前面自动驾驶公司踩过的坑,毫末坚定地选择了乘用车辅助驾驶赛道,走渐进式路线,依托长城量产优势,快速实现了L2辅助驾驶的规模落地。
  同样,劣势也摆在那里,就是留给毫末进行市场验证的机会没有太多。因此,毫末快速投入了产品的迭代,在21年初推出HPilot1.0之后,很快就推出2.0和3.0产品,并且在3.0产品上实现了类似特斯拉FSD的飞跃式的换代。
  依托1.0和2.0的量产,毫末已经积累了3300多万公里的辅助驾驶里程,并且从官方公布数据来看,已经取得中国各大县市的城区、城市快速路和高速的大规模、多样性的数据。这里应该就包括大量的感知数据和真实人驾数据。
  我们也知道,毫末一直以来对外技术布道的一点就是率先推出中国首个自动驾驶数据智能体系MANA。大力投入这一体系建设的目的就是加快数据的使用效率,降低数据使用成本,从而实现毫末所说的"数据驱动"。
  第二,毫末以非常前沿的技术视野,率先展开对新型的人工智能技术的研究,并且真正推动这些技术在自动驾驶算法上的落地。这一点几乎可以是与特斯拉同步的。
  从媒体总结的这张图来看,其实就能看到毫末与特斯拉在技术路线上的"异曲同工"。
  根据公开资料,毫末从2021年7月,就开始启动对Transformer的研究和落地尝试,成为中国第一家应用Transformer的自动驾驶公司。
  在22年9月的AIDAY上,毫末已经表示可以借助Transformer实时建模能力,对多模态融合感知数据进行数据前融合,搭建具有时序特征的立体场景,让自动驾驶系统具有强大实时感知能力,在城市环境中不依赖高精地图的情况下,实现应对道路模糊、复杂路口、环岛等道路感知挑战。
  到今年的1月份,毫末已经在自动驾驶各个领域,都在进行基于Transformer结构的大模型的搭建,而且一次发布了五个。
  其中,在数据处理上,基于视觉自监督大模型,可以实现对多模态感知数据的大规模自动标注;基于3D重建大模型,可以实现数据生成,通过仿真模拟极端场景,提升感知效果。
  在感知端,基于多模态互监督大模型,可以完成一般障碍物以及通用障碍物的识别,更好地提升感知能力;基于动态环境大模型,可以更精准预测道路拓扑关系,帮助车辆更稳定、合理地规划行驶路线。
  在认知端,毫末人驾自监督认知大模型,引入了基于数千万公里的真实驾驶行为数据做预训练,可以使得驾驶策略更加拟人化,同时引入了司机接管数据来不断修正驾驶策略,提升驾驶水平,不断接近优秀人驾水平。
  此次升级的DriveGPT正是这一人驾自监督认知大模型的落地应用,接下来DriveGPT会作为云端测评模型,用来评估车端小模型的驾驶决策效果。
  第三就是毫末对自动驾驶新阶段自动驾驶技术趋势以及新阶段基础设施的提前布局。
  实际上,毫末也在其AI DAY和行业大会上,多次表达了对自动驾驶技术演进趋势的看法。
  也就是现在自动驾驶行业正在从小规模数据、小模型的软件驱动的2.0时代向大规模数据、大参数模型为代表的数据驱动的3.0时代的跨越阶段。
  毫末实事求是地将自己定位为"3.0时代的冲刺者",意味着大模型的探索和布局只是一个开始。
  毫末CEO顾维灏曾在去年表示,当前,为应对3.0时代的挑战,整个自动驾驶行业要努力解决这三个问题:
  1、通过建设智算中心和优化训练效率,降低大模型的云端训练成本;
  2、通过改进车端芯片,定制Transformer专用加速芯片来提升计算效能;
  3、通过改进车端模型,通过轻量化模型来提升计算效率。
  这些问题会考验很多的从毫末最近公开演讲来看,毫末已经在提出自己的方案。
  为打造云端的低碳算力。毫末推出了自动驾驶的第一个智算中心,算力高达 67亿亿次/秒。通过一系列的训练框架、性能、通信等优化,可单机实现训练100亿参数规模的大模型的能力,同时执行多任务、多模态并行的训练,大幅提升计算效率。
  在车端,毫末在探索和关注更适合具有Attention特点的轻量化模型和Transformer加速芯片,减少车端模型的计算量、耗能,同时增加计算效率,从而实现大模型在车端的应用。
  总体看,毫末找到了自己通向自动驾驶终局的"通路"。通过量产辅助驾驶的规模量产,积累海量数据,回到云端大模型实现数据的处理和算法的训练,然后,再经过算法的优化和车端部署,实现更好的产品效果,完成数据闭环,形成毫末特色的技术路线。
  这是毫末坚定地冲刺自动驾驶3.0时代的勇气所在。 后记:旁观无解,唯有"过河"
  看到这里,我们其实对自动驾驶技术的演进逻辑,应该有了一个清晰的认识。
  技术的创新从来不会在一夜之间到来,不会像阿拉伯神灯那样许下心愿就可以实现;技术的突破也不会在遇到难关之后就止步,这又不符合人类认知的经验。
  人工智能技术本质是什么?它是一种对于人类智慧的模拟地计算,是通过人工系统的方式去模拟人类神经系统的神秘莫测的运作。
  自动驾驶本质又是什么?人类驾驶只不过是人脑当中一种非常基础的能力,人一旦学会操控驾驶系统,大脑就很容易进入一种《思考快与慢》当中的"系统1"的运作状态。
  如此类比,自动驾驶其实是人工智能较为初阶的应用场景,在今天仍然需要无数聪明的头脑殚精竭虑地去攻克一个又一个智能难题。
  而这个解谜的过程,其实别无他法,只能躬身入局。
  对于很多站在自动驾驶蓝海岸边的等待者和批评者,我们可以一起回忆下孩童时学过一个叫《小马过河》的寓言故事。
  对于自动驾驶,就像故事中的那条河流,它既不会深到难以逾越,也不会轻而易举就能渡过。
  它自有其生长的节奏。我们要亲自"过河"。

真人实测17款身体乳保湿肤感香味,到底哪几款更优秀?一弹,皮屑就从光腿神器里,嘣一下散出来了我,被朋友恶作剧了。上周出去玩,她弹我的光腿神器,结果,皮屑跟烟花一样绚烂!瞬间有种灰飞烟灭的感觉!冬天太干了,皮肤难免干燥粗糙,甚至一不小中国现代美妆开创者郑明明对自己保持极高的要求人们常说好形象是女性永久的时装。与其说岁月易老,不如说努力太少。中国现代美妆开创者郑明明出生于1946年,如今已经年过七十了,对于自己的仪容仪表非常严格,每天坚持保养坚持带妆上班,人好命,天注定?这三种人才是厚福之人,不信你看文飞鱼人们常常说,人的命,天注定。人生的一切,都是冥冥之中安排好的。得失都是命,生死都是命,成败都是命,聚散都是命。或许命运难违,但是人活一辈子,自己想过什么样的生活,想得到什么样想要忘记一个人怎么办我已然忘记我们是如何走到如今的地步,是我早就想放弃你了吧,才会让我们的关系变得逐渐疏远。果然就像那句歌词验证了我的处境No,nothinggoodstartsinagetawayc当一男一女经常联系图片来自网络,图文无关两个女性天天联系聊天不奇怪。两个男人频繁联系聊天也不奇怪。但是,若是一男一女之间,经常联系呢?偶尔联系的是普通朋友,频繁联系的是挚友。一男一女经常联系的话,感值得珍藏的24个人生道理,深刻,醒脑1hr有一句话,在网上流传很广,这句话是这样说的关心政治的人,值得深交。很多男网友都转发过这句话。为什么很多男网友都转发这句话呢?因为很多男网友把关心政治的人值得深交理解成我本人值低调的人会认清楚现实,他们会巧妙地保护好自己,不会冒进在一些环境之中发生了改变的时候,很多人想的做多的一个问题就是那我怎么办?我想要什么?我不你们掺和了等等。但是在一些低调的人面前,我们看到的确实他们毫不掩饰的冷静,他们会冷静的环视全早上好!一心一意的祝福送给你,愿你一生幸福健康平安走过的都是年月,路过的都是景色,年末了,让心清零,跟往昔说声再会,跟未来道声保重,信任明天会更好,加油!早安!没人在乎你的落魄低沉,更没人在乎你的孤单,但每个人都会仰视你的辉煌。塑承诺的故事小时候,贪玩好耍,不用心读书,次次低分,在母亲的棍棒下承诺上课认真听讲年轻时,精力不集中,答非所问,次次退回重做,对师傅承诺下次一定用心!中年时,脑壳转弯慢,始终落后于人,面对老板想要手机用上五年不换,建议一步到位,目前这三款手机可以满足每年都得重新挑手机是不是很厌烦,想要一款持久耐用,性价比超高的手机能用到天荒地老,建议来看看这三款手机,入股不亏。这几款旗舰手机,保证你爱不释手,还在为换机选机头疼的小伙伴不妨来看这6种菜,再贵也要给孩子吃,被称为身高加速器建议家长了解大家好,这里是小慧今天说美食,很多家长都知道,在孩子身高高发育期间,想要孩子长得快,得吃鱼肉蛋奶补充钙,但很多家长不知道的是,有些蔬菜里,也隐藏着很多的长高菜,有的钙含量比牛奶还要
民国三大女流氓,个个心狠手辣又貌美如花,最终结局如何?民国是军阀混战内乱不断的动荡时期,也是大师辈出群星闪耀的璀璨时代。这一时期涌现出一批叱咤风云的人物,像杜月笙黄金荣等。而民国也有三位奇女子,她们长得貌美如花,却个个心狠手辣,在十里欧洲神婆预言2023年的六大危机图片源于网络你可能没听说过巴巴万加,她是欧洲一名著名的预言家,被欧洲人誉为欧洲神婆。虽然两眼失明,但正如许多人声称的那样,她做出过很多非常准确的预言,俗称巴尔干半岛的诺查丹玛斯,传疯狂暴虐的北齐帝高洋在中国长达几千年的封建帝王史中,有政治清明,流传千古的明君,也有暴虐无常遗臭万年的暴君。譬如中国历史上最有名的暴君,发明炮烙之刑的商纣王,昏庸无比,最后落得个人心尽失的下场。在中国蒙恬之死,是罪有应得?蒙恬到底犯了什么错熟知秦汉历史的人都知道,蒙恬蒙毅两兄弟乃是秦朝的顶梁柱,为秦一统六国做出了卓越的贡献。蒙恬消灭齐国修筑长城北击匈奴,保护了秦国的北方疆域,是当世之名将,放眼中国历史也能享受到极高评海兰察,一位从小卒做到一等公的超级猛将海兰察,多拉尔氏,鄂温克族,隶属于满洲镶黄旗,乾隆二十年时第一次以索伦族马甲(清朝八旗制的兵丁)的身份从征准噶尔部,并生擒辉特部台吉巴雅尔,战后因功擢升为二等侍卫(正四品),赐号额宋代皇位立嫡立长?太子的隐喻究竟是什么?宋代是从五代走出来的。然而走出五代,并不意味着就是对五代一切的自觉扬弃。宋代政治局面的开创,不仅与宋朝开国之后的一系列整治措施有关,也与它所承受的五代时期的政治积累直接相关。宋代的越南古代史胡朝黎朝前期与占婆的军事冲突一胡朝黎朝前期与占婆的军事冲突公元1402年,胡汉苍举兵征占,占主巴的吏惧,遣舅布田进白黑象二,及诸方物,仍献占洞之地,请退师。布田至,季犛胁使改表,并以古垒洞纳之。胡季犛分其地为长平之战中,白起下令坑杀赵军,事实的真相究竟是怎样的?文视界说Talk编辑视界说Talk前言长平之战,是战国时期秦国与赵国发生的战略决战。这场战役是春秋战国时期的一次持续时间最久死伤规模最大处置战俘最惨烈的战争。战国时期秦相邦蔡泽有言宋朝农民起义非常频繁,为何却没因此覆灭呢?中国历史和西方历史都有很多王朝,但是中国历史上却有一项非常特殊的情形,那就是很多王朝的更替农民起义都起到了重大的作用,很多王朝的覆灭都与大规模的农民起义有关。不过也有比较特殊的王朝最短寿命的5个国家纵观人类历史,分隔我们各国的土地边界是具有流动性的,随着时间的推移而变化。截至2017年,有近200个国家存在。但还有更多的没有幸存下来。由于多种原因,它们从地球上消失了。但是从政曾窥上方制,遗范典刑具探析秦汉的刑讯制度引言自古以来有为的统治者总以维护社会稳定为己任,然而要想社会稳定就必须规范社会秩序,完善司法制度的相关内容。此时刑讯制度就显得尤为重要,它是司法制度的重要内容,一直受到国家统治者的