发布时间:2025-03-02 12:15
2005年是人形机械人成长史上的主要里程碑。这一年,康奈尔大学的Collins团队正在Science上颁发了关于被动动力学行走的开创性研究。同期,本田的ASIMO机械人正在活动速度上取得严沉冲破,实现了6-9公里/小时的行进速度。另一个主要进展是动力公司推出了液压驱动的四脚机械人BigDog,其正在冰面上展示出的极强的均衡能力和顺应性,带来的手艺冲击堪比1997年本田机械人发布时的影响,其主要性可取后来AlphaGo正在AI范畴的冲破相媲美,只是其时的范畴相对无限。
关于行业成长示状:目前,我国人形机械人财产已成长到50至100家企业的规模。正在学术界,声称处置人形机械人研究的高校传授已跨越30位。
赵明国:一是“虚拟斜坡行走”方式,连系了被动行走和节制理论的实践经验。这项手艺具有奇特征,其机能目标跨越了同类研究,并影响带动了后续浩繁相关研究。
本田从上世纪80年代起头研发机械人,至今已有 40 年汗青。1997 年发布的 P2 和 P3 机械人就实现了不变的行走功能,到 2005 年更是达到了小跑和单脚腾跃的程度。从焦点手艺目标来看,包罗行走速度、活动能力、跑跳等根本功能,以及产物全体设想,可以或许超越昔时本田手艺程度的企业仍然很少。
动力和本田的机械人正在能量效率上存正在挑和。康奈尔大学团队操纵被动动力学道理,提出了提拔能量效率的方式,并正在《Science》上颁发了。这一发觉促使业界关心手艺整合以提高效率和机能。同时,也激发了业界对被动行走手艺研究的普遍乐趣。
正在机械人设想中,我们能够自创这一,操纵被动道理来设想机械人的脚部外形和腿部沉心。对于机械人,我们能够严酷根据生物力学道理进行计较,以调整到最优成果,并据此调整手艺设置装备摆设。颠末必然的勤奋,包罗布局调整,我相信机械人的机能能够获得显著提拔。
图注:ETH 引入了一种,能够正在模仿中锻炼神经收集策略并将其迁徙到当前最先辈脚式机械人系统中的方式。
正在人形机械人研究的晚期阶段,本田的ASIMO是次要的参考对象。回首其时的环境,中国正在机械人手艺范畴全体处于起步阶段:工业机械人次要依赖进口,国内仅有少数院校进行过相关研究。机械人手艺的使用范畴无限,次要集中正在某些具体使用和算法研究上,取现今的手艺程度有较大差距。
将来体育将分为机械人体育和人类体育:机械人体育让人们抚玩,人类体育逃求极限和完满。机械正在速度上可能跨越人类,但正在双脚跑步上,目前的机械人还比不上人类。我们应测验考试制制高速双脚机械人,这是手艺摸索的一部门。
李梦佳:关于科研人才培育,您做为培育出优良研究人员(如程昊博士)的导师,同时也正在率领研究团队,请问您对年轻研究人员有哪些学术成长和经验分享?
回首 2005-2010年期间本田开辟的 ASIMO 机械人,其机能,出格是正在不变性方面,当前手艺要达到不异程度仍需相其时间。正在 2020 年之前,双脚机械人研发仍是少数机构的专属范畴。此次要受限于两个环节要素:一是高质量硬件设备,二是焦点手艺道理的控制。而正在 2020 年后,跟着手艺门槛的降低,双脚机械人的研发逐步给更普遍的研发团队。
赵明国:我从手艺角度解答若何理解新。当前机械人范畴面对的一个焦点挑和是长序列使命的处置。正在言语模子中,我们关心的是处置token的能力,而正在机械人操做中,则需要处置一系列持续的动做序列,例如抓取和放置物体等复杂行为。目前,机械人范畴短序列使命的处置曾经相对成熟,业界正正在摸索操纵新,次要是大模子来处理长序列使命的挑和。大模子可认为复杂使命供给施行序列的规划,但环节问题正在于若何实现机械人的自从决策能力。
机械人行业正正在履历严沉变化。虽然规模不及AI范畴,但比来的变化很是大,吸引了很多优良人才和资金。这种变化加快了手艺前进。以前,即便是大公司如本田,立异也较慢。现正在,新发现和屡次呈现,机械人行业起头像计较机和AI那样快速成长,构成了优良的立异轮回。
关于圈子取生态:机械人节制范畴的研究团队虽然浩繁,但各自采用分歧的手艺线,导致研究难以共享和复用。即即是高程度团队的研究,其影响力也往往局限于小范畴学术圈。
从2000年ASIMO全球机械人高潮,到现在AI取机械人手艺的深度融合,二十载工夫荏苒,中国的机械人研究走过了一段充满挑和取苦守的过程。正在这场漫长的手艺中,从动化系传授赵明国就像一盏一直未熄的灯,正在最孤单的时辰前。
2006岁首年月,我也起头研究被动行走手艺。这项手艺无论从力学道理仍是节制理论的角度都具有深刻的研究价值,且取我的研究高度契合,我也正在2007年至2008年期间做出了一些成就。
如全从动化的工场,机械人能否具有人类外不雅并不主要,由于那里没有人赏识它们,能够按照现实需求选择三指或六指等分歧方案。然而,正在非全从动化的中,机械人的外不雅就显得较为主要,由于人们会间接取机械人互动。以脚球为例,不雅众不只但愿看到胜利,还但愿看到出色的角逐。人类的根基行为和思维体例也影响了我们对机械人的期望,这注释了为什么像《西部世界》如许的做品会如斯受欢送。人们倾向于将机械人和AI想象成《西部世界》中的场景,这也反映了我们对认知的哲学摸索:我们是谁?我们从哪里来?我们要去哪里?我们能否可能是机械人?我们能否被创制?等等。
我们往往过于适用从义,我们该当改变这种思维,更深条理思虑问题。摸索可能带来多范畴的前进,不该因担忧手艺不赔本而不去测验考试。即便不是所有人都对机械人脚球感乐趣,只需有一部门人群认为这是可接管的,我们就该当继续推进,并将这项手艺放正在更久远的时间标准中去考量。这项手艺也可能不会间接发生贸易价值,但可认为其他范畴供给理论和方式。若是机械人脚球能成为贸易场景,那就更好了。
李梦佳:机械人仿照人类的外不雅和行为,不只仅是出于手艺上的需要,更多的是由于抚玩性和认知兼容性的考量?
目前,机械人脚球的竞技程度尚未达到可以或许吸引普遍不雅众的程度,因而,我们团队正正在寻找其他路子来连结项目标可见度。从更广漠的视角来看,我们实正关心的是若何通过脚球项目来鞭策具身智能等尖端手艺的前进和立异,以及若何将机械人脚球成长成一个全新的贸易模式,开辟一个史无前例的市场。
回首2008年残奥会,有一位被称为“刀锋兵士”的活动员(皮斯托瑞斯),他因双腿截肢而利用碳纤维假肢。若是设想适当,他的假肢以至可能使他跑得比健全人更快。这是由于假肢的设想能够使得摆动频次更高,并且因为不需要模仿实正在脚部的复杂布局,假肢能够更轻,从而提高活动效率。
目前,很多省份和城市都正在积极鞭策人形机械人的成长,将其视为一项主要使命。无论是学术界仍是财产界,这一范畴都呈现出兴旺成长的态势。我认为,这一趋向的焦点逻辑正在于有了大量的资金投入。
2010年摆布,全球人形机械人研究团队数量削减,次要有两个缘由:一是动力的手艺领先导致其他团队转向其他研究范畴,如Martijn Wisse传授从人形机械人研究转向农业机械;二是该手艺偏沉理论研究,贸易使用尚远。到2011年,该范畴理论立异放缓,根本研究和使用开辟都瓶颈。
我们的方针是正在将来十年内,通过专注于一个具体范畴来实现机械人手艺的财产化。目前,我们决定选择一个特定场景,好比机械人脚球,来深化手艺成长和摸索贸易模式,但愿构成可持续成长。我们相信,只要正在一个范畴取得冲破,才能将成功的手艺和贸易模式扩展到其他范畴。
关于机械人贸易化:这就像互联网贸易范畴,即便是小型企业,只需找准细分市场,成立奇特劣势,同样能够正在京东、阿里、腾讯、百度等巨头从导的贸易生态中拥有一席之地。
赵明国:最早该当是国科大的马宏绪传授,随后工业大学也有相关的研究。国内的系统性研究始于1998年,其时大学操纵985工程第一批专项经费,设立了一个机械人研究严沉项目。同期,理工大学也开展了相关研究。2003年后,由于研究标的目的调整,人形机械人研究临时弃捐。北理工正在黄传授率领下逐步成长成为该范畴的最主要研究力量。2009年后,浙江大学起头结构机械人研究。熊蓉传授等开辟了能打乒乓球的悟空机械人。
赵明国:机械人脚球的构思可逃溯至1993年。其时正在深蓝取卡斯帕罗夫的国际象棋挑和赛期间,一些学者提出了五个环节问题,并切磋AI正在现实世界中的使用,此中就包罗让机械人踢脚球这一设想。
计较机范畴往往会选择具有全球共识的尺度性问题做为冲破口。以计较机视觉为例,当深度神经收集等环节手艺正在某个节点取得冲破性进展后,全球顶尖的研究机构和企业便会合中资本投入这一范畴。通过三到五年的持续攻关,他们不只处理了视觉理解这一焦点问题,还正在研发过程中衍生出新的手艺分支。这种集中劣势资本、聚焦环节问题的成长模式,使得计较机范畴可以或许持续冲破手艺瓶颈。语音识别手艺的成长、GPT等大型言语模子的呈现,都印证了这一点。
赵明国:未来必然会有人研发出可以或许跑得比人类快的双脚机械人。 百米短跑是一种节拍性很强的活动,只包罗起跑加快和连结速度两个阶段,活动员只需全力冲刺到起点。取需要分派体力的马拉松分歧,百米竞走不需要考虑能量的收受接管和,机械人只需可以或许快速启动、加快,并正在100米内连结速度。
因而,大模子做为根本设备,为各类使用开辟供给了强大的底层支撑。这个新的手艺生态系统比拟保守架构具有较着劣势:它不只供给了更强大的功能,还显著提拔了开辟效率。这种手艺变化让研发团队得以将沉心从底层实现转移到营业逻辑和使用立异上。开辟人员不再需要深切处置底层算法编写和繁琐的参数调优,而是能够专注于焦点营业逻辑的优化,这极大地提高了项目质量和效率。
赵明国:那不是个手艺难题,我们团队仅用三天就完成了开辟。由于我们之前曾经具备了需要的手艺储蓄,包罗合适的机械人构型和持续活动节制能力。
于我而言,想把“踢脚球”做为切入点研究具身智能,并做好。若是有一天,人们认识到这是一个绝佳的创意,而且确实取得了显著,这将是我的欣慰。我并不期望本人必需亲身实现这一方针,若他人后来实现,我们也会感应欢快。
从2000年正在大学机械人研究生活生计,到后来担任优必选研究院院长,他一直坐正在中国机械人研究的前沿阵地。同时做为大学从动化系传授、加快进化结合创始人,赵明国不只是一位苦守者,更是一位具有前瞻目光的开辟者。早正在强化进修成为显学之前,他的团队就正在双轮自行车项目中测验考试过这一手艺线。虽然其时选择暂缓推进,但这种审慎而不的研究立场,恰好表现了一位资深学者的远见。
图注:赵明国正在智源具身智能峰会做演讲。详见:从具身到智能,无尽前沿丨智源具身智能峰会概念集锦。
其实,很多工作的成功并非源于明白的动机,但最终成果往往令人对劲。正在人形机械人范畴尚未兴起之时,我正在机械人学界的出名度次要依赖于我正在自行车项目上的。然而,人形机械人的兴起出乎很多人的意料。因而,我不人们仅仅由于某个范畴看似抢手就急于投身此中,而该当深图远虑,明白本人投身该范畴的初志,更久远的方针。
正在研究人形机械人的过程中,面对着认知和手艺两个层面的挑和:一是对人形机械人系统全体架构的理解不敷深切;二是正在具体手艺实现上碰到诸多坚苦。
赵明国:从手艺成长的时间跨度来看,即便本田 30 年前的机械人手艺取当下比拟仍具有相当的合作力。虽然手艺线有所分歧,但需要从度评估。
以机械人范畴为例,我认为其焦点使命是处理问题,好比手臂要处理操做问题,双腿要处理挪动问题。过去挪动问题难以处理,只能依托机械方式和简化模子,现正在跟着手艺前进,人们转向优化手艺,认为它能更无效地处理问题。所以要实正处理这些问题,需要进修并使用优化手艺,或者采用本人立异的方式,不消局限于专业。正如炊具从铁锅进化到电饭煲,面临新手艺的成长,进修和顺应是必然选择。
五是跟着具身智能从头遭到关心,我正将其取脚式机械人竞赛项目(RoboCup)连系,并推广这一研究标的目的。若能正在2025-2026年实现脚式机械人的具身智能使用,这将是一个主要的研究。
其实这些方式的理论根本早已确立,当前工做次要集中正在工程实施上。跟着计较能力加强,这些方式现正在可以或许现实使用并取得成效,这是一个严沉前进。不外,这些方式手艺要求高,需要专业团队全体把控。
这段履历让我深刻认识到:人的认知往往无限,良多决策的价值无法当即。我选择取施传授合做,既不是出于私交,也不是基于短期好处的考量,而是对其学术洞察力的承认取信赖。这种基于专业判断的科研合做最终取得了丰盛。
四是我们正攻关基于脉冲神经收集的节制系统,新鲜之处是融合了类脑计较和机械进修的方式,估计明岁首年月达到能够公开辟表的阶段。
三是2019年我们正在《Nature》上以封面文章颁发以“面向人工通用智能的异构芯片架构”正在思惟层面具有主要意义。
赵明国:我不认为机械人必需仿照人类手艺。手艺不是独一的权衡尺度。好比,人能够用双腿上台阶,自行车也能达到同样的处所。这不是简单的比力好坏或的问题。会商机械人时,人们常提到能正在陡坡上行走的岩羊,强调脚式机械人正在轮子无法达到的处所的需要性。同样,正在红牛赞帮的良多双轮的极限活动,脚式也无法企及。我认为主要的是完成某事的价格,而不是可否做到。
关于科研价值逃求:切忌逃求概况庞易或短期好处的项目,若是一个机遇看似过于简单或收益过分较着,往往暗藏风险。
近年来,苏黎世联邦理工学院(ETH Zurich)正在四脚机械人范畴利用强化进修取得了显著进展,导致这一手艺标的目的正在2020年摆布遭到了普遍关心。那段时间,因为疫情影响以及需要完成优化节制和类脑计较项目标研究工做,我们其时并未涉脚这一范畴。比来,我从头起头从进修的角度摸索相关研究,发觉当前的进修方式曾经愈加成熟。
1996年,跟着深蓝即将打败人类棋手的预期,研究者们成立了RoboCup联盟。1997年,正在其时AI范畴最具影响力的IJCAI会议上,初次举办了机械人脚球角逐。索尼、本田等日本企业做为次要赞帮商,鼎力支撑这项赛事。索尼更是免费供给四脚机械人,微软也供给了主要赞帮。然而,2008年的全球金融危机导致大企业削减赞帮,使得这项赛事的成长遭到影响。
正在智源具身智能峰会上,我强调机械人范畴要正在连结立异势头的同时,沉视本身手艺的冲破。机械人成长不克不及仅依赖于AI手艺的迁徙,简单地将AI使用于机械人并不等同于实现实正的具身智能。若是仅是如许,只能证明AI手艺的强大,而非机械人手艺的前进,所以机械人研究人员需要正在本范畴实现本色性立异。
正在人形机械人这一新兴范畴,仅仅仿照现有的模式是不敷的,由于如许的做法很难带来本色性的冲破。若是只是正在运营层面上合作,面临那些曾经具有丰硕资本和先发劣势的企业,新公司很难实现超越。然而,人形机械人行业仍有很大的成长空间,通过选择一个立异的标的目的并深切研究,新公司完全无机会正在将来取行业带领者并肩合作。这就像贸易范畴,即便是小型企业,只需找准细分市场,成立奇特劣势,同样能够正在京东、阿里、腾讯、百度等巨头从导的贸易生态中拥有一席之地。环节不正在于企业规模,而正在于可否对行业发生本色性贡献,构成差同化合作力。
我们发现飞机,不是简单仿照鸟类,而是操纵飞翔道理飞得更远。正在具身智能范畴,我们不只仿照人类动做,还思虑手艺为何未达到人类程度。我相信机械会正在某些方面超越人类,如计较器正在计较上超越人类。将来,机械也会正在复杂使命上超越人类。
李梦佳:您曾经正在脚式仿朝气器人范畴深耕20多年,20年间机械人的研究有哪些演进轨迹和范式改变?
赵明国:五年前的我可能持有分歧的概念,现正在我的思虑也正在改变。看待新手艺,我认为要打破范畴边界,采纳务实立场。以AI为例,当强化进修等方式已被验证可行时,我们能够先间接使用,正在实践中逐渐加深理解和认知。
2013年和2015年持续举办的两届DARPA机械人挑和赛(DRC)标记着人形机械人科研的一个小。角逐实践证明,保守的简单节制方式难以满脚复杂下的现实使用需求。比拟之下,基于优化的方式,如全体行为节制(WBC, Whole Body Control)和模子预测节制(MPC, Model Predictive Control)展示出显著劣势。这些方式不只可以或许无效处理现实问题,正在理论框架上也愈加完整。
赵明国:对我来说,机械人系统设想能够从Transformer模子中的token机制和留意力机制中获得灵感。以“按开关”为例,我们能够阐发人类若何正在这个过程中利用多种感官和分派留意力。
正在此次深度对话中,赵传授初次系统回首了本人的研究过程,从最后的孤军奋和,到现在取浩繁同业联袂并进。这个过程,某种程度上也是中国机械人研究从跟跑到并跑的缩影。通过此次,我们不只能领会机械人手艺的演进轨迹,更能感遭到科研工做者正在孤单苦守中守望远方的取。
李梦佳:2005年至今已近二十载,其时本田和动力的手艺程度若何?取当前手艺程度比拟,差别能否显著?
我更看沉手艺可否为贸易,而不是规模大小。即便脚球市场不大,能创制一亿价值也是前进,由于它代表从无到有的改变。目前机械人脚球还没无形成贸易邦畿,但很是有潜力,至于将来可否达到更大的规模,这需要时间来验证。
市场实践显示,市场最关心的是机械人本体的研发能力。若是不克不及控制本体手艺,就难以获得零件制制商的承认,焦点零部件也难以正在市场上获得使用。
赵明国:我目前仍然全心投入学术研究,并持立场对待财产化。我并不认为研究只能局限于学术界。例如,若是“踢脚球”的项目只逗留正在理论层面,它的感化无限。但若是能将其财产化,就能挖掘其更深条理的价值。
从全体成长趋向来看,机械人范畴的研究者该当自动拥抱AI手艺,需要按照AI的成长沉构研究框架。机械人范畴的从业者也需要改变思维体例:不再局限于保守的节制理论和最优化视角,而是要从数据驱动和机械进修的角度从头思虑问题。正在将来3到5年,跟着机械进修方式的深切使用,加上充脚的研究资本投入,我们等候看到的不只是表层的手艺使用,更是深层的立异冲破。
跟着手艺趋向的成长,我从2015年起头研究优化节制方式,并打算将其使用于开辟高机能的机械人集群力节制系统。正在取优必选科技合做时,我们正在研究所进行了一系列优化节制研究。得益于宽松的研究和没有短期方针压力,我们可以或许按本人的节拍深切研究,摸索了力控关节设想、WBC算法开辟和MPC方式使用等多个手艺标的目的。
我们但愿来年实现一个完全基于深度进修的端到端机械人决策系统。当前系统存正在视觉范畴受限、预设行为模式过于简单、决策逻辑依赖先验学问等局限。为冲破这些,我们正正在摸索新的方式,简单而言有以下测验考试:改变保守的使命分化体例,避免将复杂使命简单地分化为固定步调;摒弃保守的决策树和形态机方式;采用大模子间接从图像识别和决策,代替保守的计较机视觉算法。这种方式将为机械人的智能决策带来新的可能性,使其可以或许更矫捷地应对复杂中的挑和。
赵明国:比拟保守的计较机视觉等手艺线,基于大模子的处理方案具有奇特劣势。大模子生态系统供给了更丰硕的内容资本,能够加速研发历程,降低手艺门槛,同时推进行业协做取资本共享。但从目前的成长来看,大模子并未正在认知能力上实现质的冲破,其劣势更多表现正在生态系统的完整性和性方面。
近期,我们正在这个范畴有了新的冲破,设想了新型仿照生物神经系统的脉冲神经收集(SNN),将其分为多个功能回,并打算利用脉冲神经收集建立机械人系统,出格是使用于脚式机械人,目标是通过建立多层节制收集,实现正在线进修功能,处理机械人正在负载变化、关节误差以及其他不确定性要素方面的顺应性问题。
因而,百米竞走的挑和正在于能否有脚够的迸发力来达到极限速度。比拟之下,马拉松则需要更多的能量办理和储蓄。以至能够不消电池,只依托超等电容器来快速所需的能量。然而,利用现有的电机手艺来实现这种快速的能量是不成取的,由于它们无法满脚这种高效率和高能量的需求。同样,现有的机械人构型也不适合这种高速活动。
以“踢脚球”为例,人们关心的不是脚球本身,而是机械人可否像人一样踢球。一旦相关手艺成熟,它就能够被使用到其他范畴。这个问题能够分为两个方面:一是手艺成长过程中,能够处理其他问题,属于尝试性使用;二是人形机械人能吸引不雅众,由于人们喜好看表演。从古罗马角斗士到现代奥林匹克,人类对竞技的热爱一曲存正在。科技发财的今天,机械人活动会,包罗脚球,是一个新的成长标的目的。机械人体育角逐可能有两个沉点:一是做为手艺验证的尝试场景,为将来使用打根本;二是手艺成熟后,机械人体育竞技成为贸易场景。
我们选择从小型机械人起步。当动力采用类似方案时,我们敏捷决定展现本人的手艺实力,通过复现并优化相关动做,团队仅用很短时间就完成了这个演示项目,其实这更多展示了我们的快速响应能力,而非手艺冲破本身。
值得一提的是,自行车节制项目了计较架构正在节制系统中的环节感化。我们成功将本来需要三台计较机的功能集成到单个芯片上,验证了类脑计较正在节制系统集成方面的劣势。这带给我主要的,促使我起头关心机械人系统中的计较架构问题。我曾取计较所的同业切磋若何通过单一SoC(片上系统)处理机械人的所有计较需求。这个设想至今仍具前瞻性,但要实正实现还需要正在芯片设想和操做系统等复杂范畴投入更多研究。
我的很多学生曾经正在业界堆集了丰硕经验,他们但愿将这些经验取研究连系,因而成立了一家公司,并邀请我插手。开初,我团队专注于计较手艺的研发,由于我认为正在人形机械人和所有复杂机械人系统中,计较能力是环节。团队同意这一标的目的,并起头相关工做。然而,颠末市场实践,我们发觉零丁成长计较手艺正在当前阶段存正在较大挑和。因而,我们调整了计谋,将沉点放正在人形机械人的焦点手艺研发上,以机械人的全体开辟为从。
然而,这也激发了一个值得深思的问题:虽然我们具有了如斯先辈的东西,但正在某些范畴的现实进展似乎并未达到预期。
对于科技公司来说,它们的焦点价值凡是表现正在手艺立异和贸易价值这两个环节范畴。若是不克不及正在手艺和贸易模式上供给奇特的劣势,那么取曾经成立起完整财产链的公司如特斯拉、小米等合作将变得非常。
赵明国:1997年本田公司发布ASIMO人形机械人之时,我便起头关心。2000年摆布,我到访大学,恰逢我国起头兴起对机械人的研究,我有幸结识了陈恳教员,我欣然接管。于是2000年我进入后,起头专注于人形机械人节制系统的研究工做。
“二十年过去,仍正在的仅有我一人。”这句话背后,是一位学者对科研事业近乎的苦守。从2004年起头研究,到2014年终获承认,赵明国传授履历了整整十年的默默耕作。正在机械人研究最冷寂的年代,他选择了一条看似孤单的道:深耕双脚机械人节制系统,摸索被动动力学行走,测验考试将类脑计较引入机械人范畴。
正在团队的深切会商后,我们分歧认为,以我们目前的能力,不宜同时处置多个手艺挑和和使用场景,由于这超出了我们的能力范畴。
赵明国:计较机视觉(CV)范畴已构成了完整的手艺生态系统,比拟手动编写算法,开源社区供给的处理方案往往具有更好的机能。正在保守CV开辟中,我们需要深切理解项目标焦点概念,并连系相机参数等硬件要素进行调优,这对开辟者的专业手艺程度要求较高。
2024年7月我拜候苏黎世联邦理工学院时,RoboCup和机械人范畴专家Marco Hutter说:“目前全球进行人形机械人脚球研究的,包罗你以及UCLA的Dennis Hong团队正在内,仅有3-4个团队。”但本年7月份的RoboCup 2024机械界杯带来的研究进展,让很多研究者的立场都发生了改变:人形机械人脚球是验证具身智能的抱负平台,它涉及手艺迭代、进修方式改革、仿生材料等多个范畴,有帮于我们深切理解智能的素质和物理实现。这是一个值得持续投入的持久研究标的目的。
CMU的前传授Veloso曾提出:将机械人角逐整合为同一的人形机械人竞赛勾当。虽然这一建议被认为较为激进,但正在AI和人形机械人手艺快速成长的今天,这个标的目的值得注沉。从AlphaGo到AlphaFold的成长过程给我们主要:AI手艺需要正在特定范畴逐渐验证和完美。若间接正在最终使用场景中测试,可能因不完美而发生负面影响。比拟之下,正在竞赛等相对可控的中验证手艺更为合适。例如,围棋角逐的失败可证明人类更强,而卵白质预测的失误可能导致对整个手艺标的目的的质疑。所以当一项手艺正在特定范畴取得冲破性进展,证明其超越人类能力后,其他范畴就能以更大的决心采用和深化这项手艺。这恰是通过机械人竞赛验证手艺的价值所正在。
到2015年后,国内人形机械人研究的款式逐步了了:黄传授和熊传授的团队次要依托国度科研经费开展研究,而我们团队则通过取优必选的产学研合做获得贸易支撑。到2020年摆布,全国专注于人形机械人研究的次要是我们三个团队。我和熊传授都是通过机械人竞赛起步,逐渐堆集,正在这个范畴逐步有了一些影响力。
赵明国:我小我倾向于思虑,己见。多年经验让我深刻认识到:不要不放在眼里任何细节,即即是看似微不脚沉的环节,都值得投入时间深切研究。正在他人遍及质疑的范畴,更要摸索。切忌逃求概况庞易或短期好处的项目,若是一个机遇看似过于简单或收益过分较着,往往暗藏风险。以我的自行车研究项目为例:正在初期几乎没有人看好,但通过不懈勤奋,最终研究登上了《Nature》封面。
正在那款机械人研发过程中,构型选择是一个环节决策点。基于多年的研究经验,我对各类机械人构型都有深切的领会。我们的设想准绳是避免反复利用被普遍利用的方案,而是正在现有构型范畴内寻找立异空间。
赵明国:本年之前我认为是的,但现正在不雅念发生了变化。本科到博士阶段专注机电一体化,后来深切节制理论,正在被动节制范畴,我深切研究了力学标的目的,并正在节制优化方面进行了摸索。我本人没有太多负担,不会纠结于身份或专业标签。正在这个时代,专业之间的边界并不较着,机械工程师能够投身AI,计较机科学家也能通晓工程设想。
而大模子的呈现大大降低了这一门槛。开辟者只需要控制大模子的挪用接口,就能处置复杂的视觉使命。保守方式中,要同时处置视觉、言语和视频等多模态使命往往需要多个范畴专家协做。但正在大模子时代,一个熟悉大模子操做的工程师就能胜任,这极大地提高了开辟效率。
赵明国:像人一样踢脚球可做为具身智能范畴的标记性使命之一。脚球活动代表了双脚活动能力的最高程度,是极具挑和性的研究标的目的。从人形机械人的具身智能研究来看,可将其划分为三个次要类别:下肢活动节制、手臂及精细操做、协调活动。若是正在每个类别中冲破几个典型使命,将标记着具身智能研究的主要进展。
我们选择切入点时,次要考虑手艺实现的可行性。一是这取我们团队的专业技术高度相关;二是这为将来的扩展打下了的根本。一个雄伟的方针,需要通过现实可行的第一步来启动这个过程。
赵明国:正在这项研究中,施平传授是项目标次要担任人。我次要承担尝试实施和验证环节,而施传授团队则专注于机械人芯片架构的开辟。研究发源能够逃溯到2014年我取百度无人驾驶团队的合做。其时,由余凯博士率领的团队规模尚小,但已起头结构无人驾驶汽车范畴。考虑到中国做为自行车大国的特殊国情,他们提出开辟无人驾驶自行车的构思。颠末倪凯等人的深切调研,最终选择取我们团队展开合做。
取计较机范畴分歧,机械人手艺的成长面对着特殊的挑和。起首是研究范畴的分离性:即即是同正在机械人范畴的研究者,因为研究标的目的、手艺线和系统架构的差别,彼此之间的学术交换和手艺自创都比力无限。机械人节制范畴的研究团队虽然浩繁,但各自采用分歧的手艺线,导致研究难以共享和复用。即即是高程度团队的研究,其影响力也往往局限于小范畴学术圈。虽然机械人手艺现今备受关心,研究仍然呈现碎片化特征。这种分离的研究模式难以构成规模效应,最终影响了整个范畴的成长速度。
现实上,我所做的一切工做都不曾白搭。我们很早就正在双轮均衡车上使用过强化进修,但其时选择了暂缓推进。其时我对强化进修一曲持隆重立场,曲到很多人正在这方面取得了进展,我才从头投入研究。
关于AI的影响:机械人成长不克不及仅依赖于AI手艺的迁徙,简单地将AI使用于机械人并不等同于实现实正的具身智能。
其实,正在阿谁阶段,因为研发投入大、手艺难度高,处置人形机械人研究的团队相对较少。特斯拉发布人形机械人打算后,激发了全球对这一范畴的关心。我国相关部分也随之调整了计谋结构,工业和消息化部、科学手艺部等部委加大了对人形机械人范畴的支撑力度。这些政策和资金支撑催生了大量研究团队和企业进入这一范畴,使本来相对冷门的人形机械人研究送来了快速成长期。目前,我国人形机械人财产已成长到50至100家企业的规模。正在学术界,处置人形机械人研究的高校传授已跨越30位。
很多日常设想都显示了处置多种消息的能力。以前我们用“权沉”或“优先级”来描述分歧消息的主要性,但这些可能不完全精确。Transformer模子的“留意力机制”供给了新思:我们可否正在机械人的多模态节制中利用这种机制?好比,正在按开关时,触觉留意力能否最集中?听到声音时,听觉留意力能否最高,其他感官的留意力能否降低?这种方式可否优化操做?
李梦佳:您谈到了对行业成长的贡献,出格是推广具身智能的新。具体来说,我们若何理解这些新?
赵明国:我一曲正在思虑一个问题:为什么计较机和AI手艺成长如斯敏捷,而机械人手艺的成长相对迟缓?除了机械人涉及硬件研发这个显而易见的要素外,我认为还存正在另一个主要缘由 —— 研发径的差别。
到2016年,我们已完成包罗车辆、语音识别等全数焦点功能的开辟。其时,这些尝试正在校园内进行时惹起了不少关心,也有人记实分享相关视频。后来,施平传授将他研发的芯片使用于我们的尝试平台,用于验证芯片机能。虽然此前两边并不领会对方的研究标的目的,但颠末切磋后发觉研究具有很强的互补性,随即开展了持续到2019年的深切合做。
关于跨学科交叉研究,我正在2016、2017年将目光放正在了类脑计较范畴,我们将类脑芯片使用于机械人平台,并将之前正在机械人节制范畴的研究方式放到类脑计较范畴从头起头。2021年起,我们参取了国度脑打算项目,努力于整合类脑、定位和节制功能。考虑到类脑和定位已有特地团队担任,我率领团队专注于类脑节制的研究。
二是无人驾驶自行车项目,属于跨范畴合做,我们取芯片设想专家施平教员合做,将立异芯片架构使用正在自行车节制系统中,取得了优良的展现结果。