全球首个人形机器人格斗赛落幕:拳打脚踢你来我往 就是“大脑”还不好使
全球首个人形机器人格斗赛落幕:拳打脚踢你来我往 就是“大脑”还不好使
全球首个人形机器人格斗赛落幕:拳打脚踢你来我往 就是“大脑”还不好使《科创板日报》5月26日讯(记者 黄心怡)“左右勾拳、侧(cè)踢、膝踢、闪避、跌倒起身,被KO……”一场(yīchǎng)机器人之间的格斗(gédòu)比赛在昨晚开打。
在这场于杭州举行的(de)《CMG世界机器人大赛·系列赛(xìlièsài)》机甲格斗擂台赛上,宇树科技以(yǐ)合作方身份参赛,上场的机器人均为宇树 G1人形机器人,而内嵌算法则由四个比赛团队自研,并进行现场的手柄操控。经过几轮比拼,黑队"AI策算师"最终夺得冠军(guànjūn)。
“这次比赛的格斗动作,采集自外部专业(zhuānyè)人员,用来(yònglái)给AI模型提供学习参考。”宇树科技相关负责人向《科创板日报》介绍。
在此次比赛过程中(zhōng),机器人(jīqìrén)暴露了仍存在动态控制、感知不足等问题,也展现出较强的平衡控制、人机协同能力。
多名业内人士对《科创板日报》表示,从格斗过程(guòchéng)来看,机器人底层(dǐcéng)算法已经较为出色,但缺少(quēshǎo)真正的空间智能大模型(móxíng)作为机器人的大脑。为了更好地在实际应用落地,后续产业链或将涌现更多二次开发的机器人解决方案商,在公版机器人基础上开发专业的大脑。
▍拳脚相加(quánjiǎoxiāngjiā)!机器人遭重击后5秒起身
《科创板日报》注意到,在相互(xiānghù)出拳(chūquán)、踢腿的(de)格斗过程中,参赛(cānsài)机器人能通过步伐的调整来保持自身的平衡。在被击中后,机器人也能迅速起身。“虽然格斗效果一般,摔倒爬起来的灵活性把我惊呆了,支撑力拉满。”有观众表示。
“机器人倒地五秒内马上能起来,重心(zhòngxīn)(zhòngxīn)不稳的情况下能调整身形维持平衡,这两点让我印象较为深刻。” 快思慢想研究院院长、上海交通大学计算法学与AI伦理研究中心联席主任田丰表示,“两足机器人的动态平衡性要比四足难得多。机器狗(gǒu)的重心只需要(xūyào)落在4个脚组成的矩形内就行(nèijiùxíng),支撑(zhīchēng)的面积大。而两足人形机器人的重心需要落在两足的连线内。”
据悉,宇树G1机器人(jīqìrén)在对(duì)抗(duìkàng)中保持平衡,主要依赖于仿真(fǎngzhēn)环境的AI强化学习和本体关节的感知。通过对大量平衡数据的学习和模拟训练,机器人不断优化自身(zìshēn)的平衡控制策略,同时本体关节的高精度传感器能够实时感知身体各部位的姿态和受力情况,为平衡控制提供关键数据。
宇树科技(kējì)相关负责人向《科创板日报》介绍,IMU(惯性测量单元)在机器人保持平衡中发挥着重要作用,在仿真训练中同样不可或缺。IMU可以实时监测(jiāncè)机器人的姿态、加速度等信息(xìnxī)。
值得一提的是,此次(cǐcì)参赛的宇树科技G1手臂进行了(le)定制化设计,拥有7个(gè)自由度,比常规的5个自由度多出(duōchū)两个,目的是在格斗中进行更灵活的招式变化,如勾拳、摆拳、上勾拳等拳击动作中的手腕调整,增加攻击的角度和灵活性。
上述人员介绍,G1格斗模式的(de)训练难度一是(yīshì)在于瞬间爆发力要求高,需要机器人具备强大的动力系统来提供足够的扭矩,以实现(shíxiàn)快速动作响应(xiǎngyìng)。二是对(duì)控制算法精准度和稳定性要求高,控制算法要实时处理(shíshíchǔlǐ)大量传感器数据,精确计算身体各部位的运动轨迹与发力时机,实现对多(duō)关节、重心、姿态毫秒级的精准控制,保证动作既有力又不失协调。三是机械结构强度要求高,在进行(jìnxíng)该动作时,机器人的机械结构需要承受较大的冲击力,对关节、骨骼等结构的强度和稳定性提出了很高的要求。
▍人机协同为主,操作员(cāozuòyuán)手柄遥控机器人对战
G1机器人操控方式包括AI语音操控、手柄操控、体感操控,各有优缺点。而本次比赛中(zhōng)主要采用现场人员进行手柄操作(cāozuò)的方式。在比赛过程中,可以(kěyǐ)看到操作员在一旁控制机器人进行格斗。
宇树科技相关负责人对此解释道,AI语音操控响应延迟比较(bǐjiào)明显,影响对机器人的(de)实时控制。手柄操控让参赛者更直观、更精准(jīngzhǔn)地操控机器人,也更易于上手,有利于(yǒulìyú)扩大参赛者范围。而体感操控在沉浸感上更具潜力,宇树已经开发了一套体感人形机器人控制系统,后续的比赛应该就可以(kěyǐ)给参赛者使用。
中国信通院泰尔系统实验室副总工程师刘泰介绍,对机器人进行手柄(shǒubǐng)操控,与日常普通的(de)遥控玩具,存在(zài)一定的区别。人形机器人其背后是(shì)一整套的大模型、运动控制模型的算法支撑,实际上是在通过这些算法来进行操控。
“采用传统的控制方法很难让(ràng)(ràng)它站得住走(zǒu)得稳,现在通过强化学习的训练方式,让它往能够站得平衡(pínghéng)的方式由自己去探索。整体的比赛非常振奋,它的表现可以说(shuō)比以往更进了一步,能够看到机器人在对抗比较强的情况下,也能够保持很好的稳定性,包括全身的运动机构协调,是科技进步和产业进步很好的结合。” 刘泰提到。
田丰认为,“在(zài)暂时还不能实现通用人工智能AGI的前提下,能否通过人机(rénjī)协同来达到比较好的效果,是当前业内(yènèi)探索的方向。而这场比赛也展现了一定的成果,这也是很有价值的。”
▍实时感知仍存困境 机器人(jīqìrén)大脑待突破
不(bù)过(bùguò),由人类(rénlèi)遥控操作的(de)机器人也存在比赛失误的情况。比如选择主动攻击对手,不当心扑空后,导致参赛机器人失去稳定性倒地,被对手“KO”。机器人想要后退来调整对战角度,却意外被擂台的围绳给缠住,需要人类来解绑等等。这其实暴露了机器人动态运动控制与(yǔ)实时感知的不足。
“这就涉及到一个问题,机器人是否(shìfǒu)要完成仿真人类的形态。比如人背后没有(méiyǒu)长眼睛,但(dàn)机器人后背是否应该设置摄像头,让机器人扩大感知范围(fànwéi)。再比如人只有5个手指,但有些工业场景可能6个手指会更好。人形机器人可能只是(zhǐshì)一个过渡阶段,未来可能会发展出超越人形的机器人形态。” 田丰表示。
一名观赛的业内人士认为,从格斗过程来看,底层算法已经(yǐjīng)较为出色,包括稳定性、视觉、灵活性、速度连贯性(liánguànxìng)等,目前缺少的是(shì)真正的空间智能大模型作为机器人的大脑。
田丰表示,从中美来看,在机器人大脑的投入(tóurù)是美国的比例更大些。“国内企业大部分都在做(zuò)机器人本体,有(yǒu)一些机器人企业在做小脑,也就是运动控制系统。做机器人大脑的企业大概在1/20的比例。不过(bùguò),已经有一些机器人企业正在进行大脑研发。”
从产业链来看,田丰(tiánfēng)认为业内更多的关注焦点在(zài)于整机厂商(chǎngshāng),以及电机等(děng)硬件层面,而大脑也是通用型的基础性大脑。“但机器人(jīqìrén)整机其实需要软件二次开发,才能更好地在实际应用。比如面向格斗(gédòu)、工厂、物流等场景进行二次开发。后续产业链会涌现这类的机器人解决方案商,在公版机器人基础上开发专业的大脑。这就涉及到多模态大模型,以及RAG知识库进行融合。”
(科创板日报(rìbào)记者 黄心怡)
《科创板日报》5月26日讯(记者 黄心怡)“左右勾拳、侧(cè)踢、膝踢、闪避、跌倒起身,被KO……”一场(yīchǎng)机器人之间的格斗(gédòu)比赛在昨晚开打。
在这场于杭州举行的(de)《CMG世界机器人大赛·系列赛(xìlièsài)》机甲格斗擂台赛上,宇树科技以(yǐ)合作方身份参赛,上场的机器人均为宇树 G1人形机器人,而内嵌算法则由四个比赛团队自研,并进行现场的手柄操控。经过几轮比拼,黑队"AI策算师"最终夺得冠军(guànjūn)。

“这次比赛的格斗动作,采集自外部专业(zhuānyè)人员,用来(yònglái)给AI模型提供学习参考。”宇树科技相关负责人向《科创板日报》介绍。
在此次比赛过程中(zhōng),机器人(jīqìrén)暴露了仍存在动态控制、感知不足等问题,也展现出较强的平衡控制、人机协同能力。
多名业内人士对《科创板日报》表示,从格斗过程(guòchéng)来看,机器人底层(dǐcéng)算法已经较为出色,但缺少(quēshǎo)真正的空间智能大模型(móxíng)作为机器人的大脑。为了更好地在实际应用落地,后续产业链或将涌现更多二次开发的机器人解决方案商,在公版机器人基础上开发专业的大脑。
▍拳脚相加(quánjiǎoxiāngjiā)!机器人遭重击后5秒起身
《科创板日报》注意到,在相互(xiānghù)出拳(chūquán)、踢腿的(de)格斗过程中,参赛(cānsài)机器人能通过步伐的调整来保持自身的平衡。在被击中后,机器人也能迅速起身。“虽然格斗效果一般,摔倒爬起来的灵活性把我惊呆了,支撑力拉满。”有观众表示。
“机器人倒地五秒内马上能起来,重心(zhòngxīn)(zhòngxīn)不稳的情况下能调整身形维持平衡,这两点让我印象较为深刻。” 快思慢想研究院院长、上海交通大学计算法学与AI伦理研究中心联席主任田丰表示,“两足机器人的动态平衡性要比四足难得多。机器狗(gǒu)的重心只需要(xūyào)落在4个脚组成的矩形内就行(nèijiùxíng),支撑(zhīchēng)的面积大。而两足人形机器人的重心需要落在两足的连线内。”

据悉,宇树G1机器人(jīqìrén)在对(duì)抗(duìkàng)中保持平衡,主要依赖于仿真(fǎngzhēn)环境的AI强化学习和本体关节的感知。通过对大量平衡数据的学习和模拟训练,机器人不断优化自身(zìshēn)的平衡控制策略,同时本体关节的高精度传感器能够实时感知身体各部位的姿态和受力情况,为平衡控制提供关键数据。
宇树科技(kējì)相关负责人向《科创板日报》介绍,IMU(惯性测量单元)在机器人保持平衡中发挥着重要作用,在仿真训练中同样不可或缺。IMU可以实时监测(jiāncè)机器人的姿态、加速度等信息(xìnxī)。
值得一提的是,此次(cǐcì)参赛的宇树科技G1手臂进行了(le)定制化设计,拥有7个(gè)自由度,比常规的5个自由度多出(duōchū)两个,目的是在格斗中进行更灵活的招式变化,如勾拳、摆拳、上勾拳等拳击动作中的手腕调整,增加攻击的角度和灵活性。
上述人员介绍,G1格斗模式的(de)训练难度一是(yīshì)在于瞬间爆发力要求高,需要机器人具备强大的动力系统来提供足够的扭矩,以实现(shíxiàn)快速动作响应(xiǎngyìng)。二是对(duì)控制算法精准度和稳定性要求高,控制算法要实时处理(shíshíchǔlǐ)大量传感器数据,精确计算身体各部位的运动轨迹与发力时机,实现对多(duō)关节、重心、姿态毫秒级的精准控制,保证动作既有力又不失协调。三是机械结构强度要求高,在进行(jìnxíng)该动作时,机器人的机械结构需要承受较大的冲击力,对关节、骨骼等结构的强度和稳定性提出了很高的要求。
▍人机协同为主,操作员(cāozuòyuán)手柄遥控机器人对战
G1机器人操控方式包括AI语音操控、手柄操控、体感操控,各有优缺点。而本次比赛中(zhōng)主要采用现场人员进行手柄操作(cāozuò)的方式。在比赛过程中,可以(kěyǐ)看到操作员在一旁控制机器人进行格斗。
宇树科技相关负责人对此解释道,AI语音操控响应延迟比较(bǐjiào)明显,影响对机器人的(de)实时控制。手柄操控让参赛者更直观、更精准(jīngzhǔn)地操控机器人,也更易于上手,有利于(yǒulìyú)扩大参赛者范围。而体感操控在沉浸感上更具潜力,宇树已经开发了一套体感人形机器人控制系统,后续的比赛应该就可以(kěyǐ)给参赛者使用。
中国信通院泰尔系统实验室副总工程师刘泰介绍,对机器人进行手柄(shǒubǐng)操控,与日常普通的(de)遥控玩具,存在(zài)一定的区别。人形机器人其背后是(shì)一整套的大模型、运动控制模型的算法支撑,实际上是在通过这些算法来进行操控。
“采用传统的控制方法很难让(ràng)(ràng)它站得住走(zǒu)得稳,现在通过强化学习的训练方式,让它往能够站得平衡(pínghéng)的方式由自己去探索。整体的比赛非常振奋,它的表现可以说(shuō)比以往更进了一步,能够看到机器人在对抗比较强的情况下,也能够保持很好的稳定性,包括全身的运动机构协调,是科技进步和产业进步很好的结合。” 刘泰提到。
田丰认为,“在(zài)暂时还不能实现通用人工智能AGI的前提下,能否通过人机(rénjī)协同来达到比较好的效果,是当前业内(yènèi)探索的方向。而这场比赛也展现了一定的成果,这也是很有价值的。”
▍实时感知仍存困境 机器人(jīqìrén)大脑待突破
不(bù)过(bùguò),由人类(rénlèi)遥控操作的(de)机器人也存在比赛失误的情况。比如选择主动攻击对手,不当心扑空后,导致参赛机器人失去稳定性倒地,被对手“KO”。机器人想要后退来调整对战角度,却意外被擂台的围绳给缠住,需要人类来解绑等等。这其实暴露了机器人动态运动控制与(yǔ)实时感知的不足。
“这就涉及到一个问题,机器人是否(shìfǒu)要完成仿真人类的形态。比如人背后没有(méiyǒu)长眼睛,但(dàn)机器人后背是否应该设置摄像头,让机器人扩大感知范围(fànwéi)。再比如人只有5个手指,但有些工业场景可能6个手指会更好。人形机器人可能只是(zhǐshì)一个过渡阶段,未来可能会发展出超越人形的机器人形态。” 田丰表示。
一名观赛的业内人士认为,从格斗过程来看,底层算法已经(yǐjīng)较为出色,包括稳定性、视觉、灵活性、速度连贯性(liánguànxìng)等,目前缺少的是(shì)真正的空间智能大模型作为机器人的大脑。
田丰表示,从中美来看,在机器人大脑的投入(tóurù)是美国的比例更大些。“国内企业大部分都在做(zuò)机器人本体,有(yǒu)一些机器人企业在做小脑,也就是运动控制系统。做机器人大脑的企业大概在1/20的比例。不过(bùguò),已经有一些机器人企业正在进行大脑研发。”
从产业链来看,田丰(tiánfēng)认为业内更多的关注焦点在(zài)于整机厂商(chǎngshāng),以及电机等(děng)硬件层面,而大脑也是通用型的基础性大脑。“但机器人(jīqìrén)整机其实需要软件二次开发,才能更好地在实际应用。比如面向格斗(gédòu)、工厂、物流等场景进行二次开发。后续产业链会涌现这类的机器人解决方案商,在公版机器人基础上开发专业的大脑。这就涉及到多模态大模型,以及RAG知识库进行融合。”
(科创板日报(rìbào)记者 黄心怡)
相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎