跳动百科

远超 GPT-4o,Physical Intelligence 推出 Hi Robot,通过“自言自语”学会人类思维

伏瑗先   来源:网易

远超GPT-4o,Physical Intelligence推出Hi Robot,通过“自言自语”学会人类思维

2025年,美国具身智能初创公司Physical Intelligence推出了分层交互式机器人Hi Robot。该机器人通过“自言自语”的方式学会了人类思维中的系统2思考模式,能够自主推理完成复杂任务。

Hi Robot将视觉-语言-行动(VLA)模型纳入分层推理过程,高层次语义视觉-语言模型(VLM)充当“系统2”,通过“自言自语”推理复杂任务和语言交互,将任务拆解成简单步骤交由低层次的VLA模型执行。

据悉,Hi Robot在实际任务中的表现优于GPT-4o和平面VLA策略,指令跟随准确率高出GPT-4o达40%。它能够理解并响应复杂的用户提示和实时反馈,展现出强大的常识推理能力。

Physical Intelligence团队表示,Hi Robot是朝着将AI知识与机器人等物理系统无缝连接方向迈出的重要一步,未来有望为人们在开放世界环境中提供更加自然的帮助。