人伸手拿盐瓶的时候,大脑不只是在算坐标。它还在感知身体的平衡、皮肤上的摩擦、口渴或疲劳这些内部状态。UCLA的一项新研究指出,现在的AI模型有个根本缺陷:缺少"内部具身化"。
研究区分了两种具身化。外部具身化是与物理世界交互,内部具身化是监测疲劳、不确定这些内部状态。在点光源显示测试里,AI模型没法识别移动的人形,甚至把它描述成"星座",而人类新生儿就能认出来。
人体自带一套安全机制,会记录不确定、耗竭、生存冲突这些信号。AI系统目前没有等效的东西。UCLA团队提出了"双重具身框架",建议在AI里建立追踪不确定性、处理负载、置信度的持续内部信号。
论文发表在《Neuron》上。作者包括Akila Kadambi、Lisa Aziz-Zadeh、Antonio Damasio、Marco Iacoboni、Srini Narayanan。
结论是:没有内部的"脆弱性"和自我调节机制,AI会一直过度自信地犯错,没法真正和人类价值观对齐。
这个发现有点反直觉。我们一直以为AI需要更聪明、更强大。但也许真正的安全来自于让AI知道自己什么时候不确定、什么时候该停下来。
评论 (0)
登录后即可参与讨论
立即登录暂无评论,来发表第一条评论吧