400-891-8901
公司新闻
CATEGORY相关推荐
RELATED联系我们
CONTACT US电话:400-891-8901
邮箱:wu_18717763209@yeah.net
本报讯(记者 孙云柯)近日,图灵奖得主、强化学习领域主要奠基人理查德·萨顿教授与石景山企业他山科技在加拿大签约,双方将合作建设“机器人幼儿园”,计划落地在北京石景山首钢园。
何为“机器人幼儿园”?他山科技相关负责人介绍,可以理解为一种新型的机器人训练场,在这里,机器人不再跟着人类进行模仿,而是在放置各类真实物品的环境中自主探索、感知结果,并根据反馈调整行为,完成从身体自我认知到运用工具完成复杂任务的迭代进化。
这背后,是区别于大语言模型的另一条独立技术路径,即强化学习,其核心逻辑是让智能体通过与环境互动积累经验、从错误中学习,而非依赖海量标注数据进行模仿。2024年图灵奖获得者萨顿教授,正是这一领域公认的奠基人。
在萨顿看来,大语言模型聚焦于语言模仿与安全对齐,其能力上限受限于人类现有知识。他提出,未来人工智能范式的根本转折在于从“人类数据时代”跨入“经验时代”,智能体不再消费人类生产的数据,而是通过与环境的直接交互产生自身经验,并持续进化。