您的位置:医药网首页 > 医药资讯 > 医疗器械行业 > eLife:发表吃豆人游戏中猕猴高认知能力的研究成果

eLife:发表吃豆人游戏中猕猴高认知能力的研究成果

最近,eLife发表了一篇题为。该研究由中国科学院脑科学与智能技术卓越中心(神经科学研究所)和灵长类神经生物学国家重点实验室杨天明研究组完成。开发了一个新颖有趣的实验范式吃豆人游戏,训练猕猴使用摇杆完成游戏范式的主要任务。该研究将复杂行为范式与人工智能建模相结合,定量探索了恒河猴解决复杂问题的启发式行为策略特征,为解释大脑实现高级认知功能的计算机制提供了全新的方法和重要启示。

在日常生活中,大多数人的重要目标通常都超出了简单决策的范围,而这些目标是可以通过设计一系列细致的基本策略来实现的。个人可以根据目前的情况,优先考虑每种策略的收益和风险,分析比较容易完成的子任务中的具体问题。高度动态的环境总会伴随着意想不到的意外和干扰,因此在决策过程中保持相机的灵活性至关重要。虽然研究动物复杂的行为和潜在的神经机制是神经科学和认知科学领域持续受到关注的科学问题,但大多数动物行为范式都不够复杂,不足以支持研究动物如何简化动态和多样的策略来完成复杂的高级认知任务。

为了解决这些问题,本研究改编了街机游戏的经典《吃豆人》(图A),训练猕猴学会使用操纵杆控制《吃豆人》在封闭的迷宫中移动以收集食物。猕猴躲避敌人追击会获得实时果汁作为奖励。经过一段时间的训练,猕猴可以理解游戏中各种元素与之前奖惩的关系,并据此做出连续的运动选择,以躲避敌人的追击,获得更多的奖励,甚至在特定的规则下将敌人杀回来。虽然游戏的动态性很强,元素也很复杂,但本质上类似于动物的野外觅食任务,这是本研究中动物训练成功的关键因素。

为了定量描述恒河猴的行为策略特征,研究人员使用机器学习和方法来动态拟合和匹配游戏玩法和多种智能策略模型。这种多智能体协作决策模型也是实现人工智能领域吃豆人游戏最高分的设计关键。这个计算模型设计了一组策略基组,策略基组中的每个策略只解决游戏中的一个子任务,比如觅食最近的食物,躲避敌人的追击或者通过能量豆食物改变敌人的状态。在该模型中,不同策略被比较并拟合到猕猴的博弈行为数据中,从而推断出策略的动态权重。计算模型预测猕猴手柄运动的准确率达到90%以上。更重要的是,策略的动态权重分析表明,恒河猴采用分而治之的启发式方法,每次只关注游戏的一个子任务,以分布式的方式解决这些问题,从而实现游戏整体目标的优化。研究发现,恒河猴可以按照时间顺序组合这些策略库,构建更复杂的复合策略来处理特定的、更具挑战性的任务。研究表明,恒河猴能够最优地掌握一组策略库,并采用分层决策来解决复杂任务(图B)。

该研究聚焦于系统认知神经科学与人工智能的交叉领域,将复杂的行为范式与严谨的计算建模相结合,为未来探索灵长类动物的高级认知提供了重要的实验证据和新颖的分析方法。该研究得到了科技部、中国科学院、上海市科委和国务院的支持。

a、吃豆人的行为范式,B、猕猴通过分层决策解决吃豆人的任务。这种策略处于最底层,决定操纵杆的移动:向上、向下、向左或向右。在中间层,选择be

医药网新闻
返回顶部】【打印】【关闭
扫描100医药网微信二维码
视频新闻
图片新闻
医药网免责声明:
  • 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
  • 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040