玩转围棋、国际象棋、扑克,DeepMind推出通用学习算法SoG
玩转围棋、国际象棋、扑克,DeepMind推出通用学习算法SoGDeepMind的机器人AlphaGo在围棋项目上赢得了围棋世界冠军、职业九段棋手李世石,AlphaGo之后,DeepMind又推出了赢得国际象棋的AlphaZero、击败《星际争霸II》的AlphaStar等等。然而,大多数成功案例有一个重要的共同点:专注于单一博弈项目。现在,来自GoogleDeepmind的研究团队提出了一种利用自我博弈学习、搜索和博弈论推理实现强大博弈性能的通用学习算法——StudentofGames(SoG)。研究论文发表在《》上。SoG模型可以在不同的游戏中自由发挥,并教会自己如何与自己的另一个版本进行对战,能够学习新策略并逐渐变得更有能力。来源,频道:@kejiqu群组:@kejiquchat
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人