例如:围棋-alpha go,master a Value network b Tree evaluation from value net c Tree evaluation from rollouts 由®的 砂的的 Policy network e Percentage of simulations Principal variation Mastering the game of Go with deep neural networks and tree search,Nature,2016
例如:围棋-alpha go,master Mastering the game of Go with deep neural networks and tree search, Nature, 2016
例如:德州扑克-DeepStack(Alberta),Libratus(CMU) “非完整信息的博弈” 采用了一套叫做Counterfactual regret minimization(反事实的遗憾最小化) 算法。它会先让机器反复地进行自我博弈,随机玩上几亿手扑克,达到挑战顶 尖扑克玩家的高度。 BUCKETING 0光是品 CARD RANGES F是AW吧 NEURAS NET COUNTERFACTUAL BRAINS VS ARTIFICIAL 1328 INTELLIGENCE 132 000 000 1000 12 P1 P2 2210 9 7 Hidden Layers 889 DeepStack:Expert-Level Artificial Intelligence in Heads-Up No-Limit Poker,2017 Brown,N.,Sandholm,T.(2017).Safe and Nested Subgame Solving for Imperfect-Information Games.N/PS.Best Paper
例如:德州扑克 – DeepStack(Alberta), Libratus(CMU) DeepStack: Expert-Level Artificial Intelligence in Heads-Up No-Limit Poker , 2017 Brown, N., & Sandholm, T. (2017). Safe and Nested Subgame Solving for Imperfect-Information Games. NIPS. Best Paper “非完整信息的博弈” 采用了一套叫做 Counterfactual regret minimization(反事实的遗憾最小化) 算法。它会先让机器反复地进行自我博弈,随机玩上几亿手扑克,达到挑战顶 尖扑克玩家的高度
机器学习能做什么? 小数据上就已经 很有用
机器学习能做什么? 小数据上就已经 很有用
例如:画作鉴别 (艺术) 画作鉴别(painting authentication):确定作品的真伪 勃鲁盖尔(1525-1569) 的作品? 出自[J.Hughes et al,PNAS2009] 梵高(1853-1890) 的作品? 出自[C.Johnson et al,.IEEE-SP2008]
例如:画作鉴别 (艺术) 出自 [C. Johnson et al., IEEE-SP, 2008] 画作鉴别(painting authentication):确定作品的真伪 勃鲁盖尔(1525-1569) 的作品? 梵高(1853-1890) 的作品? 出自 [J. Hughes et al., PNAS 2009]
例如:画作鉴别 (艺术) 除专用技术手段外,笔触分析 (brushstroke analysis)是画作鉴 定的重要工具;它旨在从视觉上 判断画作中是否具有艺术家的特 有“笔迹”。 该工作对专业知识要求极高 Portions of van Gogh paintings 只有少数专家花费很大精力 -具有较高的绘画艺术修养 才能完成分析工作! 掌握画家的特定绘画习惯 很难同时掌握不同时期、不同流派多位画家的绘画风格! [C.Johnson et al.,IEEE-SP 2008]
例如:画作鉴别 (艺术) 除专用技术手段外,笔触分析 (brushstroke analysis)是画作鉴 定的重要工具;它旨在从视觉上 判断画作中是否具有艺术家的特 有“ 笔 迹 ” 。 该工作对专业知识要求极高 [C. Johnson et al., IEEE-SP, 2008] - 具有较高的绘画艺术修养 - 掌握画家的特定绘画习惯 只有少数专家花费很大精力 才能完成分析工作! 很难同时掌握不同时期、不同流派多位画家的绘画风格!