因为一盘棋走一步需要0.3ms(P_human_plus遍历整个棋盘的时间),谷歌用大规模集群进行并行化计算,自我对弈3000万盘棋生成训练集只需要一天左右的时间[4],所以如果对弈更多棋局可以提高棋力的话,黄世杰他们早就做了。目前的方案可能已经达到了CNN网络能力的极限。完整的阿尔法狗不仅需要生成训练集,还要用训练集来生成局面评估函数v(),而这还使用了两周时间,这也许是阿尔法狗并没有能够完全使用强化学习,而仅仅是在整个过程的一小部分使用左右互搏的原因。左右互博用的还不够多,这是一个遗憾。 如果存在一个“围棋之神”,一个已经穷尽了所有的围棋步法的“上帝”,那他每一步都是最优应对。一些顶尖棋手在接受采访时表示[8],“围棋之神”对战人类选手可能还有让4子的空间,也就是说,就算下赢了人类,计算机也还有很大进步的空间。 面对一个如此高难度的问题,计算机和人类都无法在有限时间内找到完全的规律(柯洁和李世乭比赛是一人有3小时时间思考,阿尔法狗今年3月准备和李世乭进行的比赛则是每人1小时的快棋)。计算机和人都是在对问题做抽象,然后搜索最佳策略。要下好围棋所需要的能力已经接近人类智力的极限:要有大局观、要懂得取舍、还要会精打细算,治理一个国家也不过如此。计算机可以学会围棋,就能学会很多一样难度的技能。在未来,也许围棋、自动驾驶、同声传译都会被一一攻克。甚至在数论、量子场论等领域,深度学习和搜索相结合,可能也会带给我们更多惊喜,比如攻克“哥德巴赫猜想”。 那么,人工智能是否真的会很快登顶呢? 虽然在智力方面AI有希望登峰造极,但高智商只是人类众多能力的一个方面。吴清源先生在方寸之间纵横无敌,但仍然漂泊一生,被命运推着前进。早年他做段祺瑞的门客,棋盘上把段祺瑞打的落花流水,弄得下人都没有早饭吃;后来东渡日本,三易国籍,留下许多遗憾。如果把“强人工智能”比作一个天才少年,虽然智商爆表,但其他方面还需要我们悉心加以引导。创造出“德才兼备,匡扶济世”的人工智能,才是我辈真正应该努力实现的目标。 一起加油吧,科学少年们! To the infinity and beyond ! 参考文献: 1, EfficientSelectivity and Backup Operators in Monte-Carlo Tree Search 2, Human-level control through deep reinforcementlearning 3, Move Evaluation In GO Using Deep Convolutional Neural Networks 4. Masteringthe Game of Go with Deep Neural Networks and Tree Search 5. A Survey ofMonte Carlo Tree Search Methods 6. 大脑如何思维—智力演化的今昔 7. Some Studies in Machine LearningUsing the Game of Checkers.II-Recent Progress 8.http://www.sbanzu.com/topicdisplay.asp?BoardI… *************************** AlphaGo論文的第一作者黄士杰 黄士杰出身台湾新竹的交通大学,硕士、博士都在台师大资工就读,可谓罕有接受完整台湾高等教育而又打出名堂的「土博」。黄士杰热爱围棋,进入台师大后创办围棋社,曾获台湾大专杯围棋赛冠军,拥有业馀六段棋力,是「当时大专生最强」;在研发AlphaGo前,黄士杰早已闯出名堂,他读博士的最后一年,在2010年于国际电脑奥林匹亚竞赛(International Computer Games Association,简称ICGA)开发了「Erica」,击败了当时围棋AI公认最强程式「Zen」,引起轰动。黄士杰是DeepMind团队中重要成员,两位首席工程师之一。 揭秘AlphaGo作者之一Aja Huang(黄士杰)的弈城账号为:DeepMind,据网友调查AlphaGo曾经用该帐号做过测试。 AlphaGo之父:一个有着一半华人血统的英国天才哈萨比斯 1976年7月,哈萨比斯生于英国伦敦,母亲是新加坡华人,父亲来自希腊的塞浦路斯。17岁,在一个游戏设计比赛中,哈萨比斯获得第二名,进入牛蛙实习,参与设计和开发游戏:《主题公园》(Theme Park)。 1998年,哈萨比斯成立了自己的游戏公司(Elixir Studios)。这家拥有60人的游戏公司,发布了包括《革命》和《魔鬼天才》。 1999年,年仅23岁哈萨比斯第一次参加了“智力奥林匹克运动会”,这是一个专门为天才较量智力的国际比赛。哈萨比斯连续参加了4年,赢了5次。 2009年,因其在游戏设计上的成就,哈萨比斯被选为英国皇家艺术协会的成员。 2011年,哈萨比斯成立DeepMind Technologies,其目标是“解决智能问题”。 DeepMind一直保持低调,直到2013年12月,DeepMind首次出席一次业界领先的机器学习研究大会时,DeepMind的研究人员一开始演示他们的软件就令人惊艳。此前从未有人演示过具备这种能力的软件,即可以从零开始学习和掌握如此复杂的任务。一个月后,谷歌重金收购了DeepMind。再后来,就是我们今天看到的哈萨比斯所创造的历史:他领导开发的人工智能AlphaGo打败了世界顶尖的围棋选手。