5 分钟带你看懂阿法狗

AlphaGo 在下棋时知道自己在干嘛么？

H4程靖，微信公众号：h4cj250

说人话！5分钟带你看懂阿法狗。
写在前面的话：
昨天的结果也出来了，李世石试图用比较攻击性的打法，结果还是完败。
作为一个算是勉强会下围棋的IT从业者，心情有点复杂。一方面我知道计算机战胜人是迟早的事情，另一方面却没有想到李世石会败得这么彻底。
或许大时代的潮流终会将一切碾压而过，却总会留下一些落寞的身影。
平心而论，李世石下的不太好，但是首次面对机器人，其实压力之大，是不可想象的，李世石勇敢的做了第一个吃螃蟹的人，值得我们尊敬。
计算机下棋的历史：
其实AI下围棋已经有了快20年了。之前我们没有太关注，是因为还不够强，印象中最好的AI有业余5段的水平。
1997年，IBM公司的“深蓝”计算机战胜了国际象棋世界冠军卡斯帕罗夫，然后大概是2006年，人类最后一次战胜过计算机。因为国际象棋的规则简单，下法也比较固定（兵不能后退，象只能斜着走什么的），IBM凭借单纯的硬件堆叠，用最粗暴的方式。计算所有下一步，之后的可能性，就直接解决了问题。
为什么围棋那么复杂？
国际象棋所有的可能性性是10^47，1后面跟着47个“0”。
但是围棋不一样，19*19 的交叉点中蕴含了2*10^170种可能，就是2后面跟着170个“0”。这个数字大到什么概念呢？
全宇宙的原子数量是10^80，也就是全宇宙每个原子代表一张棋谱，都还差得远。
大家不要小看那几个“0”，给大家用面积表示下。

请看看上面的图，围棋可是整整比国际象棋多了127个“0”，每一个0都会呈现几何级的增大，大家想想一下相差127个“0”面积差多少吧，反正我的电脑是画不出来了。

所以这这种情况下，阿法狗被研究出来开始了。下面正式开始介绍
学习狗
从前，有一只学习狗。这只狗很喜欢看人来下棋，并且能记住看过的每一盘棋。我们管他叫学习狗。在初期，他学习的是西方国家的人在QQ游戏中下围棋的棋谱。
然后他记住，哦，当出现这个局面的时候，下在天元会输，下小目会赢。他只会做输赢判断，其他一概不知。
请大家记住他的技能，学习狗过目不忘。

但是下着下着，他发现自己总是输，因为之前说过了，围棋可能性太多，他学过的棋谱根本数量不够。人类思考一下就能打败他。
乱走猫
于是，他的邻居–乱走猫出现了。这只猫的特别是动作特别快，但是她懒得思考，从来不看棋谱。就是瞎走。然后她会记住，哦，这样瞎走最后会赢，那样瞎走最后会输。
记住，瞎走猫，是乱走的，但是她能记住，怎么乱走赢的可能性更大。

分身术
但是很快问题出现了，由于乱走猫总是乱走。没人愿意和她下棋了（废话，谁这么无聊啊）。于是乱走猫用了分身术，自己和自己下，并且记住怎么会赢。

反正是自己和自己下，不想学习狗只是自己背棋谱，那当然可以用很多分身了。与是乱走猫每天能下好多盘。
题外话：当然，分身数量是有限的，不能无限分身，原因嘛，是因为谷歌给的经费是有限的，只能有那么多机器。
什么，你问如果要强行无限分身会怎么样？你拿你家电脑开一万个网页你就知道了。：）

合体！
但是当乱走猫和人类下棋的时候，还是输。因为可能性太多，2*10^170种可能种呢。怎么能下的完。
他们的主人–科学家想了想说，这样，学习狗和乱走猫，你们一起来下。
如果出现的情况谁碰见过，并且知道该怎么下就听谁的。

他们合体后，当然就很厉害了，打遍电脑届无敌手。但是和人类比赛有时候还是会输。于是科学家再想办法，这样，你们分身出来自己和自己下，然后总结经验。
注意，这个自己和自己下和当初的乱走猫完全不同，由于学习狗记住了棋谱。遇到有些情况，知道该怎么下，乱走猫终于不会再乱走一气了，但是学习狗的棋谱里，没有的乱走猫就依据乱走的经验来，他们的水平提高非常快。

学习狗与乱走猫的真身
其实学习狗就是IT界的“深度学习”，目前用于人脸识别，语音识别。由于需要大量的数据（比如很多棋谱棋谱），所以和大数据结合紧密。
大家最常用的应该就是—汽车驾驶导航。
乱走猫呢，就是大名鼎鼎的“蒙特卡洛搜索树”他最大的特别是可以并行，可以理解成同时下很多种可能，把每种可能都分身成一盘新棋来下。
用处嘛，可以理解凡是排序都能用，比如你要某电商网站搜索北京最便宜的拖鞋。就有无数拖鞋相互比较价格，最终经过预赛、初赛、半决赛、决赛，得出冠军。
但是遇到简单的排序就排他的小弟就行了，不用他亲自出马

闹矛盾
但是新的问题又出现了，一猫一狗配合出现了问题，他们先各思考，再合计，一合计就容易闹矛盾。所以，他们特别慢！
指点鹰
科学家一看，好啦，大家不要吵了。
其实不就是对局面的看法不一致嘛，我给你们个专门看局面的家伙–“指点鹰”。
这家伙不用计算该怎么下，专门看如果这样下，胜率是多少。这样速度就快多了。

为了防止，猫、狗、鹰。互相打起来。科学家定了个规矩。你们分别给出几个候选，给了候选后就没有学习狗的事情了。
剩下的决策者，乱走猫和指点鹰的意见各占一半。

偶像天团组合
然后整个组合的成员就都找齐了。学习狗、乱走猫、指点鹰成为给了一个天团组合，名字就叫SHE! 啊不！叫阿法狗。
为什么叫这个名字
其实人家不是狗。。。Alpha是希腊字母的第一个。GO是围棋的英文说法，翻译过来应该是：围棋一号。
不过我认为起名的时候，科学家想的是：奔跑吧，阿尔法！
然后科学家进行了一些人为的调整，让阿法狗养成了这样的习惯。
1、开始阶段，先主要由学习狗来下。因为布局越经典，越不容易有错误。这阶段不求有功，但求无过。
2、中盘后，逐渐由乱走猫接手，因为之后的可能性越来越小，很可能乱走猫已经走过一模一样的局面。
3、指点鹰随时辅助。
4、局部争夺的时候，也由乱走猫接手。乱走猫把棋盘假设成只有5*5大小，然后集中精力来计算，这5*5里面有多少种可能。
—————————————————-分割线—————————————————-
好了，阿法狗，基本上就是这样一个东西，下面说一点私人的看法。
当然，目前阿法狗还在不断和自己下棋，不断进化，之后变成究极态，就几乎没有人能战胜了。但是只要他还没有下到2*10^170种情况，人胜利的可能就一直存在。
于怎么战胜他嘛，很简单。
那就是李世石抡起棋盘砸向电脑！—这是门外汉的说法，人家的主机不在韩国啦，这么多服务器，得多大啊。得专门有自己的发电站、水冷系统、专门的保安和电工好吗！
或者拔网线？黑客入侵？都行~~
好啦，换回严肃脸，估计下一个对手就是柯洁了。
我认为，只是我认为。唯一的胜算在开局阶段，需要不断的下一子换一个地方，跳出5*5的范畴。
也许，只是也许，能战胜他，因为如果中盘后，还是势均力敌的话。人类战胜乱走猫的几率几乎为0
当然，李世石第一局也是这么想的，当然结局大家看到了。阿法狗的科学家黄世杰，就是代替阿法狗落子那位，人家好歹业余五段啊！

好啦，先写到这里，之后想到什么再补充，欢迎大家留言讨论。

5 分钟带你看懂阿法狗

AlphaGo 在下棋时知道自己在干嘛么？

发布者

胡中元