5 分钟带你看懂阿法狗

H4程靖,微信公众号:h4cj250


说人话!5分钟带你看懂阿法狗。
写在前面的话:
昨天的结果也出来了,李世石试图用比较攻击性的打法,结果还是完败。
作为一个算是勉强会下围棋的IT从业者,心情有点复杂。一方面我知道计算机战胜人是迟早的事情,另一方面却没有想到李世石会败得这么彻底。
或许大时代的潮流终会将一切碾压而过,却总会留下一些落寞的身影。
平心而论,李世石下的不太好,但是首次面对机器人,其实压力之大,是不可想象的,李世石勇敢的做了第一个吃螃蟹的人,值得我们尊敬。
计算机下棋的历史:
其实AI下围棋已经有了快20年了。之前我们没有太关注,是因为还不够强,印象中最好的AI有业余5段的水平。
1997年,IBM公司的“深蓝”计算机战胜了国际象棋世界冠军卡斯帕罗夫,然后大概是2006年,人类最后一次战胜过计算机。因为国际象棋的规则简单,下法也比较固定(兵不能后退,象只能斜着走什么的),IBM凭借单纯的硬件堆叠,用最粗暴的方式。计算所有下一步,之后的可能性,就直接解决了问题。
为什么围棋那么复杂?
国际象棋所有的可能性性是10^47,1后面跟着47个“0”。
但是围棋不一样,19*19 的交叉点中蕴含了2*10^170种可能,就是2后面跟着170个“0”。这个数字大到什么概念呢?
全宇宙的原子数量是10^80,也就是全宇宙每个原子代表一张棋谱,都还差得远。
大家不要小看那几个“0”,给大家用面积表示下。
请看看上面的图,围棋可是整整比国际象棋多了127个“0”,每一个0都会呈现几何级的增大,大家想想一下相差127个“0”面积差多少吧,反正我的电脑是画不出来了。

所以这这种情况下,阿法狗被研究出来开始了。下面正式开始介绍
学习狗
从前,有一只学习狗。这只狗很喜欢看人来下棋,并且能记住看过的每一盘棋。我们管他叫学习狗。在初期,他学习的是西方国家的人在QQ游戏中下围棋的棋谱。
然后他记住,哦,当出现这个局面的时候,下在天元会输,下小目会赢。他只会做输赢判断,其他一概不知。
请大家记住他的技能,学习狗过目不忘。

但是下着下着,他发现自己总是输,因为之前说过了,围棋可能性太多,他学过的棋谱根本数量不够。人类思考一下就能打败他。
乱走猫
于是,他的邻居–乱走猫出现了。这只猫的特别是动作特别快,但是她懒得思考,从来不看棋谱。就是瞎走。然后她会记住,哦,这样瞎走最后会赢,那样瞎走最后会输。
记住,瞎走猫,是乱走的,但是她能记住,怎么乱走赢的可能性更大。

分身术
但是很快问题出现了,由于乱走猫总是乱走。没人愿意和她下棋了(废话,谁这么无聊啊)。于是乱走猫用了分身术,自己和自己下,并且记住怎么会赢。

反正是自己和自己下,不想学习狗只是自己背棋谱,那当然可以用很多分身了。与是乱走猫每天能下好多盘。
题外话:当然,分身数量是有限的,不能无限分身,原因嘛,是因为谷歌给的经费是有限的,只能有那么多机器。
什么,你问如果要强行无限分身会怎么样?你拿你家电脑开一万个网页你就知道了。:)

合体!
但是当乱走猫和人类下棋的时候,还是输。因为可能性太多,2*10^170种可能种呢。怎么能下的完。
他们的主人–科学家想了想说,这样,学习狗和乱走猫,你们一起来下。
如果出现的情况谁碰见过,并且知道该怎么下就听谁的。

他们合体后,当然就很厉害了,打遍电脑届无敌手。但是和人类比赛有时候还是会输。于是科学家再想办法,这样,你们分身出来自己和自己下,然后
总结经验
注意,这个自己和自己下和当初的乱走猫完全不同,由于学习狗记住了棋谱。遇到有些情况,知道该怎么下,乱走猫终于不会再乱走一气了,但是学习狗的棋谱里,没有的乱走猫就依据乱走的经验来,他们的水平提高非常快。

学习狗与乱走猫的真身
其实学习狗就是IT界的“深度学习”,目前用于人脸识别,语音识别。由于需要大量的数据(比如很多棋谱棋谱),所以和大数据结合紧密。
大家最常用的应该就是—汽车驾驶导航。
乱走猫呢,就是大名鼎鼎的“蒙特卡洛搜索树”他最大的特别是可以并行,可以理解成同时下很多种可能,把每种可能都分身成一盘新棋来下。
用处嘛,可以理解凡是排序都能用,比如你要某电商网站搜索北京最便宜的拖鞋。就有无数拖鞋相互比较价格,最终经过预赛、初赛、半决赛、决赛,得出冠军。
但是遇到简单的排序就排他的小弟就行了,不用他亲自出马

闹矛盾
但是新的问题又出现了,一猫一狗配合出现了问题,他们先各思考,再合计,一合计就容易闹矛盾。所以,他们特别慢!
指点鹰
科学家一看,好啦,大家不要吵了。
其实不就是对局面的看法不一致嘛,我给你们个专门看局面的家伙–“指点鹰”。
这家伙不用计算该怎么下,专门看如果这样下,胜率是多少。这样速度就快多了。

为了防止,猫、狗、鹰。互相打起来。科学家定了个规矩。你们分别给出几个候选,给了候选后就没有学习狗的事情了。
剩下的决策者,乱走猫和指点鹰的意见各占一半。

偶像天团组合
然后整个组合的成员就都找齐了。学习狗、乱走猫、指点鹰成为给了一个天团组合,名字就叫SHE! 啊不!叫阿法狗。
为什么叫这个名字
其实人家不是狗。。。Alpha是希腊字母的第一个。GO是围棋的英文说法,翻译过来应该是:围棋一号。
不过我认为起名的时候,科学家想的是:奔跑吧,阿尔法!
然后科学家进行了一些人为的调整,让阿法狗养成了这样的习惯。
1、开始阶段,先主要由学习狗来下。因为布局越经典,越不容易有错误。这阶段不求有功,但求无过。
2、中盘后,逐渐由乱走猫接手,因为之后的可能性越来越小,很可能乱走猫已经走过一模一样的局面。
3、指点鹰随时辅助。
4、局部争夺的时候,也由乱走猫接手。乱走猫把棋盘假设成只有5*5大小,然后集中精力来计算,这5*5里面有多少种可能。
—————————————————-分割线—————————————————-
好了,阿法狗,基本上就是这样一个东西,下面说一点私人的看法。
当然,目前阿法狗还在不断和自己下棋,不断进化,之后变成究极态,就几乎没有人能战胜了。但是只要他还没有下到2*10^170种情况,人胜利的可能就一直存在。
于怎么战胜他嘛,很简单。
那就是李世石抡起棋盘砸向电脑!—这是门外汉的说法,人家的主机不在韩国啦,这么多服务器,得多大啊。得专门有自己的发电站、水冷系统、专门的保安和电工好吗!
或者拔网线?黑客入侵?都行~~
好啦,换回严肃脸,估计下一个对手就是柯洁了。
我认为,只是我认为。唯一的胜算在开局阶段,需要不断的下一子换一个地方,跳出5*5的范畴。
也许,只是也许,能战胜他,因为如果中盘后,还是势均力敌的话。人类战胜乱走猫的几率几乎为0
当然,李世石第一局也是这么想的,当然结局大家看到了。阿法狗的科学家黄世杰,就是代替阿法狗落子那位,人家好歹业余五段啊!

好啦,先写到这里,之后想到什么再补充,欢迎大家留言讨论。

发布者

胡中元

《中原驿站》站长