计算机围棋
本条目需要擴充。(2010年11月28日) |
计算机围棋是人工智能(AI)的一个领域,该领域致力于开发出可以下围棋的电脑程式。围棋是棋盘游戏的一种,有很古老的历史。
目录
1 歷史
1.1 alpha-beta 剪枝法
1.2 蒙地卡羅搜尋樹
1.3 深度學習
2 难点
2.1 棋盘太大
2.2 可行的着法太多
2.3 估值函数
2.4 组合问题
3 策略搜索
4 状态表示
5 系统设计
5.1 处理问题的新方法
5.2 编程语言选择
5.3 设计哲学
5.3.1 Minimax 树搜索
5.3.2 蒙特卡罗方法
5.3.3 Knowledge-based 系统
5.3.4 机器学习
6 电脑围棋程序的竞赛
6.1 历史
6.2 电脑对电脑程序中的问题
7 注释和参考
7.1 参考文献
8 参见
9 外部链接
9.1 General info
9.2 Specific info
9.3 计算机程序
9.4 Computer Go vs human/computer & tournament
歷史
alpha-beta 剪枝法
最先電腦圍棋也試圖用類似處理西洋棋的演算法——alpha-beta 剪枝法,即一般認為的暴力搜尋法,但成長非常慢。1986年,應昌期懸賞100萬美金,徵求可以打敗人類的圍棋軟體,並以15年為期限,但沒有任何人拿走獎金。到了20世紀末,這類程式表現最好的是陳志行製作的手談,其宣稱可以接近業餘初段,至少與低段職業差距9子以上,其他如GNU Go更是只有業餘5~10級左右。
代表:
- 手談 (圍棋軟體)
- GNU Go
蒙地卡羅搜尋樹
Crazy Stone首次引進了蒙地卡羅搜尋樹,其原理是用蒙地卡羅法快速的把棋局下至終局,然後藉此判斷局勢,用這個方法,電腦圍棋得到飛快性的成長,並突破了業餘初段的壁障。這時代表現最好的是Zen,在AlphaGo出現的前一年,Zen的平行運算版本可以達到與職業棋士差距3~4子的水平。
這時期開始,開始出現了UEC杯等電腦圍棋比賽。在其中發生一個插曲,2010年時,黃士傑的Erica在2010電腦奧林匹亞獲得19路圍棋的冠軍,隔年又在UEC盃拿下亞軍,這在當時引起許多注目,因為Erica是單機程式,而其對手都是使用大型電腦,這也使得他獲得DeepMind公司的邀請。
代表程式:
- Zen
- Crazy Stone
- 石子旋風
- Fuego
深度學習
深度學習原本主要應用是圖像分析,利用電腦模擬神經元,可以訓練電腦有類似人類「直覺」的反應,2014年左右,Google DeepMind和facebook等公司意識這可能可以用在處理電腦圍棋。最直接的想法是輸入人類的圍棋棋譜,並在程式中設定圍棋規則,以及各棋譜的最後勝負,利用監督學習讓電腦得到「棋感」,電腦因而可以給出特定局面下有哪些可能的行棋方法,後來這個方法在AlphaGo的論文中被稱為「走子網路」。2015年左右,DeepMind的David Silver意識到,其實圍棋的形勢判斷也可以交由神經網路決定,「價值網路」因此誕生。接著DeepMind團隊再使用強化學習——大眾媒體稱之為左右互搏——增強兩種神經網路,在大約三千萬盤的左右互搏後,超越了職業選手水平,這使得DeepMind最終贏得這項與facebook的競賽。
2016年1月27日,《自然》發表了Google DeepMind开发AlphaGo 的論文,于2015年10月,在未讓子的挑戰中,以5:0戰績,擊敗歐洲圍棋冠軍——職業圍棋二段樊麾。這是電腦程式首次在公平比賽中擊敗職業棋手。2016年3月,AlphaGo在韓國首爾以4:1擊敗棋士李世乭。[1][2] 2017年5月, AlphaGo在中国乌镇围棋峰会的三局比赛中击败[3]当时世界排名第一[4][5]的中国棋手柯洁。
代表程式:
- AlphaGo
- AlphaGo Zero
- CGI
Darkforest(facebook最終失敗的計畫)- DeepZenGo
- ELF OpenGo
- Leela
- Leela Zero
- PhoenixGo
- 絕藝
难点
圍棋給程式設計師們帶來了許多人工智能領域裡的挑戰。當如IBM深藍那樣的超級電腦,已經能夠擊敗世界上最好的西洋棋棋手的同時;卻有不少人能擊敗圍棋軟體。可見,要編寫出超越初級水平的電腦圍棋程式,是極其困難的一回事。
棋盘太大
围棋的棋盘很大(19×19),因此通常被认为是难以编写围棋程序的一个重要原因。然而,像Amazon这样的游戏,棋盘比围棋更大[來源請求],却较易编写出超越初级水平的电脑程序。
可行的着法太多
与其它棋盘游戏相比,围棋的着法几乎不受规则限制。中国象棋第一步有42种选择,国际象棋有20种选择,但围棋有361种选择。有些着法较常见,有些几乎从未走过(例如第一步下在边线上),但所有着法都有可能。
象棋(以及大部分棋盘游戏如西洋跳棋和双陆棋)棋局过程中,棋子数逐渐减少,使游戏简化。但是,围棋中每下一子,都会使局势变得更复杂。
估值函数
组合问题
策略搜索
状态表示
系统设计
处理问题的新方法
编程语言选择
设计哲学
Minimax 树搜索
蒙特卡罗方法
Knowledge-based 系统
机器学习
电脑围棋程序的竞赛
历史
第一個電腦圍棋競賽是由USENIX贊助,在1984年到1988年間舉行。
电脑对电脑程序中的问题
注释和参考
^ David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Laurent Sifre, George van den Driessche, Julian Schrittwieser, Ioannis Antonoglou, Veda Panneershelvam, Marc Lanctot, Sander Dieleman, Dominik Grewe, John Nham, Nal Kalchbrenner, Ilya Sutskever, Timothy Lillicrap, Madeleine Leach, Koray Kavukcuoglu, Thore Graepel & Demis Hassabis. 深度神经网络加树形检索可以下围棋了. 2016-01-27 [2016-01-29] (英语).
^ 开明. 面对谷歌围棋AI,人类最后的智力骄傲即将崩塌. 2016-01-28 [2016-01-29].
^ Google’s AlphaGo Continues Dominance With Second Win in China. 2017-05-25.
^ 柯洁迎19岁生日 雄踞人类世界排名第一已两年. May 2017 (中文).
^ World's Go Player Ratings. 24 May 2017.
参考文献
- AI-oriented survey of Go
Monte-Carlo Go, presented by Markus Enzenberger, Computer Go Seminar, University of Alberta, April 2004
Monte-Carlo Go, written by B. Bouzy and B. Helmstetter from Scientific Literature Digital Library
Static analysis of life and death in the game of Go, written by Ken Chen & Zhixing Chen, 20 February 1999
Co-Evolving a Go-Playing Neural Network, written by Alex Lubberts & Risto Miikkulainen, 2001
参见
- 圍棋#围棋软件与人工智慧
- 围棋程序列表
- Go Text Protocol
外部链接
維基教科書中的相關電子教程:Computer Go |
General info
Online Computer Go bibliography.
Computer Go and Computer Go Programming pages at Sensei's Library- computer-go mailing list
- The Computer Go Room on the Kiseido Go Server (KGS) for online discussion and running "bots"
Playing with Shannon: a forum about computer go programming
Specific info
Information on the Go Text Protocol commonly used for interfacing Go playing engines with graphical clients and internet servers- Kinger, Tim and Mechner, David. An Architecture for Computer Go (1996年)
- Published articles about computer go on Ideosphere gives current estimate of whether a Go program will be best player in the world
- XS4All Internet B.V.
Minimalism in Ubiquitous Interface Design by Wren and Reynolds describes a simple computer vision system for playing Go
计算机程序
Go++ by Michael Reiss
Handtalk, developed in China by Zhixing Chen
The Many Faces of Go by David Fotland
KCC Igo, from Korea (sold as Silver Star in Japan)
Go Intellect by Ken Chen
GNU Go , the strongest open source Go program
Smart Go by Anders Kierulf, inventor of the Smart Game Format- Free Go Software
- GoKnot, a Windows solution open for developing
- MIni GO Solver
AYA by Hiroshi Yamashita
CrazyStone by Rémi Coulom
GNU Go, the strongest open source Go program
Go++ by Michael Reiss (sold as Strongest Go or Tuyoi Igo in Japan)- Go Intellect by Ken Chen
- Handtalk/Goemate, developed in China by Zhixing Chen (sold as Shudan Taikyoku in Japan)
- Haruka by Ryuichi Kawa (sold as Saikouhou in Japan)
- Indigo by Bruno Bouzy
- Katsunari by Shin-ichi Sei
- KCC Igo, from North Korea (sold as Silver Star or Ginsei Igo in Japan)
The Many Faces of Go by David Fotland (sold as AI Igo in Japan)
MoGo by Sylvain Gelly
Smart Go by Anders Kierulf, inventor of the Smart Game Format
Leela及Leela Zero
Computer Go vs human/computer & tournament
- Comprehensive list of past computer go events
All systems Go by David A. Mechner, discusses the game where professional go player Janice Kim won a game against program Handtalk after giving a 25-stone handicap.
Two Representative Computer Go Games, an article about two computer go games, the one with two computers players, and the other, a 29-stone handicap human-computer game