無論輸贏,2016年的3月都將被鐫刻進人類的歷史。3月8日-15日,谷歌研發(fā)的圍棋的人工智能AlphaGO將與十年傳奇棋手李世石九段進行五番棋較量。
與此同時,3月7日,來自中國的人工智能團隊異構(gòu)智能也宣布將研發(fā)異構(gòu)神機,向世界圍棋冠軍柯潔九段發(fā)出挑戰(zhàn)。而在3月6日的農(nóng)心杯上,柯潔九段戰(zhàn)勝了李世石九段。
而Facebook也在開發(fā)相應(yīng)的圍棋人工智能,實際上,這些研發(fā)都屬于人工智能的一部分,旨在讓機器通過模仿人類大腦的思維方式來實現(xiàn)比現(xiàn)代計算機更高水平的統(tǒng)計和分析能力。
圍棋被認為是人類發(fā)明的最復(fù)雜也是最美的游戲。
自1997年IBM超級計算機“更深的藍”擊敗世界冠軍卡斯帕羅夫以后,人工智能程序開始不斷的向人類博弈游戲的最后的堡壘圍棋發(fā)起了挑戰(zhàn)。
雖然此前,也有人工智能程序戰(zhàn)勝過一些業(yè)余圍棋選手,但面對職業(yè)選手時,仍舊一敗涂地。這是因為,國際象棋平均每回合有35種選擇,而圍棋每個回合則有250種可能,這250種可能中每一種又有250種可能。
而從對戰(zhàn)的策略上看,國際象棋的目的就是殺王,子是越下越少;圍棋的目的是圈地,子越下越多,地多者勝。而且,圍棋還有手筋、劫爭、棄子等戰(zhàn)術(shù)戰(zhàn)略層面的技法。國際象棋史上第二位世界棋王伊曼紐爾·拉斯克在評論國際象棋和圍棋時,說過:“國際象棋是一種僅僅局限于這個世界的游戲,圍棋則有些不像是從地球上誕生的。如果有那么一天,我們發(fā)現(xiàn)有一種天外文明和我們玩同一種游戲,那一定是圍棋,決不會有任何疑問。”
國際象棋的步數(shù)完全可以靠計算出來,而圍棋除了計算能力,還與個人的思考方式有關(guān)。也就是說,與國際象棋人工智能相比,圍棋人工智能更像是一個“人”。
谷歌的DeepMind團隊給AlphaGO輸入了海量的職業(yè)棋手的對局,而其自我學(xué)習(xí)演繹的對局數(shù)更是達到了3000萬局。AlphaGO的研發(fā)人戴密斯·哈薩比斯說:“AlphaGO和IBM的‘深藍’不同,有自主學(xué)習(xí)的能力,AlphaGO將來可以適用于醫(yī)療等服務(wù)領(lǐng)域。”
不過,異構(gòu)智能創(chuàng)始人兼CEO吳韌認為,異構(gòu)智能正在開發(fā)的異構(gòu)神機比AlphaGO更勝一籌。“在訓(xùn)練各種巨大的非常智能的神經(jīng)網(wǎng)方面,我們的技術(shù)和世界任何一家公司相比都毫不遜色。”吳韌說。
所有的圍棋人工智能都使用到了蒙特卡洛樹搜索(MCTS),它使用蒙特卡洛算法的模擬結(jié)果來估算一個搜索樹中每一個狀態(tài)(state)的值。隨著進行了越來越多的模擬,搜索樹會變得越來越龐大,而相關(guān)的值也會變得越來越精確。通過選取值更高的子樹,用于選擇行動的策略概率在搜索的過程中會一直隨著時間而有所改進。目前最強大的圍棋程序都是基于蒙特卡洛樹搜索的,通過配置經(jīng)訓(xùn)練后用于預(yù)測人類棋手行動的策略概率進行增強。這些策略概率用于將搜索范圍縮小到一組概率很高的行動、以及在模擬中抽樣行動。
而好的圍棋程序需要蒙特卡洛對策樹搜索以及它和其它各種深度深度神經(jīng)網(wǎng)的無縫集成,這一切都要運行在大規(guī)模異構(gòu)高性能的超級計算機上面。目前,異構(gòu)智能公司已經(jīng)匯聚了一個20人的世界一流技術(shù)團隊,建成了專為開發(fā)人工智能設(shè)計的超級計算機,并開發(fā)出了利用超級海量數(shù)據(jù),用最先進的算法訓(xùn)練超級巨大和復(fù)雜的深度神經(jīng)網(wǎng)的成熟技術(shù),取得了多項最領(lǐng)先的結(jié)果。
不論是AlphaGo、黑色森林還是異構(gòu)神機,它們的神奇之處并不是它的計算能力窮盡了圍棋的所有可能性,而在于它的策略選擇和學(xué)習(xí)能力。它每一步棋并不試圖窮舉所有的可能性,而是在當前的合理范圍內(nèi)尋找最佳方案。簡單的說,也就是它是圍繞你的出招來拆招的,它在學(xué)習(xí)你然后打敗你。
一直以來,人工智能(AI)有一種“圖靈測試”,如果AI的表現(xiàn)讓你感覺不到它是一個機器,那么它就是真正的人工智能了。而圍棋人工智能的工作方式,顯然比之前的任何一個人工智能程序表現(xiàn)的更像是一個“人”。
近年來,谷歌、Facebook、微軟、百度等大型科技公司都投入巨資組建人工智能研發(fā)團隊,專門研究深度學(xué)習(xí)技術(shù)。這些公司都在不遺余力地聘請這個小領(lǐng)域的頂尖專家,甚至經(jīng)常會相互挖角。
2014年,谷歌以大約5億美元的價格收購英國初創(chuàng)公司DeepMindTechnologies。2015年,谷歌開發(fā)可學(xué)習(xí)并自主控制視頻游戲人工智能系統(tǒng)登上《Nature》雜志的封面;Facebook則建立了一套方法,讓計算機向盲人描述圖像;微軟展示了一個新的Skype系統(tǒng),可以將一種語言自動轉(zhuǎn)化到另一種語言。
人工智能研究的成果并不局限于游戲,它的潛力在于現(xiàn)實應(yīng)用。比如,類似的軟件可以用來教AI計算機各種事,幫助他們更快速地學(xué)習(xí)新事物,例如醫(yī)療診斷學(xué),環(huán)境科學(xué),或經(jīng)改進的個人建議。
谷歌的迪恩將最新的AI能力發(fā)展比作進化。“我們正處于一個實際的進化過程中,好比以前的動物沒有眼睛,而現(xiàn)在他們有了。這將改變很多東西,計算機過去通常無法看得很清楚,而現(xiàn)在他們已經(jīng)開始睜開眼睛。”
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!