久热这里只有精-久热这里只精品99国产6_99-久热这里有精品-久热这里都是精品-久热这里-久热影视

 
當(dāng)前位置: 首頁(yè) » 行業(yè)資訊 » 機(jī)器人»AlphaGo并未攻克圍棋難題,人類未來(lái)仍有希望
   

AlphaGo并未攻克圍棋難題,人類未來(lái)仍有希望

 46.1K
     [點(diǎn)擊復(fù)制]
放大字體  縮小字體 發(fā)布日期:2017-05-24   來(lái)源:雷鋒網(wǎng)   瀏覽次數(shù):815
核心提示:  5月23日AlphaGo2.0版本在人機(jī)圍棋競(jìng)賽中以1/4子的微弱優(yōu)勢(shì)克服了柯潔,一方面持續(xù)彰顯了人工智能的壯大,但也讓人們對(duì)AlphaGo和人工智能有了新的熟悉。先說(shuō)出結(jié)論,再看剖析。  1.在圍棋這個(gè)項(xiàng)目上AlphaGo今朝

  5月23日AlphaGo2.0版本在人機(jī)圍棋競(jìng)賽中以1/4子的微弱優(yōu)勢(shì)克服了柯潔,一方面持續(xù)彰顯了人工智能的壯大,但也讓人們對(duì)AlphaGo和人工智能有了新的熟悉。先說(shuō)出結(jié)論,再看剖析。

  1.在圍棋這個(gè)項(xiàng)目上AlphaGo今朝走在了人類的后面,但并沒(méi)有完整霸占圍棋這項(xiàng)活動(dòng)。它只是經(jīng)由過(guò)程深度進(jìn)修找到了一個(gè)比人類熟悉更優(yōu)的解,但不是最優(yōu)解。最優(yōu)解沒(méi)法找到,即使用盡地球上一切的資本。從專業(yè)的角度來(lái)說(shuō),就是用深度進(jìn)修去切近親近了一個(gè)強(qiáng)化進(jìn)修中的價(jià)值斷定函數(shù),然后再跟蒙特卡洛搜刮樹(shù)聯(lián)合的辦法(詳細(xì)詳解可參看《鄭宇:一張圖解ALphaGo道理及弱點(diǎn)》,不再反復(fù))。既然人工智能和人類都不克不及找到最優(yōu)解,如今說(shuō)哪一方曾經(jīng)完整完全的掉敗還早。

  2. 人類也是在提高的,我們也不要低估了人類后天的疾速(小樣本)進(jìn)修才能,這點(diǎn)AlphaGo基于如今的進(jìn)修辦法還做不到。短時(shí)間來(lái)看人獲勝幾率小,但久遠(yuǎn)來(lái)看(將來(lái)5-10年)人還無(wú)機(jī)會(huì),由于人也有很強(qiáng)的進(jìn)修才能,可以從大批跟AlphaGo的棋戰(zhàn)的棋局中疾速進(jìn)修。而即使再給AlphaGo1億副棋譜,再添加一萬(wàn)塊GPU,假如照樣基于現(xiàn)有的進(jìn)修系統(tǒng),它提高的速度也終將放緩,由于新增的棋譜和盤(pán)算資本絕對(duì)于2x10171這個(gè)搜刮空間來(lái)講只是九牛一毫。我們對(duì)人腦的懂得還遠(yuǎn)不如對(duì)圍棋的熟悉,這外面還有很年夜的未知數(shù)。

  3. 今朝人類職業(yè)棋手跟AlphaGo的差距也就在一個(gè)貼目標(biāo)程度,沒(méi)有年夜家想象的那末年夜。其實(shí)這個(gè)貼目標(biāo)差距(按中國(guó)尺度7目半),退職業(yè)棋手看來(lái),曾經(jīng)長(zhǎng)短常年夜的差距了。許多職業(yè)高手,進(jìn)入官子階段后發(fā)明本身還落伍對(duì)方7-8目,就會(huì)自動(dòng)投子認(rèn)輸了。許多經(jīng)由過(guò)程數(shù)子來(lái)決議輸贏的競(jìng)賽,勝負(fù)常常都在1-2目之間(好比柯潔就輸給AlphaGo半目)。不然會(huì)被其他專業(yè)棋手笑話,本身落伍那末多都不曉得,點(diǎn)空才能太弱了。

  要能真正客不雅、精確的對(duì)待這個(gè)成績(jī)急須要較強(qiáng)的人工智能專業(yè)常識(shí),也須要必定的圍棋功底。上面先改正網(wǎng)上認(rèn)知的一些誤區(qū):

  誤區(qū)一:AlphaGo可讓人類頂尖棋手4個(gè)子,AlphaGo2.0可讓上一個(gè)版本4-5個(gè)子。

  要清除這個(gè)誤會(huì),起首要跟年夜家普及一下圍棋常識(shí):在圍棋里“讓對(duì)方兩個(gè)子”和“贏對(duì)方2個(gè)子”有著天地之別。這點(diǎn)關(guān)于下圍棋的人不消多說(shuō),但我明天才認(rèn)識(shí)到,許多吃瓜大眾一向認(rèn)為這就是一回事。難怪網(wǎng)上會(huì)傳播以上的毛病談吐。

  讓對(duì)方兩個(gè)子: 在圍棋里讓2子是說(shuō)讓一方先在棋盤(pán)上放上2個(gè)棋子(棋子只能放在星位),然后對(duì)剛剛開(kāi)端走。這兩個(gè)子在棋戰(zhàn)之初的價(jià)值偉大,關(guān)于專業(yè)棋手來(lái)說(shuō),每一個(gè)棋子價(jià)值至多在10目以上(這是最守舊估量了)。讓兩子相當(dāng)于至多先讓出去對(duì)方20多目標(biāo)地皮。因?yàn)槠灞P(pán)是無(wú)限的,假如不克不及在前面的競(jìng)賽中,在無(wú)限的空間里贏回這20多目,那就是讓子掉敗了。并且讓子數(shù)越多,被讓方取得的價(jià)值不單是線性增加的,由于子力之間會(huì)構(gòu)成合營(yíng),獲得更年夜的好處。好比說(shuō),讓四子,其價(jià)值便可能遠(yuǎn)不止40目了。

  贏對(duì)方2個(gè)子:是指兩邊下完后,贏的一方比輸?shù)囊环蕉喑?個(gè)子。假如依照吃住對(duì)方一個(gè)子算兩目標(biāo)辦法來(lái)算,那2個(gè)子只相當(dāng)于4目。AlphaGo贏了柯潔1/4子,就相當(dāng)于半目棋子罷了。

  所以“讓對(duì)方兩個(gè)子”和“贏對(duì)方2個(gè)子”弗成同年而語(yǔ)。假如真的有圍棋之神存在(既他必定能找到最優(yōu)解,我們?nèi)耸菦](méi)有愿望下過(guò)他的),普通頂尖專業(yè)棋手以為他們跟這個(gè)神的差距在讓2-3子之間。因?yàn)锳lphaGo可以被證實(shí)不克不及包管找到最優(yōu)解,所以他離神還有必定的間隔。是以,說(shuō)AlphaGo可讓人類頂尖棋手4個(gè)子,這的確就是天方夜談。

  誤區(qū)二:AlphaGo也會(huì)下出一些顯著欠好的招數(shù),是由于他自我斷定情勢(shì)占優(yōu),而抓緊了本身的請(qǐng)求。

  AlphaGo的搜刮戰(zhàn)略就是優(yōu)先對(duì)獲勝幾率比擬年夜的分支停止更多的深度搜刮,這個(gè)戰(zhàn)略在任什么時(shí)候候都不會(huì)轉(zhuǎn)變,也不克不及轉(zhuǎn)變。他不會(huì)認(rèn)為本身優(yōu)勢(shì)了就下出緩手。下得欠好的時(shí)刻是由于其價(jià)值斷定原來(lái)就是一個(gè)近似,并且搜刮空間也不克不及窮盡,得不到最優(yōu)解,是以,有時(shí)估量還不錯(cuò)的棋,其實(shí)紛歧定是真的最好的下法,AlphaGo涌現(xiàn)這類不穩(wěn)固狀態(tài)是正常的。這也是人類善存的愿望地點(diǎn)。固然人類也有本身的弱點(diǎn),如疲憊、情感動(dòng)搖等,人也會(huì)斷定掉誤。并且棋局很長(zhǎng),有些之前不太好的棋,經(jīng)由前面的變更(包含不是預(yù)感中的變更)有能夠會(huì)釀成好棋。所以,不是一切的毛病,都邑直接影響到競(jìng)賽的成果。并且如今年夜家仿佛有點(diǎn)怕AlphaGo了,即使是AlphaGo下出一招欠好的棋,年夜家更多的是疑惑本身的程度(是否是我們沒(méi)看懂啊?),而選擇信任AlphaGo的“深謀遠(yuǎn)慮“。

  誤區(qū)三:AlphaGo可以賡續(xù)自進(jìn)修,重新的棋局里獲得經(jīng)歷,疾速晉升本身。

  AlphaGo的體系因?yàn)閰?shù)異常多,須要年夜量的數(shù)據(jù)來(lái)練習(xí),新增的幾幅棋譜對(duì)進(jìn)步它的棋力起不就任何感化。并且AlphaGo在做參數(shù)調(diào)劑時(shí)是針對(duì)一年夜批數(shù)據(jù)的全體優(yōu)化,也必需對(duì)許多棋譜做批量處置,練習(xí)時(shí)光異常長(zhǎng),弗成能在很短時(shí)光內(nèi)年夜幅晉升本身的程度。即使是統(tǒng)一組練習(xí)棋譜,參數(shù)調(diào)劑辦法紛歧樣也會(huì)練習(xí)出棋力程度差別較年夜的體系。其實(shí)AlphaGo是經(jīng)由過(guò)程自我棋戰(zhàn)來(lái)生成許多棋譜,然后應(yīng)用棋譜中的(兩個(gè)持續(xù)的)盤(pán)面跟最初的輸贏對(duì)應(yīng)關(guān)系練習(xí)出價(jià)值收集來(lái)。這里只是借用了一下強(qiáng)化進(jìn)修的框架來(lái)練習(xí)深度神經(jīng)收集的參數(shù)罷了,重要進(jìn)獻(xiàn)照樣深度進(jìn)修的近似才能帶來(lái)的(處理了傳統(tǒng)強(qiáng)化進(jìn)修針對(duì)龐雜情況和舉措狀況沒(méi)法求解的困難)。是以,AlphaGo并沒(méi)有年夜家想象的那種自我博弈就可以本身賡續(xù)提高的才能。

  誤區(qū)四:AlphaGo會(huì)有意放水輸失落一局競(jìng)賽。

  這個(gè)沒(méi)有能夠。要想輸還不克不及輸?shù)哪悄┖每春惋@著,是一件異常難辦的工作,能夠比贏棋還要難。在模子練習(xí)好以后,AlphaGo可以或許暫時(shí)修改的只要在搜刮部門(mén)投入的資本若干(搜刮多年夜的空間)可以修改。縮減的太小,簡(jiǎn)直不會(huì)有太年夜變更,但假如縮減太多,就會(huì)下出一些異常初級(jí)的棋來(lái)。這點(diǎn)從技巧角度來(lái)說(shuō)很難掌握。

  誤區(qū)五:盤(pán)算機(jī)的盤(pán)算才能必定比人強(qiáng),所以不要去跟AlphaGo比盤(pán)算,應(yīng)當(dāng)把局勢(shì)簡(jiǎn)略化,防止龐雜的戰(zhàn)役。

  AlphaGo依附的是一種基于樹(shù)的搜刮算法,碰到龐雜局勢(shì)搜刮空間變年夜,對(duì)將來(lái)勝負(fù)的價(jià)值斷定也會(huì)變難。是以,人算不外來(lái)的龐雜局勢(shì),對(duì)AlphaGo來(lái)講也很艱苦。假如局勢(shì)太簡(jiǎn)略,機(jī)械可以異常好的盤(pán)算出比擬優(yōu)的解,人類棋手加倍沒(méi)有愿望。是以,把局勢(shì)弄龐雜,人類棋手才有愿望獲勝,固然這個(gè)對(duì)人類也提出了更年夜的挑釁。

  總結(jié)

  基于人類今朝對(duì)圍棋的熟悉和懂得,現(xiàn)階段依然會(huì)輸給人工智能。我其實(shí)不是認(rèn)為柯潔有愿望可以或許博得前面的競(jìng)賽,但人類也在提高,經(jīng)由過(guò)程跟AlphaGo的棋戰(zhàn),人類也在從新熟悉圍棋。只需人類的思惟和文明在賡續(xù)提高,人就有能夠在將來(lái)5-10年里經(jīng)由過(guò)程賡續(xù)的進(jìn)修遇上以后的AlphaGo。固然,AlphaGo也會(huì)提高,但它還不是圍棋之神,也沒(méi)有霸占圍棋這個(gè)困難。假如現(xiàn)有的進(jìn)修辦法沒(méi)有周全的改革,其提高的速度也會(huì)漸漸放緩。基于此斟酌,人類還會(huì)無(wú)機(jī)會(huì)。當(dāng)人們對(duì)圍棋有了更深刻的懂得以后,又會(huì)設(shè)計(jì)出更好的人工智能算法。二者其實(shí)其實(shí)不抵觸,相反相成,相互增進(jìn),不論誰(shuí)輸誰(shuí)贏都是人類文明提高的表現(xiàn)。人類的智能也將一直走在機(jī)械的后面,而不會(huì)被機(jī)械代替。

 
 
 
[ 行業(yè)資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關(guān)閉窗口 ]
 
 
展會(huì)更多+
視頻更多+
點(diǎn)擊排行
 
網(wǎng)站首頁(yè) | 網(wǎng)站地圖 | 排名推廣 | 廣告服務(wù) | 積分換禮 | 網(wǎng)站留言 | RSS訂閱
主站蜘蛛池模板: 国外成品精品1688 | 色老头oldmoneyvideos| 成人精品mv视频在线观看 | 2021国产麻豆剧传媒剧情最新 | 国产精品视频第一区二区三区 | 日韩制服丝袜在线观看 | 美日韩一区二区三区 | 18岁的老处女 | 我的青梅竹马是消防员2季未增删免费 | 精品国产91久久久久久久 | 猛男壮男受bl爽哭了高h | 60岁妇女毛片免费观看 | 欧美高清国产 | 欧美区一区 | 国产另类视频一区二区三区 | 美女扒开奶罩让男人吃奶 | 希岛爱理aⅴ在线中文字幕 午夜综合网 | 国四虎影永久 | 免费观看欧美性一级 | jzzjlzz亚洲乱熟在线播放 | 国产亚洲综合成人91精品 | 精品视频免费在线观看 | 美国艳星lisann成人作品 | 和两个男人玩3p好爽视频 | 富士av105 | 日韩免费视频一区 | 800精品国产导航 | 亚洲欧美自偷自拍另类小说 | 欧美草逼网 | 精品久久久久久亚洲 | 成人啪啪漫画羞羞漫画www网站 | 亚洲 日韩 自拍 视频一区 | 午夜亚洲国产 | 日韩一卡2卡3卡新区网站 | 精品国产欧美一区二区五十路 | 亚洲123区| 高清毛片一区二区三区 | 男人在线影院 | 91果冻制片厂天美传媒 | 翁熄性放纵交换300章 | 国产卡一卡二卡3卡乱码免费 |