久热这里只有精-久热这里只精品99国产6_99-久热这里有精品-久热这里都是精品-久热这里-久热影视

 
當前位置: 首頁 » 行業(yè)資訊 » 機器人»經(jīng)過一年的修煉,AlphaGo的哪些能力突飛猛進了?
   

經(jīng)過一年的修煉,AlphaGo的哪些能力突飛猛進了?

 46.1K
     [點擊復制]
放大字體  縮小字體 發(fā)布日期:2017-05-24   來源:雷鋒網(wǎng)   瀏覽次數(shù):602
核心提示:  烏鎮(zhèn)圍棋峰會第一局曾經(jīng)停止了,用時4個半小時,以柯潔九段執(zhí)黑負于 AlphaGo,AlphaGo 贏四分之一子了結,如許河清海晏的成果想必許多人都猜測到了,不外年夜家從一開端就曉得存眷的重點,不在于柯潔怎樣輸?shù)模?/div>

  烏鎮(zhèn)圍棋峰會第一局曾經(jīng)停止了,用時4個半小時,以柯潔九段執(zhí)黑負于 AlphaGo,AlphaGo 贏四分之一子了結,如許河清海晏的成果想必許多人都猜測到了,不外年夜家從一開端就曉得存眷的重點,不在于柯潔怎樣輸?shù)模茿lphaGo曾經(jīng)退化到甚么水平了,間隔Deep Mind團隊出論文來詳解AlphaGo有多強還有一段時光,So我們其實可以從現(xiàn)場不雅戰(zhàn)中來看出一些眉目。

  棋速

  第一局棋下到一半的時刻,很多棋友群里的人沸騰了,發(fā)明AlphaGo落子速度異常快,每步棋落子速度在30S-40S之間動搖,對此圍棋專業(yè)5段趙先生表現(xiàn):“(這局棋)像安泰逝世,不知不覺就輸了,(比擬客歲)機械落子飛快但毛病根本沒有”。

  綜合整局,AlphaGo落子表示沉著、武斷,而柯潔的落子狀態(tài)較多變。終究在競賽停止了四個多小時以后,AlphaGo贏四分之一子。

  棋風

  AlphaGo1.0的時刻(客歲3月跟李世石對戰(zhàn)的時刻),它的棋風歸納綜合起來就是善于記住棋譜+加強進修+盤算才能,身上還能看到人類棋風的影子,等AlphaGo喬裝成Master60連勝的時刻,很多圍棋年夜師包含聶衛(wèi)平在內(nèi)開端評價其棋風“很難忖度Master的作風……它永久都沒有臉色,永久不受情感影響,永久一個節(jié)拍,就是要贏你。”而明天,第一局棋還沒停止的時刻,搜狗王小川已在知乎上發(fā)文分析AlphaGo2.0 棋風“完整離開人類經(jīng)歷”——“而AlphaGo2.0離開了機械對人模擬,走棋作風也將完整離開人的定式。在與柯潔的競賽中,會賡續(xù)涌現(xiàn)我們意想不到的走棋,并且這些走棋在教科書中會被以為是初級毛病或許完整弗成理喻,凡是一個正常的棋手都不會這么玩,凡是一個老手這么玩都邑被點撥如許紕謬。而AlphaGo2.0會賡續(xù)制作如許的局勢,癥結他照樣對的。”

  不外最初照樣柯潔說了算,他在會后的采訪頂用了一個很好的例子解釋了AlphaGo的棋風莫測:(在回想競賽時也對第54手的斷)時,他表現(xiàn)了確定:“很震動,這在人類的下法中是不克不及有的。在斷以后,它把本身的腳步實地化,變得更厚,一舉兩得。”。

  算法

  AlphaGo1.0的時刻(客歲3月跟李世石對戰(zhàn)的時刻)應用的算法精華,依據(jù)FB田淵棟看完Nature論文的解讀,由估值收集評價棋局,戰(zhàn)略收集選擇落子,疾速走子(Fast rollout)恰當加快,再用蒙特卡羅樹搜刮把以上這三個部門連起來,構成一個完全的體系。

  這一次固然知乎服裝論壇t.vhao.net等活潑地皮曾經(jīng)開端紛紜推想此次的AlphaGo2.0用了甚么牛叉的算法,有了硬件的猜測掉誤,本相照樣等Deep Mind前面來親身頒布,目測算法猜測這個要依據(jù)它的單機版10個GPU+TPU助力猜測比擬靠譜。

  硬件需求下降

  依據(jù)DeepMind員工揭橥在2016年1月Nature期刊的論文,散布式版本(AlphaGo Distributed)應用了1202個CPU和176個GPU。

  不外此次競賽AlphaGo用的何種硬件設置裝備擺設,DeepMind在會后的消息宣布會中表現(xiàn),此次競賽的AlphaGo是新版本,它改良了新的算法,重要提高是盤算量少了十倍,自我棋戰(zhàn)更強。Hassabis稱,在競賽中法式是在一個單一的機械上運作的,這與客歲紛歧樣,其時是散布式的。此次有更壯大的算法,運作起來更簡略也更好,取得的速度更快。別的Hassabis表現(xiàn),盤算力可以“在Google云中取得,用的是TPU,十個處置單元,少了十倍的盤算量”。簡略點說,此次的AlphaGo是單機版。

  迭代速度

  哈薩比在此鏈接中的劍橋年夜學的一次演講中提到,之前從零練習一個AlphaGo要三個月,如今只須要一個禮拜(“We also optimized the performance. It used to take 3 month to train a new version of AlphaGo from scratch. Now we can do it in one week.”)。

  假如稱對戰(zhàn)李世石時代的版本為V18迭代版本,喬裝成Master60連勝并宣告進級完成的時辰為V25版本,如今的AlphaGo又是V若干版本,練習的時刻會不會一周都不要了?這是我們今天要親身問DeepMind團隊的。

  從單人對戰(zhàn)到團隊對戰(zhàn)

  心細的同伙確定留意到了,柯潔和AlphaGo棋戰(zhàn)以外,5月26號上午還有一場配對賽,配對賽兩邊---古力+AlphaGoV連笑+AlphaGo,即棋戰(zhàn)兩邊分離由一名棋手與AlphaGo構成,棋手與AlphaGo協(xié)作停止競賽。5月26號上午下晝則是陳耀華,周睿羊,羋昱延,時越,唐韋星和AlphaGo的5對1團隊賽。

  Google之所以敢如許設置賽制,獨一的說明就是,AlphaGo如今既懂人類下圍棋的那部門,又懂AI下圍棋的那部門,并可以做到融合貫穿,所以它才敢挑釁配對賽這類跟另外一個錯誤高度合營的賽制,又敢挑釁測試本身“戰(zhàn)役力”極限的集團賽。AI最恐怖的部門不是它單個力氣有多強,而是它開端理解和方圓“互動”,如許的融匯是否是比客歲3月的人機年夜戰(zhàn)恐怖多了呢?

  小結:

  前次AlphaGo喬裝成Master測試的時刻,柯潔曾經(jīng)落敗給Master過一次,他不是沒見識過AI圍棋的兇猛,但聯(lián)合柯潔明天在現(xiàn)場的沉著表示,和他昨晚莫明其妙地深夜感嘆,我們有來由信任,這不是一場比AI圍棋選手和人類圍棋選手哪一個更兇猛的選手,DeepMind團隊必定有些懸而未決的謎底須要這場競賽給一個確定的驗證,然后再往誰人偏向完成更深一步的摸索。

 
 
 
[ 行業(yè)資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關閉窗口 ]
 
 
 
主站蜘蛛池模板: 91在线视频免费观看 | 欧美精品v欧洲高清 | 69天堂网| 91久久国产成人免费观看资源 | 国产小视频在线免费 | 好男人影视社区www在线观看 | 我的妹妹最近有点怪在线观看 | 91视频破解 | 国产图色 | 国产区成人综合色在线 | 国语自产拍在线播放不卡 | 乌克兰13一14娇小 | 日韩欧美视频二区 | free哆拍拍免费永久视频 | chinese国产打屁股 | 四虎影视在线观看永久地址 | 亚洲va在线va天堂va偷拍 | 色导行| 别停好爽好深好大好舒服视频 | 国产网站免费观看 | 亚洲AV午夜福利精品香蕉麻豆 | 色噜噜视频影院 | 精品久久久久久亚洲 | 91入口免费网站大全 | avtt天堂在线 | 啪啪无尽3d动漫漫画免费网站 | 久久永久免费视频 | 欧美国产日本精品一区二区三区 | 韩国三级理韩国三级理人伦 | 激情视频在线播放 | 午夜宅男宅女看在线观看 | 男女爆操| 天堂中文在线免费观看 | 国产精品福利在线观看免费不卡 | 俄罗斯处女 | 羞羞色男人的天堂伊人久久 | 国产精品亚洲精品日韩已方 | 亚洲色图二区 | 香蕉成人国产精品免费看网站 | 美女把小内内脱个精光打屁屁 | 色综合视频一区二区三区 |