AlphaGo背後的男人和公司有些逆天,AlphaGo對戰世界第一柯潔

21世紀是見證變革的時代,很幸運見證者裡有你我

新一季的人機大戰即將在5月的烏鎮打響,升級後的AlphaGo 對戰世界第一圍棋高手柯潔九段。在普遍認知中:人類在這場對弈中的失敗 是“注定的”。這會是影視劇中人工智能消滅人類的起點嗎?作為“AlphaGo之父”的 深度思維公司的創始人 哈薩比斯 是個怎樣的人?他和他的公司又有怎樣的終極目標?

AlphaGo背後的男人和公司有些逆天,AlphaGo對戰世界第一柯潔

雖然AlphaGo給我們帶來了極大的震撼,但也不是不可戰勝的。我抱著必勝的信念而來,絕不會說人機大戰勝負無所謂這樣的話,我會全力以赴,爭取打破AlphaGo的不敗戰績! ”4月10日,20歲的圍棋天才,被認為當今全球人類圍棋第一人的柯潔九段在新聞發布會上說。

一年前,世人共同見證了人工智能領域的一個重大里程碑: AlphaGo戰勝了傳奇圍棋選手李世石。

事實上,人工智能的加入並沒有像一些人所擔心的那樣使這項遊戲式微,反而讓人類棋手變得更加強大而富有創造力。儘管圍棋可能是歷史上被研究、推敲得最為透徹的一項遊戲,許多職業棋手以及業餘愛好者仍然是通過對AlphaGo創新著法的深入研究,學到了嶄新的知識和策略。

“AlphaGo下棋讓人感覺更自由一些,沒有什麼著法是完全不能下的。現在大家都更多地在嘗試以前沒有下過的一些下法。”周睿羊九段曾表示。

此次“中國烏鎮·圍棋峰會”旨在通過頂尖人類棋手與極具創造性的人工智能對手之間的合作,使人們得到關於圍棋和人工智能的更多新啟示。

據主辦方介紹,此次峰會特別設計了AlphaGo與中國頂尖棋手的三種比賽形式,具體包括:首先,人機配對賽:中國職業棋手將與另一名職業棋手對弈。每一方棋手都將有AlphaGo作為自己的隊友與他們交替落子,真正體現共同學習的真諦。

其次,團隊賽:由五位中國頂尖棋手組隊與 AlphaGo進行對弈,共同測試 AlphaGo在面對組合風格時所展現的創造力和適應性。

第三,柯潔對陣 AlphaGo:AlphaGo 與世界排名第一的棋手柯潔進行的三番棋對弈將成為萬眾所矚目的焦點。柯潔會將 AlphaGo的能力推向甚至超越極限。

柯潔是金立智能手機的品牌文化大使。金立認為,圍棋,並不在於計較一子一目的得失,更需要放眼全局的取捨和戰略,是一種長距離的“超級續航”般的較量。圍棋表達了一種靜默的思考,充滿了寵辱不驚的氣度,是人類智慧的傑作。圍棋人工智能的最高水平與人類最高水平之間的對決,比賽本身的意義就已非同凡響。人工智能代表著科技的未來,也是人類的未來,人機之戰,是人類智慧的延伸,是人類對極限、對未來的一次勇敢探索。金立支持柯潔勇戰AlphaGo。

除動人心魄的比賽之外,峰會還將舉辦一場有關人工智能未來的論壇。來自人工智能的頂尖專家將共同探索AlphaGo如何為圍棋這項古老的遊戲帶來了全新的認知,並進一步探討人工智能與機器學習是如何幫助人類為世界上一些重大難題帶來解決方案。

據介紹,AlphaGo背後的部分機器學習方法已經被應用到實際生活中,並在一些重大問題中發揮了作用,比如減少能源使用。機器學習技術也已經開始應用於一系列醫療研究項目中。

AlphaGo是什麼?

AlphaGo 是第一個擊敗人類職業圍棋選手、第一個戰勝世界冠軍的電子計算機程序,是圍棋史上最具實力的選手之一。 2016 年 3 月,在全世界超過一億觀眾的關注下,AlphaGo經過5局對弈,最終以 4 比 1 的總比分戰勝了圍棋世界冠軍李世石,這場比賽成為了人工智能領域的一個重要里程碑。過去曾有專家預測,人工智能需要十年的時間才可能戰勝人類職業選手,在這場比賽后,AlphaGo憑藉其“充滿創意而又機智”的下法,躋身圍棋界最高職業稱號——職業九段行列,成為歷史上首個獲得這一榮譽的非人類棋手。近期,AlphaGo的升級版本以"Master / Magister"的稱謂與世界頂級的圍棋選手進行了60場線上快棋賽,並取得了全勝的出色戰績。

AlphaGo如何訓練?

一直以來,圍棋就被認為是傳統遊戲中,對人工智能而言最具挑戰性的項目。這不僅是因為圍棋包含了龐大的搜索空間,更是因為對於落子位置的評估難度已遠遠超過了簡單的啟發式算法。為應對圍棋的複雜性,AlphaGo採用了一種新穎的機器學習技術,結合了監督學習和強化學習的優勢。通過訓練形成一個策略網絡(policy network),將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分佈。然後,訓練出一個價值網絡(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。這兩個網絡自身都十分強大,而 AlphaGo將這兩種網絡整合進基於概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。最後,新版的AlphaGo 產生大量自我對弈棋局,為下一代版本提供了訓練數據,此過程循環往復。

AlphaGo 如何決定落子?

在獲取棋局信息後,AlphaGo 會根據策略網絡(policy network)探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在分配的搜索時間結束時,模擬過程中被系統最頻繁考察的位置將成為 AlphaGo 的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,AlphaGo的搜索算法就能在其計算能力之上加入近似人類的直覺判斷。

 

网友评论5

  1. 5楼
    nvikicom:

    21世纪是见证变革的时代,很幸运见证者里有你我

    2017-04-18 下午3:04 [回复]
  2. 4楼
    nvikicom:

    终结者啊!

    2017-04-18 下午3:04 [回复]
  3. 地板
    nvikicom:

    智能革命??

    2017-04-18 下午3:05 [回复]
  4. 板凳
    匿名:

    片尾听得起鸡皮疙瘩,震撼!

    2017-04-18 下午3:05 [回复]
  5. 沙发
    匿名:

    天才的世界

    2017-04-18 下午3:06 [回复]

发表评论

表情
还能输入210个字