阿爾法狗(AlphaGo)是由谷歌旗下DeepMind公司開發(fā)的人工智能程序,專為圍棋這項(xiàng)古老而復(fù)雜的棋盤游戲設(shè)計(jì)。其誕生源于一個(gè)宏偉目標(biāo):攻克被視為人工智能“圣杯”的圍棋,因?yàn)槠渚薮蟮目赡苄钥臻g(遠(yuǎn)超國(guó)際象棋)曾被認(rèn)為機(jī)器在可預(yù)見的未來(lái)難以超越人類。 2015年10月,阿爾法狗首次以5:0擊敗歐洲圍棋冠軍樊麾,這是AI首次在公平比賽中戰(zhàn)勝職業(yè)棋手,已引發(fā)關(guān)注。但真正將其推向世界舞臺(tái)中心的是2016年3月與韓國(guó)傳奇棋手、世界冠軍李世石九段的五番棋對(duì)決。賽前,多數(shù)專家認(rèn)為李世石將輕松取勝。然而,阿爾法狗展現(xiàn)出驚人的策略深度和創(chuàng)造性,尤其在系列賽第二局第37手走出的“五路尖沖”等招法,被職業(yè)棋手形容為“來(lái)自上帝的一步”或“非人類”的著法。最終,阿爾法狗以4:1獲勝,這場(chǎng)勝利被《科學(xué)》雜志評(píng)為年度突破,象征著AI在需要直覺和復(fù)雜決策的領(lǐng)域取得了歷史性突破。 2017年,升級(jí)版阿爾法狗(AlphaGo Master)在網(wǎng)絡(luò)快棋賽中連勝包括世界排名第一的柯潔在內(nèi)的數(shù)十位頂尖高手,隨后在烏鎮(zhèn)以3:0完勝柯潔。賽后,柯潔感慨阿爾法狗“接近圍棋上帝”。此后,DeepMind推出了更強(qiáng)大的AlphaGo Zero,它僅通過自我對(duì)弈學(xué)習(xí),無(wú)需人類數(shù)據(jù),短短幾天內(nèi)就超越了所有先前版本,展現(xiàn)了強(qiáng)化學(xué)習(xí)的巨大潛力。 阿爾法狗的核心技術(shù)結(jié)合了深度神經(jīng)網(wǎng)絡(luò)(價(jià)值網(wǎng)絡(luò)和策略網(wǎng)絡(luò))與蒙特卡洛樹搜索。它通過分析數(shù)百萬(wàn)人類棋譜進(jìn)行監(jiān)督學(xué)習(xí),再通過自我對(duì)弈進(jìn)行強(qiáng)化學(xué)習(xí),不斷優(yōu)化策略。其成功不僅在于贏得比賽,更在于它探索出了圍棋的新知識(shí),甚至顛覆了部分千年來(lái)的傳統(tǒng)定式,推動(dòng)了圍棋理論的發(fā)展。 阿爾法狗的遺產(chǎn)遠(yuǎn)不止于圍棋。它證明了深度強(qiáng)化學(xué)習(xí)在解決復(fù)雜序列決策問題上的有效性,其技術(shù)框架被廣泛應(yīng)用于其他領(lǐng)域,如蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)(AlphaFold)、醫(yī)療診斷、能源優(yōu)化等。它引發(fā)了全球?qū)θ斯ぶ悄軅惱怼⑽磥?lái)人機(jī)關(guān)系以及人類智能本質(zhì)的廣泛討論,正式開啟了人工智能的新時(shí)代。
鴻翔影院