「アルファ碁」を育てた人工学習知能「DQN」の正体



羊山(ひつじやま)というところに行ってきました。埼玉県の秩父方面です。
芝桜がなんとも綺麗です。
e0143416_2175371.jpg



e0143416_2185127.jpg



e0143416_2110297.jpg

興味深い文章があったので、引用させていただきます。
ちょっと長いけど、なかなか面白いと思います。

3月にソウルで、100万ドルを懸けて人間対人工知能の囲碁対局が行われ、結果は人工知能アルファ碁が、韓国人九段プロ棋士に4勝1敗で勝ち越し、囲碁界のみならず各方面に大きな衝撃が走りました。
この対局の前にも、昨年10月、アルファ碁は中国出身の欧州チャンピオン棋士と対戦し、5戦全勝しています。
5戦全敗した中国棋士は二段なのに対し、韓国棋士は九段で文句なしの世界トップクラス棋士です。
「魔王」とも呼ばれ、定石にとらわれない独創的かつ攻撃的な棋風で知られている彼が、「無力な姿を見せて申し訳ない」と肩を落としたそうです。

アルファ碁を開発したのは、2011年に設立された英国の人工知能ベンチャー「ディープマインド」です。
ディープマインドは、グーグルとフェイスブックとの間で買収合戦となり、14年にグーグルに買収されました。
買収金額は5億ドル以上。
天才創業者デミス・ハサビス氏の獲得が目的とされたが、グーグルの期待通り、ディープマインドは、機械学習と脳神経科学を応用した画期的な汎用学習アルゴリズム「DQN」(Deep Q-Network)を発表し、世間を驚かせました。
このDQNをもとに、アルファ碁が作られたそうです。

なんでこんなことを書いているかと言うと、実は私、人工知能にはものすごく興味があるからです。

YouTubeを検索すると、ブロック崩しゲームの元祖である「ブレイクアウト」を、DQNにプレーさせている様子を撮影した動画が見つかります。
最初はまったくの初心者レベルだった状態から、数時間で自己学習しながらみるみる上達していく様子がわかります。
あげくには、DQNの設計者も知らなかったゲーム攻略法を自ら編み出してしまいます。
「スペースインベーダー」をプレーさせている動画もあります。
初めはすぐにやられてしまいますが、回数を重ねるうちにどんどんコツをつかんで、最終的には無駄な弾撃ちをすることなく、ハイスコアをたたき出すようになります。

米コンピューター大手IBMのチェス専用ソフト「ディープブルー」がチェスのチャンピオンに勝ったのは1997年のことでした。
将棋でも既にコンピューターがプロと互角以上の実力を持つに至っています。
しかしこれらは、可能性のある局面をすべて計算し、最適な一手を探すという高度な力技のプログラムです。
盤面が広く打ち手の選択肢がはるかに膨大な囲碁は情報ゲームの最高峰といわれ、このような手法では当面攻略は不可能です。
そこで、アルファ碁は、人間と同じように、対局を重ねるたびに自己学習しながら強くなっていく人工知能として作られました。
囲碁でコンピューターが人間に勝てるようになるのはまだ10年先と言われていたので、今回の勝利は、人工知能研究を軽く10年は前倒しした快挙とも言えるものです。

かつて日本は82年から92年にかけて、「第5世代コンピューター」と銘打ち、国家プロジェクトとして人工知能研究を推進した歴史があります。
意欲的なプロジェクトでしたが、世間的な評価は失敗だったそうです。
先行者優位性を生かせないまま時代は変わり、「深層学習(ディープラーニング)」が登場して、人工知能研究は完全に世代が代わりました。
今はこの分野でもインターネットを制したグーグルが圧倒的な競争優位に立ち、ディープマインドの獲得をはじめ、世界中から天才を集めています。
ロンドン出身のハサビス氏は、76年生まれのいわゆる「76世代」。
第1世代のIT起業家を多く輩出した世代とされています。
4歳でチェスを始め、幼くして「史上最優秀なチェスプレーヤー」と評されるほど頭角を現しました。
2年飛び級でケンブリッジ大学を卒業後、ゲーム会社を設立して一定の成功を収めています。
その後、人工知能の研究を開始。
2005年にロンドン大学の博士課程へ進学し、「人工知能の研究には人間の脳の研究が必須」と考え、脳神経科学の研究を始めた。
脳神経科学の分野でもすぐに才能を開花させ、高い評価を受けている。
ハサビス氏とディープマインドは、買収された後も引き続きロンドンに拠点を構えています。
現在220人ほどの人員を抱え、その4分の3が基礎研究、残りをグーグルのサービスとの連携のために配置しているそうです。
ハサビス氏は「同社の人工知能技術は、YouTubeのリコメンド機能、アンドロイド端末のボイスサーチ機能などに活用できる」と語っており、今後数年のうちにグーグルの検索エンジンをはじめとする多様なサービスに取り込まれていくことになるだろうということのようです。

グーグルは最近、14台のロボットアームそれぞれが、自己学習で同時並行的に課題を習得していく様子を記録した映像も公開しています。
熟練の技など、人間が何年もかけて習得する動作も、ロボットの自己学習で短期間に習得が可能であることを示しています。
一方で、先日、マイクロソフトがTay(テイ)という人工知能をツイッターに登場させましたが、悪いことを教え込む人たちが続出して、様々な差別発言や暴言を吐くようになり、登場後間もなく休眠になるという出来事がありました。
「良い人工知能」も「悪い人工知能」も、教育する人間や環境次第ということを暗示しています。

ディープマインドに出資もしていたテスラの創業者イーロン・マスク氏は「人工知能は悪魔を呼び出すようなもの」と述べており、英国の著名宇宙物理学者スティーブン・ホーキング博士も「人工知能の進化は人類の終わりを意味する」と発言して、過熱する人工知能開発の行方に警鐘を鳴らしています。
人工知能が人類の知能を上回り、人間の生活を変えてしまう「技術的特異点(シンギュラリティー)」を迎えるとされる2045年問題は、ファンタジーの世界だけの話ではなくなり、日々現実味を増してきているということですね。
[PR]
by ll23910 | 2016-04-24 21:15 | Trackback | Comments(2)
トラックバックURL : http://longno.exblog.jp/tb/24328114
トラックバックする(会員専用) [ヘルプ]
※このブログはトラックバック承認制を適用しています。 ブログの持ち主が承認するまでトラックバックは表示されません。
Commented by ゴチ at 2016-04-25 17:48 x
世界中の天才集めにかかったグーグルの野望ですがAIの暴走をどうやって止めるのかがキーになりそうです。自動運転でもグーグルとトヨタが主導権争いをしている様です。「人工知能は悪魔を呼び出すようなもの」と言うイーロン・マスク氏のテスラも自動運転実証車を走らせています。日本も中国以外の天才を集めAI研究させたいものです。W
Commented by ロング at 2016-04-25 20:13 x
ゴチさんへ

AIが進化すれば、本当に人間を滅ぼす時代が来るのかもしれません。
多分その時まで、我々世代は生きていられないでしょうが。
また、そのときが来れば、AIに滅ぼされないようきっとその上を行く人類の素晴らしい知恵が発揮されて、AIを支配していると思います。
<< 世界遺産の京都仁和寺で過重労働... 舛添知事の海外豪遊無駄遣い >>