目の前には私の知らない世界があった。
幼い頃から歩きなれた道。
何も考えずに、目的地までたどり着ける、そんな道行き。
ゴールは、勝利。
それが私の囲碁だった。
最初の角を曲がれば、右手には、林。
直進すれば、突き当りにY字路があり、学校に行きたいなら、左に進むのが正解だ。
私は考えずに体が学校へ向かうように、最善手を打つことができた。
ところがどうだ。
Y字路を曲がった先には、洞窟があった。
いつもとの違いに戸惑いながらも、私は果敢に、中へと足を踏み入れた。
真っ暗だ。
暗闇だ。
深淵だった。
先に何があるのか。
私には何もわからなくなってしまった。
そして、私は囲碁を引退した。
AIには勝てない:囲碁世界一イ・セドル引退
ということで、ぼくです。
囲碁といえば、テーブルゲームで一番複雑なゲームとして有名です。
それゆえにAIがプロに勝利できるようになるのはまだまだ遠い未来だと言われていました。
そう考えると、同じテーブルゲームでも、チェスなんかは1980年代にはすでにAIが勝っていたりしてやってない人間からすると似たように感じらえるものでも、実際は大きな違いがるようです。
元々コンピュータは網羅的にすべてを考えることが得意で、そういう網羅的検証は、一手ごとのパターンが少ない方が実施しやすいわけですよね。
ちなみに、それぞれ代表的なテーブルゲームの1手ごとのパターンは以下の通りです。
チェス:10の120乗
将棋:10の220乗
囲碁:10の360乗
うん、数字が大きすぎてまったくわからん。
ともあれ。
人間の脳ってのはどういうわけか、それだけあるパターンの中から、短時間で最善手を見つけ出すことができる人がいるわけで、それがプロなわけですね。
で。
世界チャンピョンはそのプロの中でもトップなわけで、まだ科学的に理屈が解明できない領域の直感力があるわけです。
どうやってその答えに行き着いたか、本人でも言語化できないくらいに。
そんな人間にAIが勝ることができるには、新しい技術革新があったからです。
結果、人間は、テーブルゲームでAIに絶対に勝てないようになりました。
それを誰より痛感したのが、囲碁の世界チャンピョンであるイ・セドルで、もう囲碁の道を極めるということに虚しさを覚えてしまったんでしょうね。
だって、どんなにがんばったって、絶対に勝てない相手がいるわけですから。
しかも、負けるはずがない、とおもっていた相手にです。
漫画とかでよくあるシーンですが、筋骨隆々のプロレスラーみたいな巨漢の男が、小学生のような小さな男の子に簡単に投げ飛ばされる、みたいなもんですよね。
だいたいの場合、その男の子が主人公なわけで、プロレスラーのその後を追うことはないわけですから、プロレスラーの気持ちをなかなか想像しすらしなかったですが、こう考えてい見ると、彼らももうプロレスラー(とは限らないが)をやめているかもしれませんね。
筋トレをやめてしまっているかもしれませんね。
だって、意味ないんですから。
で。
なんでそんなことになってしまったかというと技術革新の話に戻ります。
- 機械学習
- ディープラーニング
- 強化学習
機械学習という技術にディープラーニングという手法が加わって、強化学習できるようになったため、人間は勝てなくなったということになります。
それではそれぞれについて見ていきましょう。
AIには勝てない:機械学習とディープラーニングと強化学習
機械学習は一定のアルゴリズムを基に、マシンが学習するものです。
よく話に上がるチャットボットこと人工無脳くん(あるいはちゃん)は、機械学習するけれど、ディープラーニングも強化学習もしないんです。
対話に対して、Aと聞かれたらXと答える、Bと聞かれたらYと答える。どちらでもなければZと答える、などと、チャットボットの先生に人がなる必要があるんですね。
これは学習コストが非常に高くて、あまり実用的でなく、実用的なレベルにしようとすると物凄いお金と時間がかかります。
これを教師あり学習。なんて言ったりするんですが、ほら、予備校とかも高いじゃないですか。
人にものを教えるのって大変ですし、受験生がいくら勉強したとしても、なかなか予備校教師ほどの知識を身に付けることできないですよね。
なので、教師が例えば、プログラマなわけですけど、その人たちが、どんなに昔の記譜を読むにしても、読まないにしても、プロの棋士に勝てるわけもなく、そんな教師に教わって学習し続けても、プロに勝てるわけもなかったわけです。
で。
ディープラーニングっていう仕組みが生まれてから、画期的に進化しました。
すごく簡単にいうと、教師、いらなくなったわけです。
*厳密には違いますけど、わかりやすくそう定義します。
さっきみたいに、ほら、なんですか、ぼくらって先生に答え合わせしてもらってたじゃないですか。
あれが教師ありですね。
それが、ディープラーニングになると、データから勝ってに自分で特徴を拾って理解することができるようになるんですよ。
たまにいるじゃないですか。
そういう出来のいいやつ。
1教えたら10覚えるってやつですね。
基礎を教えたら、勝手に応用できちゃうやつです。
で。
それが1教えて100理解するレベルになると、天才っていわれるのかもしれません。
そして、AIはそれを、1000にも100000にも10000000にもして理解できてしまうってわけです。
人間は基本マルチタスク! とかいう人いますけど、シングルタスクなんです。
だから、マジックのミスディレクションに引っかかってしまうわけですが。
ただ、AIの場合は、違います。
マルチタスクもマルチタスク。いくらでもハードウェアの費用が許す限り、ソフトウェアの性能が許す限り、並列処理できます。
つまりは、ジャンプで連載していた人気漫画「Naruto」の主人公と同じです。
「知らんがな」
という人のために、簡単に説明すると、Narutoの主人公ことうずまきナルトは、影分身っていう忍術が得意なんですよ。
自分の分身を大量に作る忍術です。
で。
彼のチートなところは、その分身した状態で修行をこなすことで、分身体の経験も本体に渡すことができる、ってことだったわけですね。
汚い! 忍者汚い!
というわけですが、それを現実の世界でできてしまうのが、AIなわけです。
5時間対局するとして、人間には一日24時間しかないわけですから、一睡もしなくても、5戦できるかできないか、じゃないですか。
しかも、そんなに気張ってやればやるほど、学習効率は下がります。
しかし、AIは、違います。1日に5時間の相当する対局を何十、何百、何千、何万だって学習できます。
また、学習効率だって、品質だって、1局目も53万局目も変わらないです。どころか、強くなっていることでしょう。
そして、機械学習の話に戻りますが、教師ありの場合、仮に53万局対戦を行ったとしたら、テレビで見たことありますかね? 感想戦ってやつ。
あのときどうしてたらよかったのか。
みたいなことをお互いに検証し合うってことをするんですけど、それをAIが53万局打てたとして、人間がレビューできないじゃないですか。
それを解決してしまったのが、強化学習です。
人間も学習と報酬系って脳の分野ですけどの関係性が強いことは研究でわかってますが、ドーパミンドバドバってやつですね、「これやったら褒美があるんだ!」とか、営業でいえば、がんばるためにインセンティブをつけている会社あるじゃないですか。
AIでも報酬があるとがんばっちゃうんです、がんばれちゃうらしんですよね。
例えば、囲碁の勝利を報酬として伝えておくと、勝利を得るためにどうしたらいいのか、勝利という状況はどういう状況なのか、必死に対局の中から学習してくれます。
先生いらないってわけです。
53万局対局したら、勝手に53万局から学んでくれるわけですよ。
こうして、人類は、AIにテーブルゲームで勝てなくなりましたとさ。
って話です。
人間でもいうじゃないですか。
昔は、量より質っていってましたけど、今じゃ、質のために量っていわれますよね。
まさにそれなんです。
AIには勝てない:まとめ
結論:めざせ! ポケモンマスター!
「は?」
ではなく。
今日は、AIと機械学習と、ディープラーニングと、強化学習についてお伝えしながら、
テーブルゲームで人間はAIに勝つことができないのはなぜか、お伝えしてきました。
もうね、無理です。お手上げです。
世界チャンピョンですらお手上げなんですから、もうこれ以上上がらないってほどお手上げです。
天井に向かってロケットパンチで青天井って感じですよ、本当。
ただ救いがあるとすれば。
まだAIは囲碁のアルファゴのように特化型AIなんです。
AIに勝てなくなったって、慌てることはありません。
よく考えてください。
これって今までだって当たり前にあったことなんですよ。
フィジカルの、身体的な面では。
車より早く走れますか?
飛行機のように空を飛べますか?
マシンガンのように相手を蜂の巣にすることはできますか?
(たまにマシンガントークで相手を蜂の巣にする人はいますけど
めげそうになったら、思い出してください。
めざせ! ポケモンマスター!
主人公のサトシくんだって、戦ったらピカチュウに勝つことはできませんよ。
でも、ピカチュウとパートナーシップを結んで、ポケモンマスターになることができたじゃないですか。
ぼくらは以下にAIをうまく使いこなす、ポケモンマスターならぬAIマスターになるかを考えていけばいいってことですね。
それでは、みなさん。
AIにはポケモン同様、愛(AI)を持って接していきましょうね。
了