AIの基礎

この記事は、「ChatGPT(先読み!ITxビジネス講座濃い内容がサクッと読める!) 対話型AIが生み出す未来古川渉一著インプレス」「文系AI人材になる -統計・プログラム知識は不要野口竜司著東洋経済新報社」「画像生成AIがよくわかる本次世代AIサービス図解ポケット田中秀弥著秀和システム」を参考にさせて頂いています。

AIに関する本を読んでいると「機械学習」「教師あり学習」「教師なし学習」「強化学習」「深層学習(ディープラーニング)」と「学習」がいっぱい出てきてどう区別していいのか分かりません。上記で取り上げた2冊の本では、これらを分かりやすく分類しているので理解の促進に役立ちます。この2冊で取り上げられているAIの分類方法を解説していきたいと思います。

ChatGPT
文系AI人材になる
生成AI
「AI」について

ChatGPT

まずは、「ChatGPT(先読み!ITxビジネス講座濃い内容がサクッと読める!) 対話型AIが生み出す未来古川渉一著インプレス」で説明されている内容を解説します。ます最初に各「学習」の位置づけについて、概要をベン図で示します。

教師あり学習：正解、不正解というラベルがついたデータを渡す学習法
教師なし学習：正解、不正解の印のない、単なるデータを渡す学習法
強化学習:ルールを用意してその環境下で試行錯誤を行い、結果に応じて報酬を与えるという手法
深層学習:人間の脳の仕組みを模した手法

もう少し個々に説明します。

教師あり学習：大量のデータに人間が「答え」のラベルを付けたものをAIに与えて、学習をする手法になります。人間でいえばマニュアルを渡して「このとおりに動いてね」と指示しているようなイメージになります。
教師なし学習：教師データ(マニュアル)なしでコンピュータが学習する手法になります。コンピュータ自身が、与えられたデータを分析して特徴ごとに判別します。
強化学習：コンピュータにあらかじめルールが決まっていることをやらせて、その結果に対して報酬を与えるものです。強化学習が使われているAIとして、囲碁や将棋の対局をするものが有名です。「こうなれば勝ち」「こうなれば負け」というルールが決まっているものに対して、勝った場合にはプラスの報酬を、負けた場合にはマイナスの報酬を与えます。報酬を与えたうえで試行錯誤させることで、高い報酬を得られる結果が出せるようになっていく仕組みになっています。
深層学習:機械学習でラベル付けをするための判断軸になるものを専門用語で「特徴量」といいますが、その特徴量を人手で設計せずに、特徴量自体を機械が学習する手法です。深層学習は、人間の脳を参考にして作られています。人間の脳には数十兆から数百兆の細胞があり、その細胞同士をつなぐシナプスと呼ばれるものが存在します。その仕組みを模した「ニューラルネットワーク」というモデルが使われています。

ラーメンに例えるなら、本格的にスープや麺を作るのが従来のAI開発、カップラーメンがGPTモデルだと考えるといいらしいです。

ちなみに、ChatGPTの「GPT」は、「Generative Pre-Trained Transformer」の頭文字でGenerativeは「生成」、Pre-trainedは「事前学習」を意味する単語、「Transformer」はAIの学習モデルの1つだそうです。

・トランスフォーマー

　特殊な仕組みを使い、「文脈の中で重要な単語に注目できるようにする」手法だそうです。それまでのAIでは「次にどんな単語を加えるべきか」を予測するために、学習した単語のすべての組み合わせを記憶することができない点にありました。それまでのコンピューターは、5～10単語しか覚えられませんでした。例えば翻訳であれば、長い文章を訳そうとすると初めの方の単語を忘れてしまっていました。

　トランスフォーマーは、「重要でない単語は無視しよう」ということでした。逆に言えば、文章の中で注意(アテンション)を向ける必要がある単語を抽出すればいい、という考え方です。これは人間の認識と同じ方法論です。ある文章の単語の羅列の中で注意が必要な重要な箇所を人間も無意識に識別しているからです。

ディープラーニング(深層学習)というのは、論理的に整合性を取って答えることは諦めて、たくさんのデータの中から近い情報を持ってくるというものです。とても近い情報なので合っていることが多いけれど、間違っていることもあります。ハルシネーションはこの方法を使っている限りは直りません。

参考文献　「ChatGPT エフェクト破壊と創造のすべて」日経ビジネス編/日経BP社

文系AI人材になる

AI、機械学習、ディープラーニングの3大分類

「武士」と「徳川家の武将」と「徳川家康」の関係性を例にAIの分類を考えてみましょう。「武士」は一番広い意味をもっている言葉で、その中に「徳川家の武将」が含まれます。また、「徳川家の武将」の一人として「徳川家康」がいるわけです。これを「AI」「機械学習」「ディープラーニング」に置き換えると下記の様になります。

「AI」は一番広い意味をもっている言葉で、その中に「機械学習」が含まれます。また、「機械学習」のひとつとして「ディープラーニング」がいるわけです。

また、ロボットの世界でも例えてみましょう。「ロボット」は一番広い意味を持っている言葉で、その中に「ネコ型ロボット」が含まれます。また、「ネコ型ロボット」のひとつとして「ドラえもん」がいる訳です。

これらの例をイメージしながら、AI、機械学習、ディープラーニングとは何なのかを見ていきましょう。

・AIとは、人間と同様の知能を実現しようとする技術。

・機械学習とは、AIの一種。学習により特定のタスクを実行できるようになるAI。学習にあたっては、主に人が特徴(目のつけ所)を定義。

・ディープラーニングとは、機械学習の一種。人間の脳の神経細胞(ニューロン)を模した学習法から発展。主にマシンが特徴(目のつけ所)を自動定義。

学習方式の3分類-教師あり/教師なし/強化学習

生成AI

ChatGPTに代表される生成AIですが、OpneAIが2022年11月30日に公開すると瞬く間に注目を集めました。ですが、その少し前の2020年7月にOpen AIはGPT-3という大規模言語モデルを発表していて、Open AIはGPT3を応用して画像生成AI 「DALL・E」を開発しています。さらに「DALL・E」の品質を高めた「DALL・E 2」を2022年4月に発表しています。このため、2022年は画像生成AI元年ともいわれています。

生成AIとは「Generative AI」のことで、「コンテンツやモノについてサンプルデータから学習し、それを使用して創造的かつ現実的な新しい新しい生成物を生み出す機械学習法」と定義されています。

産業技術総合研究所では、「従来のAIはすでにある大量のデータから特徴を学んで、ある事象の予測をすること」だと説明しています。一方で、ジェネレーティブAIは、「データのルールやパターンの抽出だけにとどまらず、それらのデータを利用してより創造的で質の高いオリジナルのコンテンツを自ら出力できる」という異なる特質を持ちます。