
2022年に公開されたChatGPTは、全世界に急速に普及しました。ChatGPTの出現により、人々のAIへの関心も高まりました。今後のAIのビジネス活用は、必須になります。AIを制作する方でも、活用する方でも最低限のAIの知識を得ておかなければいけません。今回は、AIに関する最低限の用語を抜粋して解説しています。今後、AIを使用したビジネスに関わっていく方は、ぜひ参考にしてください。
AIとは
AI(Artificial Intelligence)は、日本語で人工知能と訳します。AIとは、人間のような知能を持ったコンピューターのことを指します。ジョン・マッカーシー教授は、AIを「知的な機械、知的なコンピュータープログラムを作る科学と技術」と定義しています。今のところ明確な定義はないものの、その技術は既にあらゆる分野で使用されています。
知っておきたいAI用語20選
AIに関連する用語はかなり多く、AI事態が進化途中でもあるので新しい関連用語も日々増加しています。これらのAI関連用語は今後も日常やビジネスで頻出していくことが予想されます。AI用語の増加により、AIに関わる知識も複雑化しています。ここからは、2023年最新の知っておきたいAI用語を20個厳選して紹介します。
シンギュラリティ
シンギュラリティとは、人間によって作られたAIが人間の能力を超える時点のことです。レイ・カーツワイル博士が、シンギュラリティは2045年に起こることを予想しているため「2045年問題」としても知られています。AIが、自身よりもさらに優秀なAIを生産し、そのAIがさらに優秀なAIを作り出します。このような世界でAIが暴走しないか危惧されています。
RPA
RPA(Robotic Process Automation)は、本来は人間がおこなっていた機械的な作業を、コンピューターによって代行させようとする取り組みです。既に、事務作業や財務処理の部分をRPAが担っています。RPAは、AIを導入することで更に精度が向上しています。今後は、人間でしかできなかった分野も、コンピューターが代行していきます。RPAによって、人間の労働時間を圧縮できます。
データマイニング
データマイニングは、日本語に直訳すれば「情報の発掘」です。インターネットの普及により、取得できる情報は膨大な量になりました。そのため大量にある情報の中から、質の良い情報だけを発掘したり、必要な情報だけを抽出したりする必要が発生しました。データマイニングの技術によって、膨大な量のデータから質が良く適当なデータを抽出できます。
アノテーション
アノテーションは、データに対して言葉によって意味づけを与えることです。タグ付けとも呼ばれます。例えば、人の顔画像に対して、「目・口・鼻」などの位置をポイントしたり、人が描いた口コミに対して、「良い評価なのか悪い評価なのか」のラベルを与えます。データに対してアノテーションをすることで、データから正確に情報を読み取ることが可能になります。アノテーションは、AIモデルの学習精度の向上に直結します。
機械学習
アーサー・サミュエルの定義によれば、機械学習とは「明示的にプログラムしなくても学習する能力をコンピューターに与える研究分野」です。これは、大量のデータを与えることで、データ内にあるパターンを学習することで、コンピュータが未知のデータに対して自発的にルールを獲得することを可能にする技術であることを指します。この機械学習には、4つの種類が存在しています。
- 教師あり学習
- 教師なし学習
- 半教師あり学習
- 強化学習
ディープラーニング
ディープラーニング(深層学習)の技術は、人間の脳内にある神経細胞を模倣して作られています。神経細胞を模倣した部分を「ニューラルネットワーク」と呼びます。ニューラルネットワークは、多層構造をしているので複雑な関数でも高い精度で近似した内部表現を可能にしました。さらに、ニューラルネットワークは特徴量の設計とその後の処理をまとめて自動的におこなう「エンドツーエンド(end-to-end)学習」もできます。
過学習
過学習は、AIがデータを学習しすぎてしまい、未知のデータへの予測精度が下がってしまうことです。AIは、データを学習させて精度を上げていくことが求められます。しかし、データ学習の量が増えすぎてしまうと、一定のデータへの偏りが生じます。そのため、AIによって予測したい未知の事象に対して、偏った結果を出力するようになります。過学習をさせないために、人間が介入して学習させるデータの量を調整しなければいけません。
自然言語処理
自然言語処理(Natural Language Processing:NLP)は、人間が日常的に用いる言語をコンピューターで処理する技術です。コンピューターは人間の様に言語を理解して、会話ができるわけではありません。文章をさまざまな要素に分解してコンピューター処理させています。主な解析方法としては以下の4つがあります。「彼は筋トレをします」という例文を元に、解析方法別に文節していきます。
形態素分析(品詞付け):彼/は/筋トレ/を/し/ます
構文分析(構造化):彼は/筋トレをします
意味解析(意味付け):筋トレ=動作対象、します=現在の動作
文脈解析(文章全体の意味付け):彼は筋トレをします=彼は佐藤さんです
データサイエンス
データサイエンスは、AIにデータを読み込ませて出力された結果の原因を分析することです。AIは、高速な計算能力によって、データを吸収して結果を出力することができます。しかし、AI自体は計算されて出力した結果が、なぜ出力されるのか原因を追求することはできません。そのため、人間が出力された結果から原因を分析することが必要になります。このデータサイエンスは、問題解決にも活用されています。
画像認識
画像認識の技術は、人間と同じように画像に何が写っているのか認識することができる技術です。スマートフォンの顔認証や撮影した画像から特定の友達だけ抽出できるのは、画像認識の技術が活用されているからです。画像認識の技術は今後、医療現場で病気の検出や治療後の効果を判定する役割などが期待されています。
音声認識
音声認識とは、AIが人間の声を聞き取りテキストに変換する技術のことです。身近な例では、Siriやアレクサに音声認識の技術が応用されています。人間がキーボードでタイプすることなしに、声だけでスマホやコンピューターに指示を送れます。長時間の会議でも、音声認識を搭載したAIを活用すれば迅速に文字起こしが可能です。
GPT-4
GPT-4は、2023年に公開されたChatGPTの最新モデルです。GPT-4は、これまでできなかった、画像や音声を読み込んでテキストを出力することを可能にしました。GPT-4の性能が向上したことを裏付ける実験として、アメリカの司法試験があります。GPT-4は、この試験で上位10%に食い込む成績を上げています。Microsoftが提供しているBingでは、GPT-4を無料で使用することが可能です。
GAN(敵対的生成ネットワーク)
GAN(Generative Adversarial Network 敵対的生成ネットワーク)は、「画像生成器(Generator)」と「画像識別機(Discriminator)」という2つのニューラルネットワークで構成されています。画像生成器(Generator)によって入力されたノイズから訓練データと同じようなデータを生成し、画像識別機(Discriminator)はデータが訓練データなのか画像生成器から生成されたものなのか識別します。この2つのネットワークを交互に競合させることで、画像生成器から本物のデータに近い偽物データを生成することを可能にします。
ディープフェイク
ディープフェイクは、ディープラーニングとフェイクという言葉を合わせて作った造語です。ディープラーニングを用いて作成された、嘘(フェイク)の映像のことを指します。例えば、悪意のある技術者によって一国の大統領や首脳による政治的な発言を、嘘の映像で広く市民を扇動することも可能です。クオリティが高まっているため、国際的・社会的な問題になっています。
VAE
ディープラーニングを利用した生成モデルである深層生成モデルには「GAN(Generative Adversarial Network、敵対的生成ネットワーク)」や「VAE(Variational Autoencorderl)、変分自己符号化器」があります。VAE(Variational Autoencorderl、変分自己符号化器)は、訓練用のデータから特徴量を抽出し、元の画像と似た画像を生成して出力します。
データセット
ディープラーニングを普及させる要因となったのは、インターネットを通じてデータの収集が可能になったからです。現在では深層学習に用いられるデータセットが、一般に公開されています。主なデータセットは以下の通りです。
- MINIST=手書き数字の画像データセットです。アメリカの国立標準技術研究所が提供しています。
- ImageNet=2万種類以上の物体名と、約1,400万枚の画像を収録。スタンフォード大学がインターネット上から画像を収集して分類しています。
- Youtube-8M=YouTube動画のデータセットです。4,800件のラベルでタグ付けされている800万本の動画があります。
- CIFAR-100=100種類の画像をそれぞれ600枚、合計で6万枚収録されているデータセットです。
- ILSVRC2012=2012年の画像認識コンペティションILSVRCで使用されたImageNetから抽出されたデータセットです。
- Caltech-256=手作業で256カテゴリに分類している30,607画像のデータセットです。画像はGoogle画像検索でダウンロードされています。
サポートベクターマシン
サポートベクターマシンは、たくさんのデータの集合を分類するために用いられる手法です。データを分類するための境界線とデータの最短距離をマージンとして、値を分類するのに良い決定境界線を求めます。この境界線を求めることを「マージン最大化」と呼びます。マージンには、決定境界線の内側にデータが入ることを許容しない「ハードマージン」と許容する「ソフトマージン」に分かれます。
レコメンド
Webマーケティングの文脈でのレコメンドとは、ECサイトで顧客への最適な商品をおすすめする機能のことです。レコメンド機能は、膨大な量のデータをAIによる計算と結果を活用したアルゴリズムに基づいておこなわれます。商品やサービスを購入する個人の検索履歴や購買履歴、属性など含めて分析しています。
転移学習
既存のニューラルネットワークモデルを活用する手法に、「転移学習」があります。転移学習は、既存の学習モデルを新しい課題のデータに利用する方法です。既存の学習モデルの重みを変更しないので、小規模なデータと少ない計算量でも学習モデルを作成可能です。
クラスタリング
与えられているデータをいくつかのクラスタに分類することを「クラスタリング」とよびます。クラスタリングの典型的な手法に「k-Means法(K-平均法)」があります。k-Means法は、データをk個のクラスタに分けて、各クラスタの重心に一番近い点をランダムに設定します。その後、各クラスタの重心に近い点をクラスタに分類し直すということをくり返していきます。
まとめ
AIを作る用語や関連する用語はたくさんあります。身近なスマホやパソコンなどにも搭載されているように、AIと直接関係がないように見えるものも実はAIに関連しているのです。AIは活用方法によって様々なデータが必要となるため、AIを作成したい場合はデータについても知る必要があります。AIに必要なデータを収集したい場合にはPigDataのスクレイピング代行でWebサイトから大量に良質なデータを収集することをご検討ください。