
OpenAI社が開発したGPT-4は、2023年に公開された大言語モデルの最新バージョンです。これまで使用されていたGPT-3.5よりも性能が向上しました。ChatGPTにも搭載されているため、このツールをうまく活用することによってビジネスを効率化し、利益も向上させることができます。今回は、GPT-4とはなにかをGPT-3.5と比較しながら解説します。また、実際にGPT-4を活用している事例を紹介します。
GPT-4とは
GPT-4とは、「Generative Pretrained Transformer」のバージョン4の略語です。ディープラーニングを活用して、人間が話すような自然な言葉で会話テキストを生成できる言語モデルです。ChatGPTが一般公開されたのは2022年の11月であり、GPT-3.0が搭載されていました。その後GPT-3.5に更新されて、2023年にはGPT-4が搭載されました。更新されるたびに機能は向上しているため、GPT-4はGPT-3.5よりもできることが多様になりました。
GPT-3.5との違い
GPT-4はどのような性能が向上したのでしょうか。GPT-4とGPT-3.5を比較して、実際にどのような性能が向上したのか解説します。
解答能力の向上
GPT-4は、GPT-3.5と比較して問題への解決能力が向上したことが挙げられます。例えば、難易度の高い試験として知られている米国の司法試験ですが、GPT-4は模擬試験で上位10%に食い込む成績を収めました。GPT-3.5は、同一の試験で下位10%の結果でした。この結果を比較すると、能力の向上は明らかです。また、GPT-4は、プログラミングのコードや論理的な文章の生成もGPT-3.5よりも正確にできます。
画像にも対応可能
GPT-4は、テキストだけではなく画像にも対応可能です。GPT-4はマルチモーダルなモデルです。マルチモーダルとは、複数以上の形式や手段を持っているという意味です。GPT-3.5までは、テキストにのみ対応していました。GPT-4では、マルチモーダルに画像にも対応できる部分が違いです。GPT-4に画像を入力すると、画像内容をテキストで説明できます。
整合性の向上
GPT-4はGPT-3.5と比較して、整合性も向上しています。GPT-4以前のバージョンでは、質問に対する解答に間違いが多く見受けられました。しかし、GPT-4はこの点も改善しています。OpenAI社が比較研究した結果によると、GPT-4は、GPT-3.5と比較して40%以上の整合性の向上が認められたと評価しています。
長文でのやりとりが可能
GPT-4は、最大で25,000文字の長文にも対応できるようになりました。GPT-3.5が5,000文字だったのでその処理能力は5倍になったと言って良いでしょう。長文の論文や記事の要約をすることもできるようになりましたし、長文の文章やコンテンツを生成することも可能です。
GPT-4でできること
性能が向上したGPT-4は、GPT-3.5よりもできることが幅広くなりました。実際にはどのようなことができるのか紹介します。
画像の認識
GPT-4は、画像の認識ができるようになりました。この点が、GPT-3.5と比較して大きく性能が向上した部分です。入力した画像の内容を文章で説明することができます。単に画像を説明するだけではなく、その「面白さ」を認識して説明します。視覚に障害がある方でも、画像の説明をテキストと音声を利用して表現できます。
文章の生成
文章の生成は、GPT-3.5でもおこなうことができました。しかし、GPT-4はその性能をさらに向上させています。GPT-4は、これまでよりも長文の理解をすることができますし、長文を生成することも可能です。科学的な論文も生成可能なため、論文を執筆する際のサポート役として使用できます。
複雑な計算
GPT-4では、複雑な計算もできます。OpenAI社が公開しているデモの動画では、会社の経理をGPT-4に任せています。会社の収益計算は、経費だけではなく税金も含まれているため複雑です。GPT-4は、経理に関する分野でもより複雑な計算を正確におこないます。
手書きメモの分析
GPT-4は、人間が書いた手書きメモの分析も可能です。GPT-4は画像分析ができるため、メモに書かれた文字を理解して出力にも応用できます。簡単なホームページの構造をメモした画像を入力すると、短時間でホームページのHTMLコードを書き出します。GPT-4なら、画像(視覚的な情報)から、Web制作が可能です。
プログラムの生成
GPT-4は、プログラムの生成を得意としています。プログラミングは、実装・設計・ドキュメントなど複数の要素で成り立っています。GPT-4は、プログラミング自体の概念を把握して、複数の要素を用途に合わせてコード生成をおこないます。GPT-3.5よりも性能が高く、複雑なプログラミングにも使用可能です。
GPT-4を搭載しているサービス
GPT-4を搭載させて、一般公開されているサービスを紹介します。既存のサービスを参考にして、自社のサービスの開発の参考にしてください。
ChatGPT
OpenAI社が開発したChatGPTには、GPT-4が搭載されています。ただし、無料プランで使用する場合は、既存のChatGPTで使用されていたGPT-3.5バージョンです。GPT-4が搭載されたChatGPTを使用する際には、月額20USドル(1USD=135円換算で月額2,700円)を支払ってChatGPT Plusプランを使用します。GPT-4は、これまでのバージョンと比較して性能が向上しているため、ビジネス面でアドバンテージを得られます。
BingAI
Microsoftが無料で一般公開している検索エンジンのBingには、GPT-4が搭載されています。公開された当時は順番待ちをしなければいけませんでしたが、既に多くの方が使用可能です。BingAIは、チャットによる質問だけではなく、通常の検索エンジンでも検索が可能です。チャットの解答との整合性を確かめるのに便利です。
BeMyEyes
BeMyEyesは、GPT-4を搭載しているインターネットのサービスです。サービス名(私の目になって)の通り、画像の説明をBeMyEyesがおこなってくれます。視覚障害者の方は、これまでネットの記事を音声で聞くことができましたが、画像に関しては認識することができませんでした。BeMyEyesは、視覚に障害がある方でも画像の内容が分かるように言葉で説明してくれます。
Speak
SpeakはGPT-4を搭載した英語学習用のアプリです。GPT-4は、自然な言語で人間とAIが会話することができます。そのため、英語を習得したい人間が、英語教師役のAIと会話を通して英語学習をします。テキストだけではなく、声(音声)を入力することでAI英語教師が正しい英語に添削してくれます。相手が人間ではないので、恥ずかしい気持ちにもなりません。
Tome
Tomeは、GPT-4を搭載したプレゼン資料作成ツールです。会社や研究会での発表に使用するプレゼン資料を、必要な情報をテキストで入力するだけで作成できます。プレゼン資料の作成には時間や手間がかかりがちです。ツールを使いプレゼン資料の作成時間を省略することで、本来の目的であるプレゼンの練習に集中できます。
まとめ
GPT-4はGPT-3.5よりも優れているChatGPTの大言語モデルで、精度の高いAIが基となっています。ChatGPTのように、精度の高いAIのモデルを作るには大量の学習データが必要です。AIに学習させるデータは、Webサイトから大量に収集することができます。Webサイトのデータ量は膨大なため、スクレイピングで収集するのがおすすめです。スクレイピング代行を依頼するなら、PigDataにご依頼ください。