GPT-4は、OpenAIによって開発が進められている人工知能の最新版で、世界中の注目を集めています。この記事では、3月14日に行われたGPT-4の開発者アナウンスについてまとめてご紹介します。GPT-4が実現する最新技術や、今後の展望などについて深く掘り下げていきます。AIに興味を持つ方や、最新技術に関心がある方は必見です。
OpenAIがAI言語モデル「GPT-4」を発表
米OpenAIが最新のAI言語モデル「GPT-4」を発表したことが明らかになりました。コンテクストの長さを表すトークン数は前モデルの2倍以上の8192トークンに増加しており、大幅な性能向上が期待されています。
ChatGPTにおけるトークンとは、テキストデータを分割し、モデルが処理できる形式に変換するための最小単位です。トークン化は、テキストを小さな塊に分割するプロセスであり、各トークンはテキスト内の一意の単語、句読点、句、または文字のいずれかです。トークン化されたテキストは、数値データに変換され、GPTモデルに入力されます。このプロセスにより、モデルはテキストの意味や文法を理解し、より自然な回答を生成するための情報を取得できます。
上の文章の一部を使って、トークンの数を数えてみましょう。実際の文字とは少しずれるのと、意味を持って理解される部分が文章内で少し異なっています。
トークンの数が増えるということは、入力の数を増やすことができます。入力値を上げられると考えれば、性能の向上が見込まれますね。アウトプットの質が目に見えて劇的に変わるというよりも、精緻さが増える感じと理解しています。
OpenAIの社長がデモ配信を実施
OpenAIの社長兼共同設立者であるGreg Brockmanが、GPT-4に関する開発者向けデモをYouTubeでLIVE配信しました。
このデモでは、GPT-4の新しい機能やアプリケーションの実演が行われました。GPT-4には、テキストと画像のマルチモーダルに対応した機能が追加され、画像の説明文の生成やキャプション、分類、分析が可能になりました。また、コンテクストの長さは8,192トークンと、前モデルの2倍以上になっており、より複雑なタスクにも対応できるようになりました(トークンの長さが32,768のバージョンもあります)。開発者はDiscordで登録することで、GPT技術を利用できます。さらに、ChatGPT Plusサブスクリプションがあれば、一般ユーザーでも利用可能です。
実は、Bingではすでに使われていた
マイクロソフトは、2022年3月14日、検索エンジン「Bing」において、OpenAIが新たに発表したGPT-4が既に使用されていることを明かしました。
BingのAIチャット機能は、5週間前からGPT-4の上で動作しており、この期間にBingのプレビュー版を使用したユーザーはすでにこの強力なモデルを体験済みです。マイクロソフトは、長年にわたりAIの研究に投資しており、今回のGPT-4の採用により、Bingの検索機能をさらに向上させることができると期待しています。
「BingをMacにインストールする日が来るなんて思ってもみなかった」と漏らすユーザーも見かけました。少なくとも、Microsoftは、ChatGPTの恩恵をかなり受けている印象です。
GPT-3とGPT-4の比較
OpenAIは、最新のAI言語モデル「GPT-4」を発表しました。比較によると、これはさらに驚異的なパラメータを持っており、GPT-3よりも優れた性能を発揮しています。米国の司法試験をクリアできるかや生物学オリンピックでの順位などで検証がされています。
定量的に評価されている部分を並べるとこうなります。「性能が上がって」という状態です。GPT-3が出たときほど、劇的に変わっているわけではない気がします。
ただし、チューニングと呼ばれる特定分野の知識を入れ込んで応用させることでは、GPT-4が優れている印象です。
入力が文字以外でOK
文字以外の入力でいいという例は、こちらのデモが参考になります。手書きのメモを写真に撮って、それをChatGPTに読ませてHTMLをコーディングしてもらっています。コーディングが必須の知識というのが思い込みになってしまう可能性も少しあります。
演奏家とパフォーマーのようにプログラミングへのアプローチが変化するかもしれません。昔は楽器を極めて弾けることが演奏家の条件だったものが、今は打ち込みを考えて作ることでまかなっているような感じです。
GPT-4利用例と良さ(Stripeの例も)
GPT-4の最も注目すべき特徴の一つは、コンテクストの長さが8,192トークンとなり、前モデルの2倍以上に増えたことです。これにより、より複雑で長い文章や文脈を理解し、適切な応答を生成することができます。GPT-4は、学術論文の要約や文章の作成において、非常に高い性能を発揮することが期待されています。
それにとどまらず、StripeのGPT-4の利用においては、詐欺を働くアカウントかを自動で見極めることができるように使われています。Discord の投稿の構文を分析するだけで実行できるため、とても簡単に応用ができているようです。
GPT技術を利用する開発者はDiscordで登録が必要
GPT技術を活用するためには、開発者はDiscordでの登録が必要となっています。Discordでは、ChatGPTの機能を持つDiscordBotを自由に利用できるようになります。この利用登録は、サーバー上にBotを招待することで、GPT-4の機能を自由に利用できるようになるまでを目指しています。
ChatGPT Plusサブスクリプションを利用することで、一般ユーザーも最新AI言語モデル「GPT-4」を利用することが可能になりました。月額20ドルという手頃な価格で、人間レベルのパフォーマンスを発揮するGPT-4のテキスト入力機能を利用することができます(上限あり)。ChatGPT Plusは、容量に制限があるため、現在は待機リストがありますが、需要が高まることで変わる可能性があります。一般ユーザーにとっても、企業にとっても、GPT技術を使いこなすことができるようになります。
GPT-4が日本語でも利用可能
GPT-4は、日本語でも利用可能になっています。以前のモデルと比較して、より高度な文脈理解と入力された情報に基づく応答を可能にする、強化された自然言語処理機能が備わっています。これにより、日本語ユーザーも自然な会話を行い、高度なテキスト処理を行うことができます。例えば、天気や交通情報、観光案内など様々な情報を一括して提供することができます。
税金相談デモ!システムと連携して税法の難解な計算を解決する方法
先程のOpenAIの社長Greg Brockmanがデモで示したのは、税法の相談でした。税は多くの方が関わるので、特に解決したいことと考えられているのでしょう。
OpenAIをパートナーのように付き合える具体的な例を、税金控除の相談を例に示していました。GPTモデルは、システムと連携して、税法の複雑な計算を簡単に解決でき、自分の仕事の専門情報に合わせてモデルをカスタマイズしたい場合は、システムメッセージを使用してモデルを調整することができます。
例えば、「プロ野球選手」について質問をしているときに税法について質問をした場合、回答のモデルはプロ野球選手の収入と標準的な控除を考慮して、最終的な答えを出します。もし、あなたが同じ結論に達した理由が分からない場合は、システムにその理由を説明するように頼むことができます。
また、私たちのシステムは、税法を理解するのに必要な時間を節約することができます。例えば、16ページ分の税コードを読んだ後、あなたがその根拠を理解しようとするのは大変な作業です。しかし、GPT-4のモデルは、代わりにその作業をしてくれます。関心のある問題に対して、システムへの指示は柔軟に行えます。コードであるかどうか、言語であるかどうかは問いません。
まとめ
GPT-4の開発者アナウンスまとめで、夢のあるような、まだまだこれから一歩ずつというようにも感じます。カスタマイズ性が上がるため、専用ChatGPTを作る流れができてくると考えます。
面白い技術のため、気づいたことがあれば、まとめていきます。