この記事は、Ethan Mollickによる2023年12月7日公開の「An Opinionated Guide to Which AI to Use: ChatGPT Anniversary Edition」をCC:BY-NC 4.0 DEEDライセンスに基づき柏野尊徳とChatGPT4で日本語訳したものです。文章内で一人称で「私」とある場合は著者のEthan Mollickを意味します。
生成AIの世界は非常に混沌としており、ここ数ヶ月で数多くの大規模言語モデル(LLM)がリリースされました。Googleからの大きな新発表も含まれます。そうした状況の中、多くの人々がどのAIを実際に試すべきか私に尋ねます。個人ユーザーとしてAIを実験したい方々、または特定の目的のために使用したい方々(教育、創造性の向上、仕事のパフォーマンス向上、単なる楽しみなど)の観点から答えたいと思います。
簡単な答え
創造的なAIが何ができるのか、なぜ重要なのかを理解したい場合、OpenAIのGPT-4にできるだけ直接アクセスするべきです。その後のすべてのことは、そのアクセスに基づいて続いていきます。
GPT-4は少なくとも1年前に発表されましたが、数十億ドルの投資にもかかわらず、このモデルの一般的な能力に匹敵するものはまだ他の会社から出ていません。Googleは最近、新しいGemini UltraモデルがGPT-4をわずかに上回ると発表しましたが、まだ利用可能ではないので、私は試していません。
はっきりさせておきますが、無料版ChatGPTはGPT-3.5を使用しているためGPT-4ではありません。過去1年間で、多くの企業がGPT-3.5に追いついています:Googleの新しいBard、Elon MuskのGrok、AnthropicのClaude 2.1、InflectionのPi Chatbotなど、多くの企業がGPT-3.5レベルのAIを開発してきました。これらのモデルはGPT-3.5に匹敵するか、あるいはわずかに優れている場合もありますが、いずれもGPT-4には及ばないのが現状です。そのことがなぜ重要かというと、GPT-4レベルに達することで、ようやくAIは本当に驚異的な存在になり始めるからです。
GPT-3.5クラスのAIとGPT-4の大きな違いを説明する方法はたくさんあります。以下に見られるように、GPT-4はテストスコアで優れていますが、テストはAIを評価するのに難しい方法です。ですので、GPT-4のレベルでは、AIが現実世界に影響を与えるという点を考慮してください。私たちはGPT-4が実際の仕事のパフォーマンスを向上させることを発見しましたし、他の研究者たちはGPT-4が大多数の人たちよりも優れたアイデアを生み出すことを示しています。GPT-4は他のモデルよりも賢く感じられるため、意識を持っているかのうような奇妙な錯覚を得る可能性が高いです。多くの点で、その相対的な雰囲気こそが実際に最も重要な違いです。つまり、 GPT-4を使うことで、未来のAIの姿を感じることができます。
GPT-4は最も多機能なモデルでもあります。ウェブブラウジング機能があるため、トレーニング時に持っていた知識に限定されません。また、(視覚や音声を「理解」できる)マルチモーダルであり、画像を生成し、コードを書いたりデータ分析を行ったり、スマートフォンのアプリ・バージョンでは会話をすることができます。他にもデータを共有しないプライバシーモードがあるなど、多くの良い特徴があります。また、「コンテキストウィンドウ:context window」と呼ばれる十分なメモリを持っているため、かなり複雑なタスクも可能です。例えば次のようなプロンプトを実行します。
「他のLLMと比較してGPT-4を選ぶべき理由を調べてください。その情報を詩にして要約し、最初の一節を英語で、二番目の一節をラテン語で書いてください。それから、GPT-4についてインスピレーションを与えるポスターを作りなさい。それから、自分の能力を示すために、コードを使って何かをしてください」
その結果、ウェブを閲覧する方法(出典の引用を含む)、数か国語で詩を書く、ポスターを作成する、そしてコードを書いて実行する様子が、わずか1つか2つのプロンプトで示されます。
私がグループの前で話し、無料版のChatGPTを使用したことがある人に手を挙げてもらうと、ほとんどの手が上がります。同じグループにGPT-4を使用している人がどれだけいるかを尋ねると、ほとんど手が上がりません。OpenAIによる「悪い」AIを無料で提供するという決定により、なぜ次のようなことが起こっているのかがわかりにくくなっています:(GPT-4を使う少数ユーザーにとって)AIは無視できない大きな問題 vs (GPT-4を使っていない大多数を占めるユーザーには)AIは肩透かし。
GPT-4を使いましょう。
より複雑な答え:どうやってGPT-4を手に入れるか?
数週間前までは、GPT-4を試す最適な方法は明確でした。OpenAIのChatGPT Plusに月額20ドルを支払ってアクセスすることができ、そこで最新版のChatGPTをGPT-4で使用でき、上述した全ての機能にアクセスできました。一度アクセスできるようになったら、仕事のタスク(よりイノベーティブになる、文書を要約する、メール作成、アドバイスを得るなど)から、楽しいこと(Googleの代わりに使用する、面白い話を書く、ゲームをするなど)まで、あらゆることに使うことを私はお勧めします。チャットボットの効果的な使用はいつも少し変わっていて、取扱説明書はありませんが、約10時間ChatGPTを使った後には多くの人がその使い方を理解します。目標はこの10時間を達成することで、ChatGPT Plusはそのための最も簡単な方法でした。
しかし、過去数週間で3つの変化がありました:1) ChatGPT Plusのサブスクリプションが一時的に販売停止、2) パフォーマンスに問題があるため頻繁な利用の停止、3) 多数のシステムの新しい使用方法が登場。私はChatGPT Plusの入手を依然として推奨しますが、現在(2023/12/11時点)はできません。
幸い、GPT-4にアクセスする方法は多く存在しますが、それらは少し特異なものです。現時点でのベストな解決策は、無料で世界中169カ国にて利用可能な方法です。それはMicrosoft Bingです。そう、Microsoftの検索エンジンです。
BingにはGPT-4に直接アクセスできるチャットモードがありますが、正しいオプションを選択する必要があります:- 「より厳密に」または「より創造的に」のモードを選ぶ必要があります。デフォルトであり最も人気の「よりバランスよく」モードはGPT-4を使用していません。他の2つのモードは使用しています。「より厳密に」モードは面白みは少ないですが、より正確な回答を生み出し、検索に適しています。ウェブ検索以外の何かをする場合は、「より創造的に」を使用してください。
BingはGPT Plusのほとんどの機能を持っています(ラストピースである「コードインタープリター機能」は間もなく登場予定)が、少し変わっています。検索エンジンのように動作させるため、標準のGPT-4に対してMicrosoftによるいくつかの追加コマンド、制限、能力が与えられています。検索として利用するときには極めて堅実で良いのですが、AI体験が少し不安定なため、上手く機能させるためにいくつかの操作が必要になることがあります。ただし、全体としては、これがほとんどの人にとって最良の選択肢です。繰り返しますが、このことは世界中の何十億人もの人々が最高のAIに無料でアクセスできることを意味します。この点について、 私は以前にも書いたことがあります。
Bingはマッキンゼー風のレポートを作成するが、マッキンゼーのレポートではない
Bingを使用したくない場合、または特別なニーズがある場合、GPT-4を入手するための他の方法がいくつかあります。検索に最適化されたAIを求める場合、Perplexityというサービスが月額20ドルでGPT-4アクセスを提供しています。私はこのサービスを少し使用し、情報収集にはかなり印象的だと感じました。多くの人からよい評判を聞いています。別のオプションはPoeで、これはGPT-4を含む複数の異なるAIへのアクセスを月額20ドルで提供しています。
ほとんどの人にとって、少なくともChatGPT Plusが再開するまで、Bingを使用するのが適切な選択です。
最も複雑な答え:それ以外のものは?
もちろん、多くの他の大規模言語モデル(LLM)が存在します。以下にそれらについての意見をまとめたチートシートを作成しました。
これらの選択肢がある中で、私がGPT-4を推奨する理由は、主に個人ユーザーとして、手に入る中で「最も賢い」モデルを使いたいということです。現在のスケーリング法則によれば、モデルが大きければ大きいほど「賢く」なるとされているため、最も賢いモデルとは最も大きなモデルとイコールです。そして「賢い」モデルほど、より小さく特化したモデルを上回ります。例えば、GPT-4は医療分野に特化していないにもかかわらず、医療タスクで特化した医療モデル(そして医者)を上回ることがあります。これらの巨大モデルは、構築・運用に費用がかかるだけでなく、出力を生成するのにも比較的時間がかかります。また、これらは専有的で、構築・運用することができる数少ない企業によって所有されています。
代わりに、オープンソースのLLMもあります。これらは誰でも無料で使用でき、一般的に高速かつ安価です。商用モデルほど「賢く」はありませんが、それらが追いつく時期や可能性については多くの議論があります。独自のAIソリューションを検討している場合、これらを試してみる価値があります。誰でもワン・クリックでLLM(Large Language Model:大規模言語モデル)をダウンロードし、自宅のコンピュータでインターネット接続なしに、無料で永続的に、かなり堅実ななAIを動かすことができるということは、それなりに驚くべきことです。私もllama.cppを使ってこれを実行しました。あなたにもできます。
オープンソース以外では、特定の状況で他のモデルを使用することもできます。AnthropicのClaude 2.1は特に興味深く、一部無料でアクセスできます。Claudeの最も注目すべき特徴は非常に大きなコンテキストウィンドウ、つまりLLMのメモリです。Claudeは1冊の本全体や複数のPDFをメモリに保持できます。Claudeは他の大規模言語モデルよりも悪意のある行動を取りにくいように構築されています。それ以外はGPT-4と非常に似た動作をしますが、「賢さ」が少し下がります。ClaudeはGPT-4の代替として実験的に使うことができるので、セカンド・オピニオンを得るために適しています。
「ソーシャル」AIを試したい場合は、Inflectionが構築した別の無料のチャットボットであるPiを試すことをお勧めします。Piは会話に最適化されており、本当にあなたの友達になりたいと思っています(本当です、試すとわかります)。絵文字に備える必要はありますが、少なくとも一度は使用する価値があります。特に、音声モードを使うことでチャットに最適化されたAIがどのようなものかを体験することができます。
Elon MuskのGrokについては、あまり言うことはありません。私は使用したことがありませんが、現在はGPT-3.5クラスのモデルで、Twitterへのライブアクセスと、他のAIよりも「検閲されていない」とされる点が特筆されます。これは追加料金を支払うTwitterユーザーのみが利用できます。
最後にGoogleについて話しましょう。Googleは、Bardと呼ばれる独自のAIを消費者向けにテストしていますが、これはさまざまなAIモデルによって駆動されます。最近までそれはPaLM 2というAIで、性能が悪かったです。現在はGemini Proというモデルに置き換えられており、私も使用しています。これははるかに優れた能力を持っていますが、まだChatGPTのレベルにあります。Bardの検索インターフェースと機能は非常にエキサイティングで洗練されていますが、このモデルには注意が必要です。なぜなら、GPT-4を搭載したBingほどの性能はないからです。2024年1月にはGoogleがGPT-4を上回る最初のモデルであるGemini Ultraをリリースすると言われています。そうなれば必ず私はUltraについて記事を書くでしょうが、最先端ではないにせよ、現在のGeminiバージョンで完全に問題はありません。
一時的な状態
次回にこのガイドを作成する際、状況は異なるでしょう。なぜなら、進化したAIにアクセスする手段はチャットボットだけではなくなるからです。AIはさまざまなアプリケーションに浸透してきています。(例えば、私は既にMicrosoft Copilotの早期アクセス権を持っており、CopilotはAIをOfficeアプリに組み込みます。詳細は近いうちに)。また、アプリケーションもAIに浸透しています(GoogleのBardはすでにメールやその他のアプリケーションに興味深い方法で接続しています)。AIは進化し続けるでしょうが、それらに「話しかける」方法は多様になるかもしれません。
また、今後数ヶ月のうちに、GPT-4やGoogle Ultraを超えるAIが現れる可能性も十分にあります。上記のチャートにある各大手AI企業は新しいモデルを開発しており、もちろんOpenAIもそうです。GPT-4を超える大きな進歩がどのようなものかはまだ分かりませんが、2024年にはそれを知ることになるかもしれません。
したがって、このガイドにあるAIは、これまでに使った中で最も原始的なものであると考えてください。そして、いますぐ実験を始めて、近いうちに到達する未来の感覚を掴んでください。
クレジット
原文:Ethan Mollick, DEC 7, 2023, An Opinionated Guide to Which AI to Use: ChatGPT Anniversary Edition, One Useful Thing.
This post is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.