特集記事

- C.C.,エディター

この4か月、ジェネレーティブAIの分野で急激な進歩がありました。GPT-3.5ベースのChatGPTのリリースに関する記事を最初に掲載してからわずか数か月で、OpenAIが学習させた最新モデルGPT-4が、ChatGPT Plusのサブスクリプションを購入した有料ユーザーなら誰でも利用できるようになりました。 また、商業・学術分野では、人数に制限はあるもののベータ版テスター向けにOpenAI APIで公開されました。

以前、ChatGPTの制限について説明しました。それらの制限は一部残っていますが、GPT-4アーキテクチャは非常にパワフルになり、事実に即し正確で、認知能力も向上しています。ベンチマークテストでは、GPT-4は統一司法試験(UBE)で90パーセンタイルのスコアと、米国医師免許試験(USMLE)で合格点を大きく上回るスコアを獲得しました。そして特に注目すべきこととして、日本の医師国家試験(NMPQE)に日本語で合格することが実証されました。

GPT-4は、医療分野はもとより、どの分野の質問にも答えるよう特別に学習させられているわけではありません。それでも、比較的初期段階であるにもかかわらず、特別に調整されたAIモデルのみならず、専門家である受験者と同等のあるいはより優れていることを多くの分野で実証しています。これ以上の説明がなくても、その潜在的な影響がどれほど広い範囲に及ぶか、読者の皆さんには明らかでしょう。

学術界とそれに依存する人間活動のすべての分野への混乱は、近い将来、想像を絶する規模で起こると思われます。近いうちに影響を与える可能性のあるわかりやすい例を1つ挙げてみましょう。厳格で時代遅れの査読システムをどう改革するかは以前から議論されています。この2021年の論文では、査読プロセス支援に特化したAIモデルを使用する可能性が論じられていますが、このようなシステムのブラックボックス的性質により、評価結果が受け入れられ難いという問題が浮き彫りになっていました。この論文では、問題に対して複雑な解決策が提案されているものの、GPT-4(わずか2年後!)や同様にパワフルで汎用的な大規模言語モデルの出現により、特別に設計した説明可能モジュールが不要になりました。なぜなら、モデル自体が、純粋に自然言語を使用してユーザーと対話し、その論拠を同様に自然言語で提示できるからです。

英語版はこちら