RAGの目的
RAG(Retrieval-Augmented Generation)は、検索拡張生成と訳されます。ユーザーの質問に関連する外部文書を検索し、その文書をコンテキストとしてLLMに渡して回答を生成する方法です。モデル内部の知識だけに頼らず、外部知識を参照させる点が特徴です。
正解の理由
選択肢1は、外部文書を検索して根拠情報として与え、生成回答の正確性や最新性を補うと説明しています。これはRAGの主目的です。社内規程、製品マニュアル、FAQ、最新ニュースのように、モデルの事前学習に含まれない情報を扱う場合に有効です。
他の選択肢の評価
- 選択肢2は生成結果を画像に変換する処理で、RAGではありません。
- 選択肢3はモデルサイズをゼロにするという不可能な説明です。RAGでも生成にはLLMを使います。
- 選択肢4は手書きルールだけで回答する仕組みで、検索と生成を組み合わせるRAGとは異なります。
仕組みの流れ
- 質問を埋め込みベクトルなどに変換する。
- 関連文書を検索する。
- 検索結果をプロンプトに入れる。
- LLMが根拠に基づいて回答する。
実務では、検索品質が回答品質を大きく左右します。古い文書、重複、権限外文書、関連性の低い文書が入ると誤回答につながります。RAGはハルシネーションを減らす助けになりますが、完全に防ぐものではありません。
試験対策の確認
生成AI・LLMの論点では、便利さだけでなく、制約とリスクを同時に押さえることが重要です。プロンプト、RAG、ファインチューニング、トークン、コンテキスト、権利・機密情報の各用語は相互に関連します。実務では、モデルの出力をそのまま正解とみなさず、根拠確認、アクセス制御、ログ管理、人間によるレビューを組み合わせて安全に運用します。
追加の確認観点
生成AI・LLMの問題では、技術用語を単独で覚えるより、入力、検索、生成、検証、運用管理の流れに置いて理解することが重要です。トークンやコンテキストは制約、プロンプトは制御、RAGは外部知識の参照、ファインチューニングは振る舞いの調整、ガバナンスは安全な利用のための仕組みです。実務では、出力が自然でも根拠が正しいとは限らず、機密情報や著作権のリスクも残ります。G検定では、便利な応用例と同時に、限界、確認手順、人間のレビューが必要な場面を押さえてください。