プロンプト長の削減率
プロンプト長の削減率は、元の長さからどれだけ減ったかを、元の長さで割って求めます。LLM利用では、トークン数を削減することでコストや遅延を下げられる場合があります。ただし、必要な制約や根拠まで削ると回答品質が下がります。
正解の理由
元のプロンプトは1200トークン、短縮後は900トークンです。削減した量は次の通りです。
$1200 - 900 = 300$
削減率は、削減量を元の量で割ります。
$rac{300}{1200}=0.25$
したがって答えは 0.25、つまり25%削減です。
実務上の意味
- 短いプロンプトはコストと応答時間の面で有利です。
- 不要な挨拶、重複説明、古い会話履歴は削減候補です。
- 出力形式、禁止事項、根拠文書など重要な条件は削りすぎないようにします。
混同しやすい点
- 削減後の900を元の1200で割ると残存率0.75です。削減率は1-0.75=0.25です。
- 文字数削減率とトークン削減率は一致しない場合があります。
G検定では計算だけでなく、トークン削減がコンテキスト設計、コスト管理、品質管理に関わる点を押さえましょう。
試験対策の確認
生成AI・LLMの論点では、便利さだけでなく、制約とリスクを同時に押さえることが重要です。プロンプト、RAG、ファインチューニング、トークン、コンテキスト、権利・機密情報の各用語は相互に関連します。実務では、モデルの出力をそのまま正解とみなさず、根拠確認、アクセス制御、ログ管理、人間によるレビューを組み合わせて安全に運用します。
追加の確認観点
生成AI・LLMの問題では、技術用語を単独で覚えるより、入力、検索、生成、検証、運用管理の流れに置いて理解することが重要です。トークンやコンテキストは制約、プロンプトは制御、RAGは外部知識の参照、ファインチューニングは振る舞いの調整、ガバナンスは安全な利用のための仕組みです。実務では、出力が自然でも根拠が正しいとは限らず、機密情報や著作権のリスクも残ります。G検定では、便利な応用例と同時に、限界、確認手順、人間のレビューが必要な場面を押さえてください。