トークン数の合計計算
LLMの利用量は、入力トークンと出力トークンの合計で考えることがあります。入力にはユーザーの質問、システム指示、会話履歴、RAGで渡した参照文書などが含まれます。出力にはモデルが生成した回答のトークンが含まれます。
正解の理由
問題では入力が800トークン、出力が200トークンです。合計トークン数は単純に足し合わせます。
$800 + 200 = 1000$
したがって答えは 1000トークン です。計算自体は簡単ですが、G検定ではトークン数がコスト、遅延、コンテキスト制限に関係する点まで理解しておくとよいです。
実務上の意味
- 入力が長いほど、処理コストとレイテンシが増えやすくなります。
- 出力を長く許可すると、回答は詳しくなりますが、コストも増えます。
- RAGでは参照文書を入れすぎると、必要な情報が埋もれたり上限を超えたりします。
混同しやすい点
- トークン数は文字数と完全には一致しません。
- 同じ文章でも言語や記号、トークナイザによってトークン数が変わります。
- サービスによって課金対象や上限の扱いが異なるため、仕様確認が必要です。
プロンプトを短くするだけでなく、必要な文脈を残すことが品質維持の鍵です。
試験対策の確認
生成AI・LLMの論点では、便利さだけでなく、制約とリスクを同時に押さえることが重要です。プロンプト、RAG、ファインチューニング、トークン、コンテキスト、権利・機密情報の各用語は相互に関連します。実務では、モデルの出力をそのまま正解とみなさず、根拠確認、アクセス制御、ログ管理、人間によるレビューを組み合わせて安全に運用します。
追加の確認観点
生成AI・LLMの問題では、技術用語を単独で覚えるより、入力、検索、生成、検証、運用管理の流れに置いて理解することが重要です。トークンやコンテキストは制約、プロンプトは制御、RAGは外部知識の参照、ファインチューニングは振る舞いの調整、ガバナンスは安全な利用のための仕組みです。実務では、出力が自然でも根拠が正しいとは限らず、機密情報や著作権のリスクも残ります。G検定では、便利な応用例と同時に、限界、確認手順、人間のレビューが必要な場面を押さえてください。