「良い質問」で必要な情報を引き出す技術 - 曖昧な報告から解決の糸口を掴むには？ • vonxai blog

AIにタスクを指示する際や、チームメンバーに業務を依頼する際、前提条件が抜けていたり要件が曖昧であったりするために、期待外れの結果になってしまうことは多々あります。このような認識のズレを防ぎ、タスクを確実に成功させるためには、相手に「何が足りないか」を問いかけ、必要な情報を引き出す的確な「逆質問」の技術が求められます。

本記事では、カーネギーメロン大学の研究チームが発表した論文「Asking What Matters: Reward-Driven Clarification for Software Engineering Tasks」に基づき、効果的な質問の法則について解説します。

「理想の姿」よりも「現在の具体的な問題」を優先して聞く

問題を解決するために情報が不足している場合、私たちは「何から聞くべきか」迷うことがあります。本研究では、AIがプログラミングの不具合を修正するタスクにおいて、700件の不完全な課題データを用い、「どの情報が欠けていると最もタスクの成功を妨げるか」をSHAP値（予測への貢献度を示す指標）を用いて分析しました。

以下の図は、情報の種類ごとにタスク成功への影響度を数値化したものです。

図表1：各情報カテゴリとタスク成功率の関連性を測定したSHAP値

各情報カテゴリのSHAP値の平均値

このデータから、タスクの成功に最も大きく貢献するのは「エラー情報（Error Information）」であることが分かります。一般的な業務依頼において、依頼者は「最終的にどうなってほしいか（期待される挙動：Expected Behavior）」を語りがちですが、実際の課題解決において優先度が高いのは「現状、どこでどのような不具合が起きているか」という具体的な診断シグナルです。

相手の意図を汲み取ろうとする際、抽象的なゴールを確認するよりも、まずは現在の具体的な状況や制約（実装の詳細：Implementation Details）を正確に聞き出すことが、確実な問題解決への最短ルートとなります。

相手が「確実に答えられる質問」を構成する4つの戦略

タスクに必要な情報が特定できたとしても、それを相手が「答えられない形式」で聞いてしまっては意味がありません。例えば、システムに詳しくない依頼者に対して「内部の処理フローはどうなっていますか？」と質問しても、的確な回答は得られません。

研究チームは、ユーザーが実際に答えられる質問と、答えられない質問の分布を分析し、答えやすい質問に見られる4つの戦略的な特徴を導き出しました。

図表2：答えられる質問と答えられない質問を区別する4つの戦略的テーマ

戦略	説明	答えられる質問の例	答えられない質問の例
客観的事実に基づいた問い	相手が直接共有できる具体的な成果物を要求する	スタックトレース（ログ）を共有してください	ミドルウェアの実行順序はどうなっていますか？
具体性の要求	抽象的な説明ではなく、正確な値を尋ねる	どのPythonバージョンですか？	最適なバージョンは何ですか？
スコープの最小化	問題を切り分けるための最小単位の情報を要求する	これを示す10行のスクリプトを提供してください	あなたのアーキテクチャ全体を説明してください
実行可能性の確保	相手がすぐに実行・観察できるアクションに焦点を当てる	`pytest -v`を実行し、出力を共有してください	リファクタリングした場合、どうなりますか？

効果的な質問は、相手の知識や立場の限界を考慮して設計する必要があります。推測や高度な分析を求めるのではなく、相手の手元にある事実の共有を求めたり、すぐに確認できる具体的なアクションを促したりすることが、質の高い回答を引き出す鍵となります。

質問の質を高める「4つのフィルター思考」

相手に質問を投げかける前には、その質問が本当に価値のあるものかを精査する必要があります。研究チームは、AIに賢い質問を生成させるため、以下の図に示す4段階の評価システム（報酬パイプライン）を設計しました。

図表3：段階的なフィルタリングを伴う多段階報酬パイプライン

多段階報酬パイプラインの図

このAIの学習メカニズムは、人間がヒアリングを行う際の「フィルター思考」としても役立ちます。

非冗長性 (Non-Redundancy)：すでに共有されている資料や文脈に答えがないか？（相手に二度手間をかけさせていないか）
多様性 (Diversity)：定型文のような浅い質問になっていないか？（個別の状況に踏み込んだ質問か）
回答可能性 (Answerability)：相手が持っている知識や権限の範囲内で答えられるか？
タスク関連性 (Task Relevance)：その回答を得ることで、本当に課題解決が前進するのか？

これらの基準を順にクリアした質問だけを相手に投げかけることで、「とりあえず聞く」という無駄なコミュニケーションを排除し、的確に要件を詰めることができます。

質問は「数」ではなく「絞り込み」が成功を左右する

最後に、研究チームは上記の4つの基準で「質問の質」を最適化したAIモデル（CLARITI）と、既存の高機能なAIモデル（GPT-5など）のパフォーマンスを比較しました。

図表4：各モデルによるタスク成功率と質問生成の効率比較

モデル	タスク成功率	回答可能性	タスク関連性	質問数
質問なし (ベースライン)	22.4%	—	—	—
GPT-5 Nano	29.6%	.339	.576	5.2
GPT-5	35.6%	.369	.580	5.1
CLARITI	36.8%	.373	.622	3.0
完全な仕様が与えられた場合	41.6%	—	—	—

結果として、最適化されたモデルは既存のGPT-5と同等以上のタスク成功率（36.8%）を達成しました。注目すべきは、GPT-5が平均5.1個の質問を行ったのに対し、最適化モデルはわずか3.0個の質問しか行っていない点です。

手当たり次第に多くの質問をすることは、相手の労力を奪うだけでなく、解決に無関係な情報（ノイズ）を文脈に混入させる原因になります。核心を突く少数の質問に絞り込むことが、コミュニケーションのコストを下げつつ、成果を最大化するアプローチであることが実証されています。

まとめ：相手の負担を減らし、成果を最大化するコミュニケーション

業務の要件を明確にする際、単に「もっと詳細を教えてください」と伝えるだけでは、期待する情報は得られません。問題解決に直結する具体的な事象を見極め、相手が無理なく答えられる形式に変換して質問を投げかける技術が必要です。

今回紹介した研究データが示す通り、的を絞った少数の良質な質問は、不要なやり取りを40%近く削減しながらも、タスクの成功率を高める力を持ちます。AIとの対話においても、人間同士のプロジェクト進行においても、この「必要な情報を引き出す質問の技術」を意識することで、よりスムーズで確実な成果につなげることが可能です。

生成AIの導入や活用にお困りですか？弊社のサービスは、開発チームが抱える課題を解決し、生産性と幸福度を向上させるための様々なソリューションを提供しています。ぜひお気軽にご相談ください！

参考資料

Asking What Matters: Reward-Driven Clarification for Software Engineering Tasks