「日本の法令に関する多肢選択式QAデータセット」とは
デジタル庁がGitHub上で公開した「日本の法令に関する多肢選択式QAデータセット」は、大規模言語モデルの法務領域における処理能力を測定するためのベンチマーク用データです。
本データは司法試験予備試験の短答式試験問題をベースに構築されており、民法などの法令知識を問う設問が体系的に収録されています。各レコードには問題文と選択肢に加え、正解および根拠となる条文番号がメタデータとして付与されているのが特徴です。
開発者は、AIが単に法知識を記憶しているだけでなく、事案に対して適切な条文を適用し論理的な推論ができているかを、客観的な数値に基づいて検証することが可能となります。
デジタル庁「日本の法令に関する多肢選択式QAデータセット」を作った背景
本データセット構築の主な背景には、生成AIの急速な社会実装に伴い、その出力精度や安全性を評価する手法の確立が急務となっている現状があります。とりわけ高度な専門性が求められる日本の法務領域においては、モデルの性能を適切にテストするための高品質な日本語データセットが不足していました。そこでデジタル庁は、AIシステムの信頼性を担保するための共通指標として利用できるよう、権利関係がクリアな公的試験問題を基にしたデータの整備を行いました。
行政や企業が法務AIを導入する際、性能を定量的に比較評価できる環境を整えることが、安全な利活用の促進につながると考えられています。
「日本の法令に関する多肢選択式QAデータセット」の活用方法
日本の法令に関する多肢選択式QAデータセットは、AIモデルの性能評価のみならず、検索システムの精度検証や、法務特化型AIを開発するための追加学習素材として、多角的な活用が期待されています。
活用方法①:AIの実力を測る「実力テスト」として
最も基本的な活用法は、開発した大規模言語モデル(LLM)が日本の法律をどの程度理解しているかを確認するベンチマークテストです。データセットに含まれる問題をAIに解答させ、その正答率を算出することで、モデルの基礎的な法務知識レベルを数値化します。
例えば、民法の問題には強いが刑法は苦手であるといった特性や、論理的な推論ができているかを客観的に把握できます。ChatGPTや国産モデルなど複数のAIを比較検討する際、自社の業務に最適なモデルを選定するための判断材料として機能します。定期的にテストを行うことで、モデル更新時の性能変化を監視する役割も果たします。
活用方法②:AIに外部知識を参照させる「教科書」として(RAG)
実務でAIを利用する際は、条文などの外部知識を検索して回答させるRAG(検索拡張生成)という技術が一般的です。このデータセットには、各問題の正解となる「根拠条文」が紐づけられているため、RAGシステムの検索精度を検証するのに最適です。
具体的には、AIが回答を作成する前に、「e-Gov法令検索」などの信頼できる法令データベースから「正しい条文を見つけ出せたか」をテストします。もし正解の条文が検索結果に含まれていなければ、検索システムの改善が必要だと分かります。
このように、回答の文章だけでなく、その裏側にある検索プロセスの正確さを評価・改善するために利用されます。
活用方法③:AIを法律特化に育てる「ドリル」として
汎用的なAIモデルを、より法務実務に強い専門モデルへと進化させるための学習データとしても活用可能です。これをファインチューニング(追加学習)と呼びます。
一般的なAIは日常会話は流暢でも、法律特有の厳密な言い回しや論理構成には不慣れな場合があります。そこで、このデータセットの良質な問題と正解のペアをAIに繰り返し学習させることで、法律家のような思考パターンや専門用語の適切な使い方を習得させることができます。
いわば、基礎教育を終えたAIに対し、司法試験レベルのドリルを解かせて専門性を高めるトレーニングを行うイメージです。
「日本の法令に関する多肢選択式QAデータセット」の入手方法と具体的な使い方
本データセットはデジタル庁のGitHub公式リポジトリから無償で取得可能です。ここでは具体的なダウンロード手順と、チャットAIを用いた手軽な検証方法について解説します。
データの入手方法
デジタル庁が公開しているGitHubリポジトリへアクセスすることで、データセット一式をダウンロード可能です。データはJSONと呼ばれる形式で保存されていますが、これは一般的なテキストファイルとして閲覧できるほか、Excelなどの表計算ソフトに取り込んで内容を確認することも容易です。
ファイル内には問題文、選択肢、正解が整理されて格納されています。また、本データは「公共データ利用規約」のもとに提供されています。これはクリエイティブ・コモンズ・ライセンス(CC BY 4.0)と互換性があるため、同等の条件で利用可能です。出典さえ明記すれば商用利用や加工が自由に行えます。(※ 利用の際は、必ず配布元の最新の利用規約をご確認ください)
企業の研究開発においても権利関係の懸念が少なく、スムーズに利用を開始できる仕様となっています。
生成AIで試してみる
高度な開発環境を構築せずとも、ブラウザ上で動作するChatGPTやClaudeなどの対話型AIにデータを直接入力してテストすることが可能です。
手順はシンプルで、データセットから問題文と選択肢のテキストをコピーし、「あなたは法律の専門家です。以下の問題に答え、その理由も説明してください」といった指示と共にAIへ送信します。
これにより、AIが正解を選べるかどうかに加え、どのような論理で結論に至ったかという思考プロセスも観察できます。単なる正誤判定だけでなく、法的な推論に誤りがないかや、もっともらしい嘘をついていないかを定性的に評価する、手軽な実験として有効です。
まとめ|国が後押しする「法務AI時代」への適応の一歩をLegalOnで
デジタル庁による「日本の法令に関する多肢選択式QAデータセット」の公開は、単なる技術検証用データの提供にとどまりません。これは、我が国が法務領域におけるAIの社会実装を強力に推進していることの表れとも言えます。
司法試験レベルのナレッジをAIが扱うための基盤が整備されたことで、今後、法務業務へのAI導入が加速していくことは確実です。このような情勢の中、企業の法務担当者にとっても、AIに関するリテラシーを高め、業務フローへの組み込みを検討することは、避けて通れない課題となりつつあります。
法務AI「LegalOn」は、弁護士の知見と最先端のAI技術を融合させ、これからの法務担当者に求められる「質と効率の両立」を支援するリーガルテックツールです。官民一体となった「法務AI時代」の波に乗るための手段として、このツールの導入を検討することは有力な選択肢の一つと言えます。具体的な機能や活用事例をまとめた資料を、ぜひ以下よりダウンロードしてご覧ください。
<関連記事>
AIエージェントは法務実務を変えるか?|生成AIとの違いなど基礎知識と共に解説
【2025年最新】法務担当者の生成AI利用率は?利用しているツールも調査
法務におけるAI活用例をプロンプト例付きで紹介。生成AIの使い方や注意点も解説!

