東京大学政策評価研究教育センター

CREPEFR-12 なぜ北欧諸国で行政データの活用が進むのか?:デンマークの経験から学ぶ


丸山士行(シドニー工科大学)


画像提供:butenkow / PIXTA(ピクスタ)

目 次
はじめに
行政データとは?
行政データの強み
行政データ活用の留意点
なぜ北欧?:福祉国家の根幹としての行政記録の一元化と電子化
政府による研究利用の推進
デンマークの経験は日本でどう生かせるか?

はじめに

エビデンス(実証結果)に基づく政策形成(EBPM:Evidence Based Policy Making)に向けた取り組みについて、さまざまな機会で議論が進められている。その中で、日本でも徐々に注目される機会が多くなってきたのが「行政データ(administrative data)」だ。行政データの政策現場や研究現場における活用は現在、北欧諸国が世界をリードしている。では、なぜ行政データが注目されるのか? なぜ北欧なのか? 本稿では、主にデンマークでの行政データ活用の歴史と現状について、シドニー工科大学ビジネススクール丸山士行氏に講義していただいた内容をお届けする。

丸山氏は、デンマークの行政データ(出生記録、入院記録など)用いた研究プロジェクトに、約8年間にわたって取り組んできた、主に医療・健康経済学(Health Economics)を専門とする実証研究のエキスパートだ。

現在、特に北欧諸国では行政データを活用した政策評価や実証研究で多くの成果を上げており、その先進ぶりは常に経済学研究のトップを走り続けてきたアメリカですら及ばない。アメリカのトップ研究者たちも、それに対応して行政データ研究利用拡大の必要性を主張してきた(たとえば、Card, D., Chetty, R., Feldstein, M. S. and Saez, E.〔2011〕"Expanding Access to Administrative Data for Research in the United States")。

こうした世界の動きに対し、日本の研究者たちも行政データの活用推進について声を上げ始めた。また、実際に東京都足立区や兵庫県尼崎市では自治体と研究者が連携したプロジェクトも進められている(足立区での成果は、別所俊一郎ほか「<特集>教育政策の実証分析」『フィナンシャル・レビュー』第141号、2019年、尼崎市での体制は「尼崎市学びと育ち研究所」ホームページで紹介されている)。

しかし研究者の中でも、実際に大規模な行政データを活用して研究を進めた経験のある者は必ずしも多くはない。今回お話を伺った丸山氏は、日本人では数少ない北欧の行政データを活用した研究論文を出版してきた研究者だ。そこで丸山氏に、これまで経験も振り返りつつ「なぜデンマークでは行政データ活用が盛んなのか?」「行政データの威力はどこで発揮されるのか?」「危険性や留意点はどこにあるのか?」そして、「そうした問題にデンマーク政府はどのように対処しているのか?」など、日本でも行政データ活用に関する議論を進めるために重要となるポイントを詳細に語っていただいた。日本で、優れた実証研究に積み重ねてエビデンスの質を向上させ、EBPMをさらに推進していくためにも、デンマークの経験と工夫は非常に参考になる。そこで本稿では、丸山氏の講義の内容を以下のようにお伝えしていきたい。第2節で行政データの特徴と、それを活用する代表例であるデンマークの制度を紹介し、第3節と第4節では行政データ活用のメリットと留意点を述べる。次に第5節では、なぜ北欧諸国で行政データ活用が進むに至ったかの理由と歴史的背景を解説し、第6節では現在の活用環境の実際を紹介する。第7節では、デンマークの現状や経験これまでの経験の中で、日本が特に参考とすべきポイントがどこにあるかを考える。

行政データとは?

本節では、行政データとはどんなものかを、具体例を交えて紹介する。「行政データ」は、「行政や企業などの通常の業務の一環で収集・蓄積されたデータ」と定義される。調査や研究を目的として集められたデータ(調査データ)とは、この点で大きく異なるものだ。

調査データは、その目的に沿って、できるだけ全国を代表するように調査対象(標本)を設計し、質問票を配布するなどして対象者に回答してもらって回収する、といった手順で構築される。日本の多くの政府統計などもこれに当たる。

一方、行政データは、普段の生活の中で誰もが経験する行政手続き等の記録から構築されるもので、業務の過程で溜まっていくデータである。引っ越しの際に住民登録する、子どもが生まれたら出生届を出す、などの手続きのプロセスで行政に蓄積される記録のことである。他にも、納税のための所得申告や、社会保険料の払い込み記録、医療機関が公的保険治療の費用を保険者に請求する際の診療報酬明細書(レセプト)、または犯罪記録など、行政に蓄積される記録は多岐にわたる。それらをデータとして捉えたのが行政データだ。これは調査データとは根本的に異なり、標本を設計するようなことはなく、原則として日本に居住する全員をカバーしている。

また、こうした行政データの定義から、政府の業務だけでなく民間企業の日々の業務で溜まっていく記録も、同様のものとして分類でき、海外では両者をまとめて「administrative data」と呼ばれている。たとえば、店舗のレジのPOSデータや、製造コストの記録、ネット通販ユーザーの購買履歴やアクセスログ、SNS上のつながりやコミュニケーションの記録、秒単位の株の取引き履歴など、それこそ多種多様だ。ただし、これらの主体は行政ではないので、日本では区別して「業務データ」と呼ばれることが多い。本稿では、政府の行政データの例を紹介していくが、マーケティング施策の効果測定や経営業務の改善などに、業務データを活用した科学的な分析を取り入れている企業も出てきている。IT企業が経済学者やデータサイエンティストを雇って分析を担当させ、経営に役立てている話は特に有名だろう。

行政データの代表例:デンマークにおける導入
冒頭でも述べたように、現在、行政データの活用では北欧諸国がリードしている。ではなぜ、実証研究が特に盛んなアメリカなどではなく北欧諸国が、行政データの研究利用や政策評価への活用をリードしているのだろうか。ここではデンマークを例に、それを支える根幹となる制度を紹介しておこう。

北欧諸国で行政データの業務・研究での活用が活発な理由としてまず挙げられるのは、それらの国々では非常に早い時期からすべての国民に対する個人番号制度が導入され、行政の電子化が進められてきたことだ。デンマークの場合、制度の導入は1968年である。一方、アメリカの制度である社会保障番号(Social Security Number)は、最初の導入こそ1936年だが全員に取得を義務付ける制度ではなかった(たとえば、羅芝賢〔2019〕『番号を創る権力』東京大学出版会、総務省「諸外国における国民ID制度の現状等に関する調査研究報告書」などを参照)。

デンマークの個人番号制度は、「国民台帳制度(CPR: Det Centrale Personregister / Civil Registration System)」と呼ばれている。基本的な考え方は、「全国民・住民に漏れなく固有の番号を付与し、名前、生年月日、出生地、住所などの基本情報を一元的に、リアルタイムで管理する」というものだ。考え方は制度導入当初から一貫しており、導入から50年以上経った現在では行政の電子化も進み、長い工夫と努力の歴史を経て今日のような環境を形成しているのである。

実は、上記の国民台帳制度の基本的な考え方は、行政データが実証分析において発揮する強みと密接に関連する。そこで、デンマークにおける制度の歴史的な背景や利用動向の現状については後ほど紹介することとし、先に行政データの強みとその留意点について具体的に見ていくことにしよう。

行政データの強み

政策評価や研究における行政データの活用には、どのような強みやメリットがあるのだろうか。調査データなどと比較しながら、具体的に整理する。以下では、大きく5つに分けて議論する。

(1) 調査では得られないデータ
第1に、調査データからは得られないまったく新しい変数が、データとして利用可能になりうる。通常の調査はまず行えないような対象、たとえば生活保護や病院の診断記録、または中絶、犯罪、学力試験や、自己破産の履歴、養子・婚外子の別の記録なども利用できる可能性がある。企業の業務データも同様で、たとえばSNSのつながりデータはネットワーク形成の分析などに用いられている。行政データを利用することで、今まで知ることができなかった新しい情報を活用できるようになる点は、最も重要な強みとしてまず強調しておきたい。

(2) 全国を代表する正確なデータ
第2の強みはデータの代表性だ。行政データは多くの場合、その地域や国民全体をカバーしており、標本調査で集めたデータで悩みの種となる「代表性の問題」が生じない。代表性の問題とは、調査対象である標本の集団が、本当に調べたい対象(たとえば日本全国の国民)の特徴をきちんと反映していない場合に生じる問題だ。これがなぜ問題かというと、標本調査を使って国民全体の特徴を分析しようとする際に、実は偏った特徴の人たちが調査対象となっていて標本が国民全体とは異なる特徴を持ってしまうと、どんなに高度で優れた統計分析の手法を用いたとしても、国民全体の特徴を反映した結果を得ることはできないからだ。たとえば、新製品のチョコレートについて市場調査を行う場合、「原宿の竹下通りで1000人に聞きました!」という形で詳細な街角アンケートをとったとしても、この結果が日本全体での売れ行きを推測するのに役立ちそうもないことは明らかだろう。もちろん、「この新作チョコは竹下通りに来る人にだけ売りたい」ならばよいが、そうでなければ市場調査としては不十分だ。またこの問題は、標本をどんなに巨大にしても、対象に偏りがある限り解決できないため、非常に厄介だ。某IT企業が何百万人もの顧客の購買履歴を記録したビッグデータを抱えていても、それがあるサービスに惹きつけられた特定の人々の集団である場合には、国民全体の特徴を反映した分析結果は得られない。ところが、政府が抱える行政データにはこうした心配がない。この点は、一般的な結果を得ることを目的とする科学的な分析では非常に大きな利点となる。

また、行政データの正確性も特筆に値する。行政データの場合、回答のミスや欠落が調査データと比べて圧倒的に少ない。さらに重要なのは、「報告バイアス(reporting bias)」がないという点だ。報告バイアスとは、回答者がアンケートに記入する際に意図的に所得、学歴、体重などを低く(あるいは高く)答える、数字をキリの良いところで丸めて回答する、といったことが要因で生じるバイアスである。アンケート調査などで所得、学歴、体重などの情報を集める際には、報告バイアスが混ざり込んでしまう可能性が高い。一方、行政データの場合は自身でアンケートに回答するのではなく、行政への届け出等から機械的に蓄積されるものであるため、この種の報告バイアスが入り込む余地がない。たとえば、所得に関する情報は雇用主が記録し、政府に報告され蓄積される、といった具合である。

(3) ダイナミックな変化を捉えたデータ
第3の強みは、行政データは業務上の記録として機械的に繰り返し記録されていくものであることから、長期間にわたって個人ごとに追跡可能な点だ。これにより、世代間のつながりもデータ上で観察できるようになる。たとえば、家族構成のつながりも把握できるし、その関係が生物学上の親子なのか養子かといった点まで記録されている。家族の問題のダイナミクスを分析するような場合には強力なデータソースとなるだろう。

(4) レアな事象も分析可能なビッグデータ
第4に、サンプルサイズの大きなデータが扱えることも重要な利点である。行政データは、基本的には自治体の人々や国民全体をカバーする。もちろん、デンマークの人口は約580万人と、日本やアメリカなどとは比較にならないほど少ないし(日本で言えば千葉県が約630万人)、自治体のデータを用いる場合には規模はさらに小さい。行政データであれば常に大きなサンプルサイズをもつというわけではないが、巨大な行政データが利用できれば、通常の調査データなどでは統計分析ができないレアなイベントも、統計的に識別可能となる。代表性が担保されたビッグデータは、分析の可能性を広げてくれるだろう。 上記は研究者にとっての技術的な話に聞こえるかもしれないが、こうしたレアなイベントからのエビデンスが得られるメリットは、政策的にも一般の人々にとって非常に大きい可能性がある。たとえば、発症率は低いが致死性の高い病気はさまざまに存在しており、もし罹患すれば人々の幸福に大きな悪影響を及ぼすことになる。私たち自身、治療や入院に備えて自主的に保険に加入するほどの重大なリスクだ。大規模な行政データを扱うことで、こうしたレアだが重要な事象からもエビデンスを引き出すことができるようになるのである。たとえば、「CREPEFR-13」で紹介する研究では、「前置胎盤」という非常にレアな症例の記録を使って、低体重出生が子どもの将来に与える因果効果を識別している(Maruyama and Heinesen 2019)。また病気に限らず、大規模災害や犯罪被害などに遭った者のその後の影響を分析する際にも行政データは有用である。この点は、政策的な対応が必要な事象に対して科学的分析を適用できる可能性が大きく広がることを意味しているため、EBPM推進の視点からでも非常に重要なポイントとなるだろう。

(5) データを組み合わせることで得られる価値
第5に、複数のデータセットを個人レベルで結合できる点も大きな利点である。ただし、この点は行政データの強みというよりは、デンマークなどの北欧諸国における個人番号制度の強みだといえる。個人番号による管理が徹底されていることで、さまざまな行政記録を結合して利用することができるのである。もちろん行政記録は重要情報であり、その性質に基づいて用途が限定されている場合もあるし、番号による結合が禁止されている国も少なくない。しかし、もしある程度記録を結合できれば、たとえば出生体重と犯罪の関係、小学校時代のクラスのサイズと離婚の関係、新生児が生まれることが親の再犯確率に及ぼす影響、などを分析することが可能となる。

データを組み合わせることの利点は研究利用のみならず、行政実務の面でも大きなメリットがある。たとえばデンマークでは、国民台帳制度の整備と電子化の徹底を背景として、1980年を最後に国勢調査が廃止された。この制度に基づいて行政記録を活用すれば、人口等の現状把握は十分という判断からである。国勢調査といえば、日本では5年に1回全数調査が実施されている。一方、デンマークの場合は、自治体レベルで出生や住民登録などの行政記録を集約して性別、年齢、家族構成などの人口動態の情報を把握している。国勢調査で人口に付随して調査される所得、学歴、就業状態などの基本的な変数も、行政記録に基づいて包括的に把握できる。国勢調査の実施には膨大な人的・時間的・金銭的コストがかかるが、行政データの活用でそれをカバーしている国も存在するのである。この点も、行政データ活用の大きなメリットの1つである。

行政データ活用の留意点

次は、行政データを活用する際の留意点や問題点などを5つに分けて整理したい。もちろん、行政データも万能なツールではない。強みと問題点の双方をしっかり認識したうえで利用する必要がある。また、行政データは国家にとっても個人にとっても重要な情報であるため、政府は厳重かつ慎重に管理したうえで研究利用を認めており、研究者側にも大きな責任を伴う。このことは、まず強調しておきたい。

(1) 主観的な質問はない
第1の留意点は、行政データでは個人の主観的な質問に対する回答は存在しないという点だ。調査では、「どれくらい幸せですか?」「どれくらい健康ですか?」といった質問はよく行われるが、当然ながら行政記録にそうしたものはない。また、調査ではよく行われ、実証分析で用いられることも多い、人々の将来の計画、認知能力や性格に関する質問、1日の時間利用の配分なども行政データには存在しない。たとえば、日本の「社会生活基本調査」(総務省統計局)のような人々の時間配分に関するデータは、行政データから得ることはできない。

ただしデンマークでは、こうした調査を行う際にも、事後的に別のデータセットと結合することが常に意識されている。標本抽出の際に国民台帳制度の個人識別番号を利用するため事後的な接合が可能なのだ。加えて、行政記録にすでに蓄積されている基本的な変数については、統計調査の際に省略できるというメリットもある。1つの調査で聞ける変数の数は費用面でも回答者の負担という面でも限られてしまうので、デンマークではそうしたロスを避けるためにも、すでにストックされている情報を改めて尋ねないように調査が設計されているのである。

(2) データが扱いにくい場合も多い
第2に、行政データは研究目的で集めているわけではないので、研究者が利用する際には困難を伴う場合がある。デンマークの場合、政府も研究者も頻繁に用いる人口動態や所得などの基本的なデータは、「公共財」としてデンマーク統計局(Statistics Denmark)が整備し、アクセスも比較的容易となっている。一方で、一般的に用いられる頻度が少ないデータ、たとえば市区町村が運営するコミュニティセンターや介護施設のデータなどを研究利用しようと思うとかなり大変で、複雑な申請プロセスを経てようやく利用許可が得られても、データクリーニングが非常に手間暇を要する場合がある。

(3) 研究利用のハードルは低くはない
第3に、行政データの研究利用へのハードルはやはり低くはないということも指摘しておかなければならない。デンマークでは、統計局を中心に手続き等も整えられてはいるが、それでも調査データの利用と比べれば制限は大きく、手続きも厳重で、不適切利用に対するペナルティも大きい。近年のプライバシーへの意識の高まりや、行政データの研究利用の拡大により利用者が増加していることなどを背景として、最近は特に管理が厳しくなっている。

また、デンマークの行政データの研究利用には、世界中の研究者に開かれた申請方法があるわけではなく、常にデンマーク国内の大学や研究機関を介さなければならない。そのため、海外の研究者がデンマークの行政データを使うためにはデンマーク国内に協力者をみつける必要がある。

利用の際は、デンマーク国内のサーバを通じてデンマーク統計局内のデータが蓄積されたコンピュータにリモートアクセスする。詳細は第6節「政府による研究利用の推進」で紹介するが、局内にはStataやRなどの一般的な統計ソフトがインストールされたコンピュータが設置されており、分析等もそのサーバ上で行うことになる。丸山氏の場合は、デンマーク国内の研究所Rockwool Foundationに所属しており、そこのサーバを介してデンマーク統計局にアクセスしているという。

(4) 利用にあたっての責任とリスク
第4の留意点は、利用には大きな責任を伴うという点だ。丸山氏によれば、残念ながらいくつか悪い前例もあり、徐々に申請の手続きが厳しくなっているという。海外の研究者が誤ってデータベースを丸ごとダウンロードしてしまったような例などもあったようだ。行政データは個人にとっても国家にとっても重要なデータであり、不適切な利用は許されない。

デンマークでは、ローデータのダウンロードはもちろん、どのような形であれ個人番号や個人が特定されうる情報をサーバ外に出すことは固く禁止されている。集計・分析結果であってもサーバの外にデータを取り出す際には、規定内のものかどうか厳しくチェックされる。たとえば、基本的な記述統計である最大値や最小値は特定の個人1人に基づいた情報なので、そのダウンロードは罰則の対象となる、というほどの厳しさである。著しく不適切な利用が認められれば、当該者は利用資格を永久に失うことになるし、その所属機関も連帯責任で一定期間利用が禁止されるなど、かなり厳しいペナルティが課される。丸山氏も、研究者仲間から「分析結果をダウンロードする際には手が震える」といった声も耳にすると話す。それほど慎重に扱わなければならないデータなのである。

(5) 変数が多すぎる
第5に、使える変数が多すぎることにも留意すべきだ。メリットの裏返しでもあるのだが、非常に多くの変数を結合して扱うことができるので、従属変数も独立変数もいくらでも考えられてしまう。そのため、変数を入れ変えながら繰り返し分析していたら、そもそもの仮説やモデルが何だったのかわからなくなってしまった、などといったことも起こりかねない。膨大な変数を利用し、実際にはやみくもに推定してうまくいった結果だけを取り出して、後付けで仮説を考えて論文を書くようなこともできてしまう。もちろんそんなことは言語道断だが、そうやって書かれた論文を第三者が読んで、その背景まで見抜くのは難しい場合もある。この点は、査読の際にも問題になりうるかもしれない。


なぜ北欧?:福祉国家の根幹としての行政記録の一元化と電子化

ここまでで、留意点はあるものの、行政データの実務や研究における大きなメリットを感じていただけたのではないだろうか。デンマークの場合、現在の行政データを取り巻く環境を支えているのは、先に紹介した「国民台帳制度」である。しかし、こうした個人番号制度の導入と徹底にあたっては、国民のプライバシーへの懸念や政府の管理体制などが重要な問題となりうる。それではなぜ、北欧諸国ではこうした制度の導入と徹底が可能で、結果として世界をリードする行政データ活用環境が整えられることになったのだろうか。

丸山氏によれば、デンマークなどの北欧諸国で早い時期から、国民全員をカバーする個人番号制度が受け入れられてきた背景として最も重要なのは、それらの国々に浸透する「福祉国家」に対する意識だという。周知の通り、北欧諸国では高福祉・高負担の社会福祉制度が定着している。それを機能させるためには、必要な高負担を国民に受け入れてもらい、適切に制度を運営するためにも課税の公平性や透明性、および国民の税に対する信頼が重要となる。それを支えるものとして、国民台帳制度を通じて全国民の所得や資産の状況、家族構成などを「完璧に」捕捉し、一元的に管理する必要があった。加えて、政府も国民の信頼を得るために、適切な公共サービスを提供し、管理・運営ためにたゆまぬ努力や工夫を重ねることで今日の状況を作り上げてきたことも忘れてはならない。デンマークにおいては、データの漏洩や不適切利用などさまざまな問題は生じつつも、厳しくその原因を究明し、責任の明確化や業務の改善などの対策が講じられながら、国民の信頼を損ねることなく制度を維持・発展させてきたのである。

それを反映して、OECDによる政府への信頼度調査などでも、最近の2018年でデンマークは高い値を示しており、その値は2007年からほとんど変化していない(図1)。国政選挙への投票参加率も長年にわたり一貫して高い値を示しているのも、国民が政府の活動に関心を持ち、信頼しつつも積極的に関わろうとしてきたことの一端を表していると言えるだろう(図2)。

図1 OECD政府への信頼度合いの推移

(出所)OECD (2019) Government at a Glance 2019より。

図2 国政選挙(議会)の投票率の推移

(出所)International Institute for Democracy and Electoral Assistanceより。

デンマークにおいて、国民台帳制度および今日の先進的な行政データの活用環境を支える最も重要な土台として丸山氏が特に強調するはこの点、民主主義への信頼感、福祉国家への誇りと主体的な帰属意識が国民に共有されている点である。政府への信頼や投票率の結果もそうだが、消費税(付加価値税)25%、所得税約50%という世界でもトップクラスに高い税金を国民が納得して納めているのは、国民が自分たちの社会制度に満足し、愛着と誇りを持っていることの表れだといえるだろう。もちろん、デンマークの政府や行政も、各国と同じように批判されることはあるが、国民がこうした意識を共有していることは重要なポイントだと、丸山氏は指摘する。

個人番号制度の導入に当たっては、国民のプライバシーへの懸念が重要な問題となりうるが、デンマークの場合は国民台帳制度を中心とした行政管理の電子化の導入とその活用も、国の制度運営のために必須の要素として受け入れられてきた。また、行政記録の電子化と一元的な管理を進めることができた背景にも、そのメリットが広く認識される素地が長らく醸成されてきたことがあるだろう。近年徹底して電子政府を進めたことで話題になっているエストニアについて、行政のキャパシティや地理的な特徴から業務の効率化が必要だったという要因も指摘されている。しかし丸山氏は、デンマークと同様に福祉国家への意識が共有されていたことが重要だったと指摘する。個人番号制度に基づく電子政府の浸透については、国の余力が小さく統計調査を行うのが困難、規模が小さく国民も同質的で合意が得やすい、などといった点もよく指摘される。確かにその点も要因となりうるが、本質的に重要なのは福祉国家に対する意識だと考えられる。

一方、日本ではマイナンバーが国民に通知されたのが2015年であり、導入後もマイナンバーカードが普及しないことなどが課題となっている。デンマークなどの北欧諸国と比べて、どこに差があるのか、なぜ個人番号制度の浸透と活用にこれほどの差が生じるのかについては、きちんと議論されてよい問題かもしれない。

政府による研究利用の推進

これらを背景として、北欧諸国で行政データの業務での活用が進み、さらに政府や研究利用も促進している。本節では、デンマークにおける研究利用の現状について、政府の学術研究との向き合い方なども交えて紹介する。

利用の中心は国内研究者
第4節「行政データ活用の留意点」で述べたように、デンマークの行政データに研究目的でアクセスするためには、国内の大学や研究機関を通じて申請する必要がある。そのため、行政データ先進国であるデンマークといえども、利用は国内研究者が中心だ。海外の研究者が使うには、デンマーク国内の研究者や研究機関のプロジェクトなどに入れてもらう必要がある。

ただし、プロジェクトにデンマーク国籍の者が参加している必要はなく、外国人研究者でもデンマーク国内の機関に所属していれば申請可能だ。丸山氏が利用を始めたきっかけは、現在は北海道大学に所属する今井晋氏がRockwool Foundationに所属していた際に、今井氏のプロジェクトに参加したことだったという。

なぜ政府は研究利用を推進するのか?
北欧諸国の行政データを用いた研究論文はこれまでにも多数出版されている。それではなぜ、政府は厳重な管理が必要な重要情報である行政データを、研究利用のために環境を整え、促進しているのだろうか。

その背景として丸山氏が指摘するのは、現在のデンマークでは、データは国民の「共有財産」、つまり「公共財」だという認識が定着しているという点だ。データは国民から集めた高い税金を使って整備・構築したもので、政府も当然の義務として国民に資する形で最大限有効に活用できるように体制を整えようとしているという。実際、政府が政策評価などを政府系シンクタンクや研究者に依頼する際にも、行政データが提供されることは多いし、政府とは異なる立場からの学術研究や政策評価分析であっても行政データの利用を妨げられるようなことはない。

さらに重要なのは、この点が法的にもきちんと明確に規定されていることだという。たとえば、2018年に制定されたデンマークの「データ保護法(The Danish Data Protection Act)」では、データの取扱いなどが規定された第10条において、「社会にとって重要な統計または科学的研究を実施するために必要となる場合にのみ利用することができる」と示されている。また、やはり2018年に改正されたデンマーク統計局の目的などを定めた法律(デンマーク統計法:lov om Danmarks Statistik)でも、その第1条で、デンマーク統計局の役割として、「統計分析と科学的な研究目的のためにデータを利用可能にすること」と明記されている。

加えて、行政データを活用することで得られるエビデンスの重要性を、政府も十分に認識しているという点も、データの活用を推進する大きな要因だ。過去にも科学的なエビデンスに基づく政策評価が、実際の業務や政策の改善に貢献した実績も数多く積み重ねられてきたし、制度改革などを検討する際には行政データを活用して見出されたエビデンスに基づいた議論も展開されている。国会でも、莫大なお金を投入して実行した政策の効果については政治家から問われることになるが、それに対して政府もエビデンスを示して答える応えることが当然のように求められる。政府が経済問題等を諮問する会議においても、集められた有識者が中心になってエビデンスに基づく議論がなされる。たとえばこれまでにも、失業者に対する職業訓練プログラムを実証的に評価し、プログラムの改善につなげるといったことが行われてきた。

ここまで聞くと、デンマークは行政データを使いたい実証研究者にとっては理想的な世界に見えるかもしれない。しかし、こうした環境は一朝一夕にできたものではないことは、国民台帳制度導入からの半世紀にも及ぶ長い歴史を考えれば明らかだろう。また、1968年の導入当初から行政データの研究利用が視野に入っていたわけではなく、あくまで制度運営のために整備したものであり、制度の公平性や透明性を確保するために国民台帳制度が必要だった。このことは、丸山氏も繰り返し強調するところである。高福祉・高負担に基づく福祉国家の制度を適切に運営し、国民への説明責任を果たすための政府のたゆまぬ努力の結果、国民もその便益を理解することで社会に定着し、今日のような環境に結びついている。こうした姿がすべてにおいて望ましい制度だというわけではないが、個人番号制度の定着と行政記録の活用が浸透してきた要因としては、国民の福祉国家に対する期待と、それに応えるための政府の対応の積み重ねが大きい。

デンマークの経験は日本でどう生かせるか?

それでは、デンマークのこれまでの工夫の中で、日本が参考にできる点はどこにあるのだろうか。

まず、デンマーク統計局の体制と役割、各大学や研究機関との関係を紹介しておきたい。多くの行政データは、デンマーク統計局が一括して管轄している(医療記録などは日本の厚生労働省にあたる部局が管轄している)。データの管理や整備、クリーニングについてもデンマーク統計局が担っている。膨大な行政データの管理や整備には多くの統計の専門家が必要となるが、統計局は統計学などの博士号を持った人材を多数抱えている。

こうした環境のもとで、先ほども触れたように、統計局内に各大学や研究機関がサーバを設置し、ここにアクセスして利用する。局内には利用者への対応を行う部局も設置されており、外部の利用者がデータや運用について問い合わせを行った場合にも、迅速に対応してもらえる体制が整えられている。たとえば、変数の細かな定義や作られ方、サーバの問題などのテクニカルな質問に対してもしっかり回答やアドバイスをしてくれる。政府と同様、デンマーク統計局も、研究にデータを役立ててもらうのは当然の義務だというスタンスで一貫しているのである。

ただし、丸山氏が強調するのは、こうした環境を利用するために、外部者側もそれなりの費用を負担しており、すべて政府の負担で研究機関は無償でデータを使えるわけではないという点だ。大学や研究機関は統計局内にサーバを設置し、利用させてもらう代わりに、かなりの利用料を統計局に納めている。大学や研究所などの組織で支払っている場合もあるし、研究者グループが取得した資金から支払っている場合もある。

当然、これだけの体制を維持・運営するには専門家の人件費も含めてかなりのコストがかかる。そのため、利用環境の整備と維持に貢献する意味でも、外部利用者側から利用料を集めるというのは妥当な仕組みだといえる。こうした体制づくりは、日本でも参考にすべきポイントではないかと丸山氏は述べる。

日本のように、それぞれの大学や研究者がまったく別々にサーバを設定し、データを蓄積しているような状況では、スケールメリットを活かすことができず、総体的に見れば非効率だと言わざるをえない。一方で、デンマーク統計局を中心とする体制の強みを取り入れることができれば、利用に参加する大学や研究機関から利用料という形である程度の資金を提供してもらうことで、一元的にデータの蓄積・管理・整備を行うことができるので、スケールメリットも活用できて非常に効率的だ。たとえば日本でも、総務省統計局などの機関に研究サポート部局を設置し、大学や研究機関等から利用料を集め、設備投資と専門家の配置を行い、データを集中的に管理するなどといった方法も考えられる。こうした対応は、学術界だけでなく国の戦略としても重要なポイントだろう。

そもそもデンマークで50年もの長い期間を経てきた現在の行政データ利用環境を見て、それを日本で一朝一夕に実現させるというのは無理な話ではあるが、見本とすべき例はすでにデンマークを含めて複数あるので、それらを参考にしつつ、できるところから着実に一歩ずつ前進していことができるだろう。その過程では、既存のデータも活用して科学的なエビデンスを蓄積し、それに基づく議論を行って政策の評価や改善に役立て行くことが肝要だ。データがいったい何の役に立つのかわからない状態で、稀に流出などのニュースを聞かされてしまえば、国民の理解を得るのは難しい。プライバシーへの意識が高まっている近年ではなおさらだろう。政府も研究者も、しっかりとエビデンスの質を高めつつ、それを政策形成に役立てることの重要性を示し、国民に広くメリットを感じてもらえるようにしていくことが、行政データ活用に向けた重要なプロセスにもなりうるのではないだろうか。

[収録日:2020年1月15日]

CREPEフロンティアレポートシリーズはCREPE編集部が論文の著者へのインタビューをもとにまとめたものです。