東京大学政策評価研究教育センター

論文プレビュー:行政データを活用した実証研究(1)――「出生時体重研究」を問い直す

論文:Maruyama, S., and Heinesen, E. (2020) "Another Look at Returns to Birthweight," Journal of Health Economics, 70, 102269.
著者:丸山士行(シドニー工科大学)、Eskil Heinesen(Rockwool Foundation)


画像提供:Fast&Slow / PIXTA(ピクスタ)

目 次
はじめに
出生時の体重が健康、成績から所得まで左右する?
双子のデータで因果関係に迫れるのか?
妊娠期間の違いをどのように捉えるか
行政データが可能にした分析
新しいエビデンス:出生時体重の影響は次第に消えていく
行政データの活用が新しいエビデンスをもたらす

はじめに

本稿では、「CREPEFR-12」(以下、FR-12)で丸山士行氏(シドニー工科大学)に紹介いただいたデンマークの行政データを活用した、低体重での出生が子どもの将来に及ぼす影響についての実証研究を紹介する。

「FR-12」では行政データの強みを5つに分けて紹介したが、この研究はまさにそこで挙げられた強みが発揮されたものだ。ここでは、デンマークの行政データによって30年にも及ぶ長期かつ詳細で正確な、約200万もの親子の個人データを確保し、「前置胎盤(placenta previa)」という非常に稀な症例の記録を利用して妊娠期間の違いに起因する低体重の影響が子どもの将来に及ぼす影響の因果関係に迫る工夫を行った。

この研究で、どのように行政データの特徴をうまく活用して実施し、従来のアプローチとはどのように異なるインプリケーションが得られたのかという点に特にフォーカスして、丸山氏に解説いただいた内容をお伝えする。

出生時の体重が健康、成績から所得まで左右する?

低体重での出生は、子どもの心身の健康や発達、テストの点数や学歴、将来の所得や犯罪行動などに影響を及ぼすだろうか。及ぼすとすれば、いつ、どのように影響が現れるのだろか。この問題は、経済学に限らずさまざまな学問分野で研究が積み重ねられてきたテーマであり、実際も多様な実証結果が報告されてきた。

しかし、「出生時体重が子どもの将来に影響を及ぼす」と一言でいっても、本当にそこに因果関係があるのか? 家庭環境や発育環境など両者の背後にある要因の影響が強く効いているのではないか? 仮に因果関係があるとして、一体どの程度の大きさなのか? などの詳細を確かめるのは、決して簡単なことではない。子どもの健康や将来の社会経済的なに影響を与える要因は出生時体重以外にも無数に存在するが、出生体重自体もそれらの要因と関係することが知られているからだ。たとえば、親の所得や学歴、子どもへの関与の仕方などは、子どもの健康や発達、学力などに影響を及ぼすだろうし、同時に出生体重は親の所得や学歴、出産年齢、喫煙状況などと統計的に有意な関係があることが知られている。そのため、子どもの将来の変数と出生体重の間に統計的な相関が認められたとしても、それが本当に出生体重の因果効果なのかを見極めるのは、非常に困難な作業となる。こうした問題に対して、経済学の実証研究においても、因果関係に迫るためのさまざまな工夫が重ねられてきた。その1つが、双子のデータを利用した分析アプローチである。

双子のデータで因果関係に迫れるのか?

なぜ双子に着目することで因果関係に迫れると考えられてきたのだろうか。それは、同じ母親から生まれた双子の場合、観察できない遺伝的な家族固有の要因など、出生後の健康や将来の社会経済的な状況に影響を及ぼす可能性のある要因はほぼ同じであるとみなすことができるからだ。そのため、双子で出生時の体重が異なるのであれば、その他の要因をコントロールしたうえで、出生時体重の差によりフォーカスした分析を行うことができると考えられてきたのである。この方法で多くの研究が重ねられ、さまざまな実証結果が示されてきたが、丸山氏によれば、双子研究には大きな問題も存在するという。

大きな問題としてまず指摘できるのは、双子研究では、双子間で体重に差が生じた要因が不明であり、それを実証的に検証する方法もないという点だ。従来、双子研究では子どもの体重の差がランダムに発生していると解釈して分析がなされてきた。しかし、よくよく考えてみると本当にランダムに生じているとみなしてよいかどうかさえ、わからないのである。何らかの要因が働いて双子間で体重に差が生まれているのかもしれないが、それを検証する方法がないため、双子間の出生時体重の差を利用した分析がどんな要因で生じる何の効果を捉えているのか、実は誰もわからないことになってしまうのである。この点は、実証研究の結果を解釈するうえでは大きな問題だと言えよう。

医学的には出生時体重を決定づける要因として、大きく次の3つが挙げられている。1つめは遺伝的特徴に基づく要因(栄養摂取能力や筋骨格など)、2つめは妊娠期間の長さ(出生のタイミング)、3つめは子宮内環境(母胎の栄養状態・疾病・ストレス・喫煙など)である。

3つめの要因は、特に途上国などでは重要な問題となる。母親が妊娠中に十分に栄養を摂取できる環境で生活できているかどうかが大きく関わってくるからだ。ところが先進国では、多くの場合カロリーなどは十分に摂取できている場合が多いため、この点が重要な問題となるケースは途上国と比べれば多くはない。1つめの要因は、小さい親の子は小さい、という話であり、そのこと自体、自然であり何ら問題がないし、医学的・政策的に介入が必要な話ではない。すると、先進国で一般に出生時体重の決定要因として重要なのは、2つめの妊娠期間の長さだと考えられる。

ところが双子を用いた研究では、この妊娠期間の違いを検証することはできない。当然ながら、同じ母親からほぼ同時に生まれてくるためだ。この点も、双子研究が抱える大きな問題だと言える。それでは、双子間で体重に差が生じるのは遺伝的な要因なのか、あるいは母親の栄養状態の違いが要因なのだろうか。しかし、一卵性双生児では遺伝的な差はゼロであり、二卵性でも差は小さい。子宮内環境、という点では同じ子宮をシェアしていて差がないといえる。このため、従来の双子研究では、この差がランダムに生じるとみなされてきたわけだが、実際には何らかの背景要因が潜んでいる可能性を排除できない以上、そう簡単に結論づけることもできない。このように整理してみると、双子間の出生時体重の差を利用した研究が、実際に何を捉えているのかを解釈するのは、相当に難しいと言わざるをえない。

妊娠期間の違いをどのように捉えるか

このように、特に先進国に焦点を当てて出生時の低体重の因果的な影響を検証するためには、妊娠期間の違いを捉える必要がある。ではどうすれば、さまざまな要因を取り除いて、純粋な低体重出生の影響だけを検証することができるのだろうか。双子による検証が難しい以上、何か別のアプローチが必要になる。

そこで、丸山氏らの研究(Maruyama and Heinesen 2020)が着目したのが、「前置胎盤(placenta previa)」という症例だ。耳慣れない用語かもしれないが、前置胎盤とは、胎盤の位置が通常より子宮の下側に付着してしまい、子宮口、つまり胎児の出口を覆ってしまう症例である。放置すれば出産の際に大量出血のリスクを伴う命に関わる症例だ。受精卵が通常よりも下側に着床することで発症する。高齢妊娠や喫煙歴などいくつかのリスク要因は知られているものの、なぜそれが発症するのかについてはよくわかっていない。発症確率は全分娩の1%にも満たないと言われる稀な症例だ(日本産婦人科学会ホームページ)。そして、この場合は自然分娩での出産が難しく、基本的には帝王切開による出産が行われ、その結果、妊娠期間が通常の分娩よりも短くなる。

このように、非常に稀な症例である前置胎盤は、発症の要因は予測不能で確率的なものであるが、妊娠期間を短くすることを通じて、確実に出生時の体重に影響を与える。一方で、前置胎盤を発症することそれ自体が、直接子どもの健康や将来に直接影響を及ぼすわけではない。あくまでも前置胎盤は、それによって妊娠期間が短くなることで体重が低下することを通じて、子どもの健康やその将来に影響を与える変数である。このように、フォーカスしたい結果(子どもの健康や将来)に対する原因(出生時体重)に対して影響を与える一方で、その原因以外の要因とは無関係に生じる変数(つまり前置胎盤の発症)は、「操作変数」と呼ばれている。

この分析では、出生時体重が子どもの健康や将来に与える因果的な影響を確かめたいのだが、それ以外にも要因がさまざまに存在し、体重の影響だけを取り出せないのが問題となっている。このような状況を乗り越えるために計量経済学の分野で工夫されてきた方法が「操作変数法」である。上記のような操作変数を利用した分析を行うことで、出生時体重の因果的な影響を取り出す方法として確立され、多くの研究で用いられてきた。丸山氏らの研究でも、この分析手法を用いることで、妊娠期間の違いに着目した出生時体重が子どもの健康や将来に及ぼす因果効果を、さまざまな要因から区別して見出すという工夫を行っている。

行政データが可能にした分析

しかし、このリサーチデザインで因果関係が見出せるとしても、こうした非常に稀な症例のデータを用いた統計分析は、はたして可能なのだろうか。仮にある病院の記録がデータとして利用可能で、その中に前置胎盤の診断記録が含まれていたと、それが全体で1%にも満たないようでは、よほど大きなサンプルサイズを確保しない限り、適切な分析結果を得るのは難しいかもしれない。そんなときに威力を発揮するのが、行政データだ。

丸山氏らが用いた行政データは、デンマークの出生記録(birth register)と、母親の妊娠記録(pregnancy records)である。これらを個人ごとに結合し、生物学上の母親と子ども診断履歴や主な属性変数が個人ごとに記録されたデータセットを構築した。さらに、このデータセットで驚くべきポイントは、1981~2013年という、実に約30年もの長期間にわたって個人ごとに記録され続けている点だ。始点の1981年は、デンマークの出生記録において分析に必要な多くの変数が利用可能となったほぼ初期から利用できていることを意味する。また、丸山氏によれば、これらの行政記録には欠損値や非現実的な誤った値などの混入も非常に少なく、正確性もきわめて高かったという。通常の調査データでは、これほど長期間にわたり、国民全体を対象に安定的かつ正確にデータを記録し続けるのは、よほどの強固な体制を整えても困難だろう。

この行政データに基づいて分析のために構築したデータセットでは、約200万人もの大規模な観測数を捉えることができた。その中で、母親が前置胎盤を伴って出産した子どもの数は7913人(全体の約0.41%)であった。このデータを見ても、前置胎盤がいかに稀な症例かがわかるだろう。国民全体を捉えた行政データが確保するサンプルサイズの規模は、分析の幅を大きく広げてくれることが実感できる事例ではないだろうか。

ただし、デンマークの場合は総人口約580万人という小さな国だ(日本で言えば千葉県が約630万人)。行政データにより大きなサンプルサイズが確保できるといっても限界はある。今回も、33年分のデータを利用してやっと約200万(正確には194万5248)人を確保することができた。もう少し人口規模の大きな国、たとえば、隣国のスウェーデンであれば人口は約1000万人と、デンマークの2倍近い人口を抱えているので、大きなサンプルサイズが確保しやすく、さらに分析の幅が広がる可能性がある。また、アメリカでも徐々に行政データの研究利用が進んでいるが、3億人以上の人口を抱える国である。北欧諸国とは比較にならないほど人口が多く、州レベルであっても分析の幅はさらに広がる。たとえば、カリフォルニア州の人口は約4000万人だ。アメリカの税務データなどを取り入れた豊な分析も進んでいる(たとえばChetty, R., Hendren, N., Kline, P. and Saez, E. (2014) “Where is the Land of Opportunity? The Geography of Intergenerational Mobility in the United States,” Quarterly Journal of Economics, 129(4): 1553–1623)。

ともあれこの丸山氏ら研究では、「FR-12」で紹介した行政データの強みを活かし、長期間にわたる大規模なサンプルを確保して、従来のデータでは分析に用いることが難しかった前置胎盤という症例を操作変数として用いた実証分析が可能となったことで、妊娠期間が短くなることに起因する低体重の因果的な効果に迫ることができた。この点は、従来の双子研究の限界を乗り越える貢献だ。それでは、この分析の結果が、どのような結果を導き、従来の研究と比べてどう違うのかを見ていこう。

新しいエビデンス:出生時体重の影響は次第に消えていく

分析結果は、大きく以下の4つのようにまとめることができる。

(1) 出生時体重の増加は、乳幼児期の死亡率を低下させ、喘息などの疾患にも罹りにくく、脳性マヒ・視聴覚障害なども減少させるなど、子どもの健康にプラスの因果的な効果が見出された。

(2) 幼少期に見られた出生時の低体重が健康に及ぼすマイナスの影響は、子どもが成長するにつれて次第に減少することも明らかになった。この結果は、出生直後の回復不可能な障害さえ回避できれば、十分に追いつくことが可能だということを示している。

(3) 第9学年卒業時(日本でいう中学校卒業時)に受ける統一テストの点数や犯罪行動のような、青年期や若年の成人期における指標に対し、出生時体重の有意な効果は見られなかった。

(4) 低体重出生が幼少期の子どもの健康に対して与えるマイナスの影響は、1981~2013年の約30年の間に大きく減少していることも明らかとなった。

これらの多くは、双子のデータを用いた多くの先行研究とは180度異なる結果だ。双子研究の多くでは、低体重での出生は幼少期の子どもの健康状態などへの影響は見られないものの、成長して大人になった後で影響が発現することが報告されている。ところが、先にも述べたように、双子による出生時体重の差がなぜ生じているかが不明瞭なうえに、こうした結果は医学的にも解釈が難しい。一方、丸山氏らが着目した妊娠期間の違いによる出生時体重の差に基づいた分析では、幼少期の子どもの健康への影響が確認されている。この点は医学的な研究とも整合的で、自然な解釈が可能な結果となっている。

また、データのサンプル期間が30年もあるので、サンプルを前半期と後半期に分けて時期の変化にも着目することができた。これにより、昔は低体重での出生が健康に及ぼす悪影響は大きかったけれども、近年では縮小していることが明らかとなった。この結果は、時代を経るに従って健康や命に影響を及ぼしうる低体重の基準が変化する可能性も示唆している。この30年間で医学も進歩しており、早産児や未熟児の救命率が高まっているという事実と整合的で直観的にも理解しやすい結果であるが、この点をデータに基づいて検証できた点は大きな貢献だと言えるだろう。 丸山氏らはこの研究で、さまざまに存在する低体重出生が発生する要因の中で、特に前置胎盤による早期の出産に焦点を当てた。これにより、従来の双子研究で捉え切れていなかった出生時体重の差の要因を明確に特定したうえで、非常に稀だが確率的に発症する前置胎盤を操作変数として利用することで、出生時体重の因果的な効果を分析することができた。前置胎盤による妊娠期間の違いに起因する低体重出生の影響に、シャープに着目して分析した点が、この研究の特長である。

行政データの活用が新しいエビデンスをもたらす

従来から、出生時体重の影響を検証した実証研究はさまざまに蓄積されてきたが、その中心である双子のデータに着目した分析では、遺伝的な影響などをある程度統制できる一方で、実際にどんな要因に基づく出生時体重の差を捉えているのかがわからず、分析の解釈が難しかった。そのため、低体重出生に起因する問題が示唆されたとしても、その根本的な原因がわからないので、政策的な対応につなげるためのインプリケーションを提供するという面では難点があった。

それに対して、丸山氏らの研究は、出生時体重の研究におけるこの問題を改めて浮き彫りにし、出生時体重の差が生じる要因を明確にしたうえで、その因果的な影響を検証したものだと位置づけることができる。そして、これを可能としたのが、デンマークの行政データであった。行政データの活用は、研究の可能性を多方面に広げ、それによる新しい知見から、これまでにない実証的な示唆を得ることにもつながりうる。繰り返しになるが、前置胎盤というこれまで用いられてこなかった症例を操作変数として活用できたのは、行政データを使えたからこそだ。そして、行政データに基づいた実証分析から得られた精緻で新しいエビデンスは、研究の世界における貢献にとどまらず、私たちの生活やそれに関わる政策に対しても有用なインプリケーションも多分にもたらしてくれるだろう。

CREPEフロンティアレポートシリーズはCREPE編集部が論文の著者へのインタビューをもとにまとめたものです。