東京大学政策評価研究教育センター

CREPECL-5:消費統計の精度向上に向けて――総務省統計局・統計研究研修所との共同研究


川口大司(東京大学大学院経済学研究科教授/附属政策評価研究教育センター長)


画像提供: mits / PIXTA(ピクスタ)

目 次
はじめに
共同研究のきっかけと概要
母集団からのズレの実態把握
バイアス補正のための方法の開発と実装
過去の調査との比較可能性
共同研究を終えて:総括と展望

はじめに

本コラムでは、総務省統計局・統計研究研修所と東京大学大学院経済学研究科附属政策評価研究教育センター(CREPE)による共同研究「消費統計の精度向上に向けた研究」に関する川口センター長へのインタビューを通じて、その概要と今後の展望を紹介する。

総務省統計局が実施する「家計調査」「全国消費実態調査」などの消費統計は、政府の基幹統計に位置づけられる。国民の消費・所得・資産等の状況について、前者は月次の比較的規模の小さな調査で速報を伝え、後者は5年に1度の大規模調査で包括的に実態と構造を明らかにするもので、いずれも特に重要な統計である。

これらの消費統計では、調査対象者が詳細な家計簿を数カ月にわたって記録することになる。これにより、詳細な情報を得ることができる反面、回答者負担が大きいことが指摘されてきた。また、その負担も要因の1つとなって、実際の回答結果に反映される世帯の属性の分布が、日本全体の本当の世帯分布と特徴とズレているのではないかという指摘もなされてきた。今回の共同研究では、それらの指摘が的を射たものなのかどうかも含め、特に全国消費実態調査の実態を明らかにするとともに、その統計上のズレを補正するウェイトの開発と実装を通じ、統計の精度向上に貢献することが目的であった。

全国消費実態調査の特徴をもう少し詳しく紹介する。同調査は、日本全国の世帯を対象に家計の収入、支出、資産や負債の保有状況の実態を総合的に調査し、世帯の所得や消費等の水準の実態や分布、地域的差異などを明らかにすることを目的として行われてきた。1959年以来5年ごとに実施されており、2019年調査で13回目となる。

この2019年調査では、標本設計から調査方法にわたるまで全面的な見直しがなされ、名称も「全国家計構造調査」に変更されることになった。この全面見直しに向けて、総務省統計局・統計研究研修所とCREPEによる共同研究が行われ、実際に今回の調査から、共同研究の成果に基づく調査結果の補正手法が実装されることになった。以下、本コラムでは、共同研究が始まったきっかけから、今回の見直しの全体像と、その中でCREPEが担った実際の作業を振り返る。そのうえで、今回の総括および今後の展望を紹介する。

共同研究のきっかけと概要

―― どのようなきっかけで、共同研究が始まったのでしょうか?

もともとのきかっけは、本学の渡辺努先生が、政府の「統計改革推進会議」に参加されていたことです。その会議で、今回の共同研究の対象でもある全国消費実態調査の改善に向けた議論がなされ、渡辺先生を通じてCREPEにお話をいただきました。

―― 従来の調査から、どのように変更されることになったのでしょうか?

冒頭で触れていただいたように、2019年調査から統計の名称が「全国家計構造調査」に改められることになりました。その原因として、第1にサンプリング・デザイン(標本設計)を大きく変えたこと、第2に回答者負担の軽減を図るために調査方法の変更を行ったことがあります。

1つ目のサンプリング・デザインの変更については、次のようなものです。人口の高齢化が進んでいることから、消費を決定づける要因として、所得に加えて資産がより重要な位置を占めるようになっています。たとえば、引退後の高齢者は基本的には給与所得等を得なくなるわけですが、自身の保有する資産(または金融所得等)から消費をします。そうした実態をより正確に捉えるために、年収や貯蓄、負債等を尋ねる調査対象者の規模が拡大されることになりました。

具体的には、調査票への記入に加えて家計簿の記録を伴う「基本調査」と、調査票への記入のみで家計簿の記録を伴わない「簡易調査」に分け、従来調査では5万6400世帯だった調査対象を、基本調査と簡易調査をあわせて8万4000世帯にまで拡大されます(なお、耐久財等の調査が廃止されることになりました)。

また、単身世帯のサンプルサイズの拡大なども行われています。現在、日本全体では単身世帯が増えていますが、調査の上では特に単身世帯の回収が難しいという問題が指摘されてきました。そこで、精度向上のために単身世帯の調査対象者の規模が拡大されることになったのです(現行調査の概要は図1を、変更後調査の全体像は図2を参照)。

図1 従来調査(全国消費実態調査)の概要

(出所)第126回統計委員会提出資料「資料2-1 諮問第117号「全国消費実態調査及び家計調査の変更について」の概要」より。

図2 変更後調査の全体像

(注) ※1=甲調査から、耐久財等調査票を廃⽌。※2=⼄調査から、家計簿を廃⽌。※3=家計調査の調査対象世帯の⼀部。
(出所)図1と同。


2つ目の、回答者負担軽減のための変更は次のような形で行われました。全国消費実態調査は、これまで上記の5万6400世帯に対して、9、10、11月と3カ月にわたって家計簿の記入を求めてきました。この調査方法は、詳細に情報を集められる反面、回答者に大きな負担が掛かっていました。そこで、今回の見直しでは、3カ月だった調査期間が、10、11月の2カ月に短縮されました。加えて、家計簿の記入を求める調査対象は、上記の「基本調査」の対象となる4万世帯に減らすことになりました。単身世帯についても同様に、家計簿調査は2カ月となっています。

ただし、期間を短縮することで、従来調査とは異なる影響が新調査の結果に含まれてしまうことになります。こうした要因を季節性というのですが、この季節性による影響への対応が不可欠となります。また、調査対象者の属性(年齢等)による調査結果の偏り(バイアス)の問題もあります。特に若年層は調査の回収率が低く、高齢層の方が比較的回収率が高いので、その影響で調査結果にバイアスが生じ、日本全国を代表するような結果にはなっていないのではないかといった指摘がなされてきました。

総務省統計局で行われた会議では、今回の調査方法の見直しによって新たに生じうる問題や、従来から指摘されてきたバイアスの問題などを解決するために、いくつかの研究テーマが立てられました。

母集団からのズレの実態把握

―― その中で、CREPEが担ったのはどのようなテーマですか?

CREPEが担当したのは、従来から指摘されてきた問題への対応、すなわち回答者の属性ごとによって回収率が異なることで、調査結果が真の日本の人口分布から得られる結果とズレているのではないか、という問題への対応です。

まずは、全数調査である「国勢調査」との比較を通じて、現行の調査設計が本当に真の結果から得られるものとズレているのかどうかを確認するところから始めました。

実際に見てみると、確かに2014年の全国消費実態調査と、2015年の国勢調査で得られた世帯主の年齢分布、世帯主の年齢ごとの就業率にはズレが見られました。

世帯主の年齢別に見ると、従来から指摘されてきた通り、確かに若年層の人口に占める世帯比率が国勢調査と比べて低く、高齢層(特に65~74歳)の比率が高く出てしまっていたのです(図3参照)。

一方、世帯主の就業率について見ると、ほとんどの年齢層で一貫して、世帯主の就業率が国勢調査よりも高く出る傾向が確認されました。これは、全国消費実態調査については世帯主が働いている家計の方が、回収率が高かったということを示唆しています。

図3 年齢と就業率の分布の差(国勢調査と全国消費実態調査)



つまり、「回収率が回答者の属性によって異なるために、調査結果が日本の真の人口分布からズレているのではないか」という従来からの指摘は、この面では正しかったといえます。

なお実際には、全国家計構造調査と国勢調査は同じ年に調査が行われていないため(前者は2014年に対し、後者は2015年)、調査年のズレを考慮した数値に基づく比較も行っています(図3と後述の図4の「予測値ベース」の部分)。ただし、2014年全国消費実態調査と、2015年国勢調査を比較した場合と、補正した値に基づいて比較した場合とで、結果には大きな差異はありませんので、本コラムでは話を簡単にするために、2014年の数値との比較に基づいてお話しています。

―― 日本の真の人口分布、つまり母集団と全国消費実態調査の調査結果にはズレが含まれることがわかったということですね。これを見ると、他の変数、たとえば消費や所得などにも母集団分布からのズレも予想されると思うのですが、その点はいかがでしたか?

その点は、特に消費統計ではポイントになります。2014年調査と2015年の国勢調査の比較を通じて確認してみると、図4に示したような年間の世帯所得分布(単位:万円)と月ごとの消費額の分布(単位:万円/月)が得られました。

図4 所得と消費の分布の差(国勢調査と全国消費実態調査)



意外なことに、これらの結果を見てみると、所得・消費ともに、国勢調査ベースの分布とのズレがそれほど見られませんでした。世帯主の年齢や就業率ではズレが確かに認められたのですが、全国消費実態調査の場合は、そのことが調査目的である所得や消費の分布のズレにはあまりつながっていないことがわかったのです。この点は1つの発見だといえるでしょう。

バイアス補正のための方法の開発と実装

上記の結果をふまえて、私たちCREPEでは、特に年齢と就業の分布を母集団分布に近づける形で補正するための方法を検討し、提案しました。調査を通じて得られた個票の結果を集計する際に、従来のズレを生んでいる方法に代えて、どのようなウェイトを掛ければ母集団の分布をより正確に構成できるのか、という点が大きなポイントでした。

なお上記以外にも、持ち家比率や住宅の広さなども同様に分布を比較してズレを確認し、調整するための補正を参考として提案しました。これらの補正をしてもそれほど、消費や所得についてのズレが生まれないことが確認されたこともあって、今回の共同研究では年齢・就業と、所得・消費のズレの確認と補正を主に対象として、作業を進めていきました。

―― 補正の方法について、簡単にご紹介をお願いします。

調査結果を集計していく際には、世帯主の年齢階級、性別(単身世帯の場合)、世帯人数、地域等々の要素で分類していくことになります。各要素でクロスして、いわば表計算ソフトのセルのようなものを多次元で構成し、その中に数値を集約していくわけです。

セルを考える際には、たとえば「世帯人数×性別×世帯主の年齢」「単身世帯×就業状況」などといった具合に集計単位を区切って定義していくことになります。しかし、この区切りの要素をどんどん追加して、より細かいセルを定義しようとすると、サンプルサイズの問題等により、まったくデータが入ってこないセルが出てきてしまいます。これを「空セル問題」といいます。

世帯主の就業状態や年齢階級、地域等々によって回収率が異なる可能性があるのですが、空セル問題が原因で、これらの要素を一度に考慮して、国勢調査の分布に合わせることができないのです。

そこで、一度に考慮するのではなく、空セル問題が発生しないように粗めに定義した要素で構成したセルについて国勢調査に合うようにウェイトを作成し、それを調整したら次のセルを定義してまた調整する、ということを繰り返す方法をとることで、次第に国勢調査に合わせていくことができます。今回は、このような方法を採用しました。具体的には、以下の5つの構成(1~5層目)のようにあっています。

0層目 調整済み調整係数(回収率が低いことによる調整を行った後の抽出確率の逆数)
1層目 世帯人数×性別×世帯主の年齢
2層目 単身世帯×就業状況
3層目 都道府県×就業状況
4層目 単身世帯×都道府県
5層目 世帯主の年齢×就業状況

この想定に従ってウェイトを作成し、計算していきます。この方法自体は標準的な手順なのですが、実際に計算し、さらに実装するとなると、国勢調査はデータの規模も非常に大きいため、大変な作業になります。

会議の過程では実際に計算結果を示して、国勢調査との間にどの程度のズレがあるかを参加者の皆さまに見てもらい、どのようなにウェイトを掛けていくと補正できるかも示しながら議論を進めていきました。それにより、この方法の採用と実装が決まったわけです。この点が、今回の共同研究におけるCREPEの主な貢献です。

―― この補正手順とそれに基づく計算プログラムを使って、総務省統計局が調査の補正を行っていくことになったのですね。

そうですね。私たちの仕事は方法の提案とその実行のためのプログラムの提供までで、あとの実装は総務省統計局が担当します。

今回の補正方法は、実は学術的にはそれほどテクニカルな話ではないのですが、先ほども述べたように計算量が多くて、プログラムを組むのもなかなか大変です。ここでは特に、共同研究に協力してくれた鳥谷部貴大さん(東京大学大学院経済学研究科博士課程)が活躍してくれました。彼が提示したプログラムによる実装に基づいて、総務省統計局と各都道府県が調査を実施していくことになっています。

過去の調査との比較可能性

―― すでに公表されている2014年までの全国消費実態調査と今年行われる新調査は比較可能な形で公表されるのでしょうか?

新調査では、調査期間の短縮も行われており、従来調査との比較に際しては季節性による影響への対応も必要となっています。各年の調査結果の個票は総務省統計局にストックされているはずなので、すでに公表されている過去の集計データについても、比較可能なデータを公表することはできるはずです。たとえば、内閣府のGDP統計(国民経済計算)では、新しい基準に従って過去のデータを遡及推計して公表する例がありますが、それと同じようなイメージです。

ただ、現段階では過去のデータにさかのぼって集計をし直して公表するかどうかは明らかではありません。どこまで総務省統計局がこのことに資源や手間を掛けられるといった問題でもあります。総務省には、今回以降の調査結果が過去の調査結果と比較しても問題ない形で公表してほしいと願っています。

共同研究を終えて:総括と展望

―― 今回は総務省統計局との共同研究でしたが、こうした行政機関とCREPEとの共同プロジェクトを終えてみて、どのような感想をお持ちですか?

今回のプロジェクトでは、問題点を検証して改善の方向を示すだけに留まらず、提案された方法を実装する部分も重要でした。そうした場合に、どこまでCREPEが実装の部分まで作業を担うのかについては、実際に議論になったところでした。

私たちとしては、人的なリソースや資金の限界もあるので、方法を提案したら、後の実装は総務省統計局の方で進めてほしいと考えていました。今回については、提案した方法を実行するプログラムをお渡ししたところで、私たちの責任は果たしたと考えています。

―― バイアスの検証や、その補正のための手順を理解して頂く際に困難な点などはありましたか?

そういう困難は、基本的にはなかったですね。統計局の皆さまとも頻繁に議論をする機会もありましたし、私たちの報告もよく聴きに来ていただきました。統計局には専門的な知識や技術をお持ちの方が多くいらっしゃるので、そうした面でのコミュニケーション上の問題は、特にありませんでした。

―― 共同研究を行ったことで、CREPEにとっても実務上あるいは研究上のメリットなどはありましたか?

今回の共同研究を経て、全国消費実態調査の各調査区の調査員の性別・年齢等の属性のデータをいただくことができました。そのデータを使えば、どういった属性の人が調査を担当した場合に回収率が高いのか、あるいは低いのかがわかるはずです。そして、この情報を用いることで、サンプルセレクション・バイアスを補正などができるのではないかと考えています。この点は、研究としても進めていきたいと思っています。

―― 最後に、今後の活動の予定や展望などについて教えてください。

今のところは予定といえるほど明確なものはないのですが、今回の共同研究を始めてくださった総務省統計局の消費統計の担当課長の方が、今度は国勢調査のご担当になられました。そこで、国勢調査についても実施方法等々について議論するなど、協力関係を続けることができると考えています。

また、労働力調査などといった他の統計にもさまざまな問題点が潜んでいますので、そういった部分でも共同研究などを続けていける機会があればいいなと思っているところです。

今回は、総務省統計局との共同研究でした。統計局の方々は毎日の業務で非常に忙しい状況に置かれています。そのような中で、全国消費実態調査の見直しといった追加的な業務を、現状の中の人員だけで回していくのは難しいのではないかと思います。ですので、問題発見や改善方法の提案などといった、いわば追加的な業務を担ってほしいという先方からの期待を感じました。

いま改めて今回の共同研究を振り返ってみると、そうした作業を担う際の条件などは、CREPEという組織の維持可能性のためにもきちんと考え直していく必要はあるかなと思います。私たちも、人員や資金に余裕があるわけではありませんので、私たちにとってもよほどの研究上のメリットなどがなければ、しかるべき対価を受けて業務を請け負うような形もありうるのではないかということです。

まだまだCREPEという組織は立ち上げたばかりで、何事もやってみなければわからないということ手探りで取り組んでいるような状態です。そうした中で確実に実績を積み重ねていき、将来的にはきちんとした対価もいただいて、持続的に組織運営や事業を行えるような仕組みを作っていくことが重要だと考えています。

[インタビュー収録日:2019年9月13日]

(付記)本コラムは、CREPE編集部が川口大司センター長に行ったインタビューをもとにまとめたものです。