厚生労働省の「毎月勤労統計調査」で、全数調査をすべきところをサンプル調査に代えて補正を行っていなかったということが問題になっている。全数調査をサンプル調査に変更することが不正ではないが、これを公表しなかった、隠蔽したのではということが問題になっている。ではこの調査はどのような方法を採用しているのかまとめてみる。
【歴史】
その前にこの「毎月勤労統計調査」の歴史を簡単に整理しておく。
・大正12年7月に開始された「職工賃銀毎月調査」及び「鉱夫賃銀毎月調査」に始まる。
・昭和19年7月に現在の名称である毎月勤労統計調査が開始。
・昭和26年に地方調査を開始。
・昭和27年から建設業を調査産業に含めた。
・昭和32年に全国乙調査(常用労働者5~29人)を開始。
・昭和46年1月からサービス業を調査産業に含めた。
・昭和47年7月から沖縄県を調査地域に含めた。
・平成2年1月に大幅な改正を行う。
【調査対象】
以下の日本標準産業分類に基づく16大産業に属する事業所であって常用労働者を雇用するもののうち、常時5人以上を雇用する事業所。
1.鉱業,採石業,砂利採取業
2.建設業
3.製造業
4.電気・ガス・熱供給・水道業
5.情報通信業
6.運輸業,郵便業
7.卸売業,小売業
8.金融業,保険業
9.不動産業,物品賃貸業
10.学術研究,専門・技術サービス業
11.宿泊業,飲食サービス業
12.生活関連サービス業,娯楽業(その他の生活関連サービス業のうち家事サービス業を除く)
13.教育,学習支援業
14.医療,福祉
15.複合サービス事業
16.サービス業(他に分類されないもの)(外国公務を除く)〕
【抽出方法】標本設計
調査するサンプルを次のように選んでいる。
一種事業所(規模30人以上)
事業所全数リストを抽出のための母集団フレームとし、そこから産業、事業所規模別に標本事業所を無作為に抽出。
つまり、全国の従業員30人以上の会社等から産業別、事業所規模別に調査対象をランダムに選んで調査に協力してもらう方法である。
第二種事業所(規模5~29人)
二段抽出法によって抽出。
二段抽出法はマスコミの世論調査などでもよく見かける手法である。ちゃんとした調査をしている場合、調査方法をきちんと提示してくれるので見逃さない方がいい。
この二段抽出とは、ここでは調査する地域を7万の区域に分けて、そこから必要な数の調査区域選ぶ(一段目)。次に選び出された区域の中にある事業所の中から必要な数の事業所をランダムに、無作為に選びだして(二段目)、その事業所に調査に協力してもらうという方法である。
調査範囲が広い場合などにコストを抑え、効率よく調査するために採用される調査方法である。
なお、ここでは半年ごとに全体の調査事業所の3分の1について交替している。
【調査時期】
毎月末現在(給与締切日の定めがある場合には、毎月最終給与締切日現在)
【調査方法】
常用労働者が30人以上の事業所(第一種事業所)
調査票を郵送で回答。
常用労働者が5~29人の事業所(第二種事業所)
調査員が訪問して聞き取り調査をしている。
この他にインターネット回線を利用したオンライン調査システムも採用している。
第二種事業所については訪問・聞き取り調査を実施しているが、コストが莫大になっているのではないだろうか。今の時代、まだこんなことをやっていていいのだろうか。
さて、今回不正とされて問題になっていることはどういうことだろうか。厚生労働省が平成31年(2019年)1月11日に公表した「毎月勤労統計調査において全数調査するとしていたところを一部抽出調査で行っていたことについて」に以下のように説明されている。
----------------------------------------
確認された事実
(1)全数調査するとしていたところを一部抽出調査で行っていたことについて
「500人以上規模の事業所」については、調査計画及び公表資料で全数調査することとしていたところ、平成16年以降、厚生労働省から東京都に対し、厚生労働省が抽出した事業所名簿を送付し、当該名簿に基づき抽出調査を行うこととしていました。具体的には、東京都における「500人以上規模の事業所」の平成30年の調査対象として抽出した事業所数は、全数調査であれば1,464事業所でしたが、実際に平成30年10月分の調査対象事業所数は概ね3分の1の491事業所でした。
なお、平成30年6月に、神奈川県、愛知県、大阪府に対し、「500人以上規模の事業所」について、平成31年から抽出調査を行う予定である旨の連絡をしていましたが、既に撤回しました。
(2)統計的処理として復元すべきところを復元しなかったことについて
「500人以上規模の事業所」については、他の道府県では全数調査ですが、東京都のみ抽出調査が行われたため、東京都と他の道府県が異なる抽出率(※1)となっていました。
一方、毎月勤労統計調査の平成29年までの集計は、同一産業・同一規模では全国均一の抽出率という前提で行われており、前述の異なる抽出率の復元(※2)が行われない集計となっていました。このため東京都分の復元が行われていませんでした。
なお、東京都における「499人以下規模の事業所」等についても平成21年から平成29年までについて、一部に、異なる抽出率の復元が行われない集計となっていました。
これらの結果、平成16年から平成29年までの調査分の「きまって支給する給与」等の金額が、低めになっているという影響がありました。
※1 抽出率とは、母集団に占める調査対象事業所の割合。
※2 復元とは、抽出調査を行った際に行うべき統計的処理で、母集団の調査結果として扱うための計算。
(注)なお、平成30年1月以降の調査分の集計については、復元されています。
(3)調査対象事業所数について
調査対象事業所数が公表資料よりも概ね1割程度少なくなっていました。確認できた範囲では、平成8年以降このような取扱いとなっていました。なお、誤差率は回収数を元に計算しているので、公表していた誤差率に影響はありません。
----------------------------------------
つまり、東京都の「500人以上規模の事業所」は全部で1,464事業所あったが、実際にはほぼ3分の1の491事業所しか調査していなかった。
他の道府県は全数調査だが、東京都だけ抽出調査が行われたため、東京都と他の道府県の抽出率がちがってしまった。しかし抽出率の復元を行っていなかった。
また調査対象事業所数が公表資料よりも概ね1割程度少なくなっていた。
統計データは検証されることもあまりないだろうから、杜撰なことをやってもなかなか表沙汰になならないのかもしれない。今回は、雇用保険や労災保険等で給付の支払い不足が発生するので大きな問題になっているが、直接的な被害が出ないような統計ではほとんど問題になどならないだろう。