JILPTリサーチアイ 第83回
「job tag」(日本版O-NET)の数値情報に関する誤解と実際
2024年10月11日(金曜)掲載
1.はじめに
2020年3月より厚生労働省が運営する職業情報提供サイト(日本版O-NET; 以下「job tag」という)が正式にサービスを開始した。当機構ではjob tagのコンテンツのうち、職業解説、しごと能力プロフィール、自己診断ツール等に関して情報提供を行っており、筆者が担当するのはしごと能力プロフィールと呼ばれる職業に関する多面的数値情報である[注1]。
多面的数値情報は米国労働省が1998年から四半世紀にわたり公表している職業情報データベース、The Occupational Information Network(O*NET)プロジェクトの項目群を参考に作成されている。収録情報にはどんな人が向いているか(職業興味、仕事価値観)、どんな仕事か(仕事の内容、性質)、どんな能力が求められるか(スキル、知識、アビリティ)等の領域があり、約500の収録職業について就業者調査に基づき共通の基準で数値化している。また得られた情報は「ダウンロードデータ」として同サイト上で公表されており、既に同データを活用した学術研究も見られ始めている。
しかし一方でサービス開始以降、job tagの数値情報については政策担当者や外部有識者、あるいは機構内の他部門研究員もしばしば誤解していることがある。その誤解は多くの場合過度の期待を伴っており、筆者が同データの弱点・欠点、活用に当たっての制約を説明すると失望に変わる。こうした状況は期待する側にとってもされる側にとっても生産性がない。
そこで今回、リサーチアイという形で比較的自由度の高い原稿執筆の機会を頂いたので、改めて開発担当者視点でjob tagの数値情報に関するよくある誤解と筆者の考えを整理しておく。ただし以下の内容は全て2024年9月現在の筆者個人の考えであり、当機構ならびにjob tagを運営する厚生労働省の見解ではない点に留意されたい。
2.よくある誤解の類型と実際
2-1. 誤解1「job tagの数値情報は政策の立案・評価のために開発されている」
後述するあらゆる誤解に通じる最も根本的な誤解は、job tagの数値情報が政策の立案・評価のために開発された統計情報であるという誤解である。たとえば国勢調査(総務省)や賃金構造基本統計調査(厚生労働省)はまさに行政・政策の評価に役立てられるべく収集されている。このため厚生労働省所管の独立行政法人である当機構が作成するjob tagの数値情報も、これらと同じ並びで捉えられるのも無理はない。
しかし実際にはjob tagの数値情報は第一義的にはキャリア教育、キャリア支援の現場で役立てられることを意図して作成されている。想定する主たる利用者は学生、求職者、およびその支援者(教師、キャリアコンサルタント等)であって、政策担当者や研究者ではない。筆者としては本プロジェクトには「科学的な職業観測プロジェクト」、すなわち全職業共通の基準で定期的に情報を取得し続ける意義もあると考えているが、それはあくまで副次的なものである。
このスタンスの違いが、たとえば収録される職業の選定にも影響している。job tagのサービス開始当初の収録職業リストの叩き台は元を辿れば当機構の前身に当たる日本労働研究機構(JIL)が2002年に公表した、中高生の進路指導ツール「職業ハンドブックOHBY」[注2]収録の430職業である(労働政策研究・研修機構, 2002[1])。またjob tagでは2020年度以降、毎年10職業程度を新規に収録しているが、その選定にあたってもハローワークでの求人数が重要な基準の1つと見なされている(労働政策研究・研修機構, 2020[2])。
したがってjob tagの数値情報を我が国の社会・経済の実態把握を目指す基幹統計的な位置づけで見てしまうと、大きな違和感と様々な不満が生じることになる。政策担当者、ならびに研究者の皆様におかれては、job tagの数値情報があくまでキャリア教育・キャリア支援のために開発されたデータであることを踏まえ、「場合によっては政策の立案・評価にも応用しうる」位置づけであることをご了解頂きたい。
2-2. 誤解2「job tagの就業者調査は経済学的実態調査である」
上述の誤解1とも関連するが、第2のよくある誤解がjob tagの就業者調査を経済学的な実態調査と見なす誤解である。筆者の考えでは米国O*NET、およびjob tagの就業者調査とは心理学的な意識調査である。具体的には自身の職業に関するイメージ(以下、自己職業イメージという)について調査を実施し、その平均値・比率を示すものである。このことが筆者を含め、日米のデータ開発担当者の専門性が心理学である理由の1つと思われる。
たとえば就業者のスキルについて、実態調査であれば「あなたのスキル」を尋ねるであろう。一方、job tagの就業者調査では「あなたの職業で求められるスキル」を尋ねて、職業ごとに平均値を集計している。両者は「スキル領域」として職業別・項目別に数値化されると見分けがつきにくいが、実際には尋ねている内容が大きく異なる。
この違いについて「体重調査」の例を用いて説明する。今、「成人男性100名に『あなたの体重』を尋ねる」場合と、「成人男性100名に、成人男性の平均体重を尋ねる」場合を考えてみる。前者の場合は50kgの人は50kg、100kgの人は100kgと答える。しかし後者では、まさか自分が100kgだから周囲も皆100kgとは考えないであろう。後者の質問で得られるのは成人男性の「実態」に関する平均値・分散ではなく、成人男性の代表値はこの程度であろうという当事者の「イメージ」に関する平均値・分散である。
同じ事がjob tagの就業者調査にも言える。約500の職業についてそれぞれの当事者に自己職業イメージを一般論として尋ねることで、「人間の情報」ではなく「職業の情報」をより効率的に収集することができる。たとえば「プログラミング」について「あなたのスキル」を尋ねた場合、もちろんプログラマー等で平均値は高くなるだろう。しかし一方で「仕事では全く使わないが、趣味でプログラミングをやっている」人も高く評定することになる。逆に、「本来は高いプログラミングスキルが必要な職業だが、自分はまだまだだ」と低く評定する人もいるだろう。これらは職務遂行に必要な能力を職業の情報として収集する上ではノイズとなる。
以上、job tagの就業者調査が「自己職業イメージ調査」であるという特徴を説明してきたが、こうした違いを意識せず実態調査であるかのように捉えて分析を行えば誤った「エビデンス」を生み出すことになりかねない。分析への投入可否、および結果の解釈にあたって注意が必要である。
2-3. 誤解3「job tagの就業者調査は回答者2万人超の大規模調査である」
第3の誤解としてjob tagの就業者調査の規模感に関する誤解がある。たとえば「job tagは2万人超の就業者の回答を収集する大規模調査である」と言うとき、その言外には「それだけの大規模調査なのだから、データは信頼性が高い」というニュアンスがしばしば含まれがちである。しかし残念ながら、その認識も訂正しなくてはならない。
端的に言えば、job tagの就業者調査とは「回収目標60名の調査を約500個併行している」に過ぎない。その上で、データスクリーニング後の最終サンプルサイズが20を超えていることを各職業の数値情報収録の最低基準としている。つまり母集団推定という文脈では、この「20」が精度を担保している。
そもそもjob tagの就業者調査は前述の通りキャリア教育・キャリア支援の観点で選定された職業で構成され、各60名程度回答が得られた時点で順次回収を打ち切っている。したがって「我が国の就業者全体」を代表するサンプルとは見なし得ず、サンプルサイズ2万人超という見方は全く当てはまらない。
2-4. 誤解4「job tagの数値情報は最低20名という小サンプルに基づいており、統計学的に意味がない」
さて、前項を読んで読者は「たった20名のサンプルで何が分かるのか」と感じたかもしれない。参考までに、米国O*NETでは収録にあたって最低サンプルサイズを15名としている(U.S. Department of Labor, 2018[3])。1,000名単位の調査が必要とされる他の社会科学領域の常識に照らせば有り得ない小サンプルである。
そしてその「少ない」という感覚は尊重されるべきである。特に研究者の場合、小サンプルに基づくデータであることを理由に学会誌の査読を通らないといった具体的なリスクも考えられる。この意味でjob tagの数値情報をご自身の専門分野の常識に照らして「使いものにならない」とご判断頂くことは重要と思われる。
ただし、数学的に考えれば母集団推定において重要なのはサンプルサイズではなく標準誤差のはずである。確かに標準誤差はサンプルサイズの平方根に左右されるが、そもそも母集団の分散が小さい場合には小サンプルでもある程度の標準誤差に収まる。ここで重要になるのが、前述した「job tagの就業者調査は自己職業イメージに関する心理学的意識調査である」という概念整理である。
再び体重の例を用いると、「あなたの体重」を尋ねた場合には分散は大きくなるだろう。50kgであれ100kgであれ実態をそのまま報告するためである。一方、「成人男性の平均体重」を当事者に尋ねた場合にはその回答は概ね60~70kg程度に集中し、未知の母集団分散は「あなたの体重」を尋ねた場合より小さくなると期待できる。
これがたとえば当事者ではなく、海外で「日本人の平均体重」を尋ねた場合にはもっと分散は大きくなってしまうだろう。平均体重を感覚的に推測するための実例が身近に少ないためである。しかし当事者に尋ねる限りにおいては、そのイメージの回答分布は比較的尖度の高い正規分布となるはずである。これと同じ状況が、各職業の就業者に自己職業イメージを尋ねるjob tagの就業者調査にも当てはまる。
もちろんサンプルサイズが大きいほど精度が高まることは間違いない。とはいえ公費を投じる以上、調査費用を可能な限り低く抑えることも重要である。そこで米国O*NETでは「標準誤差をどの程度に抑えたいか」を決め、それを満たせる最低サンプルサイズを探るプロセスを採っている。具体的には標準誤差が0.51を超えない、すなわち95%信頼区間が平均値をまたいで±1の範囲に収まるサンプルサイズを検討し、最終的に各職業で目標20名、最低15名を収録基準と定めている(Peterson et al., 1997[4]; U.S. Department of Labor, 2018[5])。
当機構もこれに倣い2018~2019年度の初期開発データを用いて検証を行った。その結果、我が国のWebモニター調査においては最低20サンプルあれば標準誤差を0.51以下に抑えられるとの結果を得たため、以後これを収録基準として設定している。詳細はJILPT資料シリーズNo.227[6]のpp.66–69を参照されたい。
以上の議論をまとめると、「小サンプルだから使いものにならない」といった常識的感覚や「そもそも標準誤差0.51以下という目標設定自体に疑義がある」との判断は尊重されるべきである。データ開発担当者としても低品質のデータを高品質に見せかける意図はなく、標準誤差は全て公開している。ただ、20名という収録基準は決して恣意的なものではなく一定の統計学的根拠に基づいて設定されている点だけは誤解を解消できればと考えている。
2-5. 誤解5「job tagの数値情報は米国O*NETと同等の品質を有する」
さて、ここで前項を読んで「なるほど、job tagの数値情報は米国O*NETと同水準の品質を有しているのだな」と思われた読者がいるかもしれない。確かに標準誤差の観点だけで見れば、job tagは米国O*NET並である。しかし調査全体のクオリティという観点では残念ながら遠く及ばない。
最大の違いはサンプリング計画である。米国O*NETでは一部例外的な職業を除くと、まず企業に協力を依頼し、承諾を得られればその従業員に調査票を配布してもらう2段階抽出を行っている。その際、MAS法(Model-Aided Sampling)と呼ばれる方法でサンプルが少人数であっても母集団の構成に近い構成となるよう工夫している。また1つの企業に依頼する調査件数はCSM(Composite Size Measure)と呼ばれる指標により変動するが、上限は1社あたり8名としている[注3]。このためたった15名のサンプルでもその中には母集団と似た比率の業種から、似た比率の地域から、似た比率の企業規模からの回答者が含まれるようになっている。社会調査では事前に把握している母集団の比率と一致するように比例割当を行った層化抽出を行うことで標本誤差が小さくなる(土屋, 2008[7])。このことが米国O*NETにおいて15名という少人数でありながら母集団を一定の精度で推定できる根拠の1つである[注4]。
一方、job tagの就業者調査の回答者は調査会社に事前に登録していたWebモニターである。自己申告で現在の職業を選択する形式であり、割り付け条件は職業のみである。大きな標本誤差が予想される極めて素朴なサンプリング計画であり、米国O*NETの緻密な計画とは比べるべくもない。
この極端に素朴なサンプリング計画の理由は純粋にコストの制約である。筆者は2017年に米国労働省にヒアリングを行ったが、その際の先方の説明では米国O*NETの年間予算650~750万ドルの大部分がノースカロライナ州の国立O*NET開発センターへ配分され、うち少なくとも50%超は調査の実務を担当する独立非営利の研究機関に配分されている(労働政策研究・研修機構, 2018[8])。仮に700万ドルの半額、350万ドルとして、本稿執筆時点の1ドル約140円換算とすると調査の実務委託費は年間4億9千万円、大きく円高に推移して1ドル100円換算だとしても3億5千万円である。一方、job tagの就業者調査は当機構の通常研究予算の中で実施されており、調査会社への委託費は入札ごとに異なるが概ね1千万円弱である。これは多めに見積もっても米国O*NETの3%程度に過ぎず、この予算規模で米国連邦政府の国家プロジェクトと同等の調査を実施することは不可能である。
また当機構で性別や年齢階層等による割り付けを行っていない理由は、約500の職業ごとに母集団の比率を知ることが困難ということもあるが、何より属性不問で調査を実施しても20名に満たず収録できない職業が一定数存在するためである。これらの職業は現在job tag上では「データ不足」として数値情報を掲載していないが、利用者の利便性を考えれば収録職業数における網羅性は軽視できない。こうした判断もあって様々なバイアスの懸念はあるにせよ、職業ごとの代表値を集計することを優先している状況である。
以上、job tagの就業者調査における現実的制約と調査計画上の欠点、現状の方針について述べた。我々としては限られたリソースの中で工夫しつつデータを収集しているが、そうした内部事情はデータが低品質であるとの客観的評価を覆すものではない。この点も前述の小サンプルへの懸念と同じく、政策の立案・評価にあたってデータが「使いものになるか」、判断材料としてご検討頂きたい。
2-6. 誤解6「job tagの数値情報を使えば特定の職業について深掘りできる」
最後に上述の誤解5と関連して「job tagの数値情報を使えば特定の職業について深掘りできる」との誤解について述べる。職業について何らかの統計情報を参照する時、同一職業内での性別、年齢階層、就業形態、居住地域等による違いを知りたいと考えるのは当然である。こうした背景から、当機構に対してjob tagの就業者調査データを就業形態別に細分化して提供して欲しいといった要望を受けたことが複数回あった。
しかしこれらの要望は全て断っている。理由は大きく2つある。第1に、さらなる細分化による母集団推定の精度低下への懸念がある。前述の通りjob tagの就業者調査では属性割り当てを行っていないため、細分化を行えば「5名未満」といった極めて少数のセルが現れる。誤解4の項でも述べた通り最低20名という基準は95%信頼区間を平均値±1の範囲に収めるべく設定されているが、仮に細分化によって4分の1に当たる5名の平均値を計算する場合、理論上標準誤差は2倍、すなわち95%信頼区間は平均値±2の範囲に収まることになる。つまり1~5の5段階で平均値が「3」のとき95%信頼区間は「1~5」となり、これは天気予報でいえば「明日の天気は晴れ、または曇り、または雨」と言っているようなもので、意味のある情報とは言い難い。
第2に、仮に偶然にも特定の職業で細分化に必要な一定数のデータが得られていたとしても、回答者が回答しているのは「あなた自身」の状況ではなく「あなたの職業における一般論」である。おそらく同一職業内の細分化データを取得したい場面とは「男性VS女性」「若年層VS中年層」「正規VS非正規」「都市部VS郡部」などの比較軸で格差の実態が無いか検討したいモチベーションに基づくと思われるが、job tagの就業者調査は実態調査ではなく自己職業イメージ調査であるため文脈上分析に「使えない」ことが多いと思われる。あくまでjob tagの職業情報は最小単位を「職業」と置いた分析にのみ活用し得る構造であることをご承知置き頂きたい。
3.おわりに
本稿をここまで読んでくださった読者の中には、やはり期待が失望に変わり「がっかりした」方も多かったと思われる。筆者は開発初期から近くで見てきたからこそjob tagの数値情報の弱点や欠点にばかり目が向きがちで、それが本稿全体にやや悲観的なニュアンスを与えてしまった感は否めない。
しかし多くの課題がある簡便な調査手法とはいえ、我が国においてこれだけ多数の職業単位の情報を定期的に収集することの社会的意義は大きいと筆者は考えている。job tagの数値情報はいわば取扱注意の食材である。調理人(政策担当者、研究者)の工夫次第では美味しい料理(政策、論文)にご活用頂けるはずである。
具体的な「工夫」については筆者自身も模索中だが、基本的な方針としてjob tagのデータ単体で知見を導くというよりも何らかの独自調査データとjob tagの職業情報を組み合わせた方が有意義ではないかと考えている。つまりjob tagの数値情報とは「職業」と「項目」のパラメータに特定の引数(例:「プログラマー」「プログラミング」)を与えると一意の「数値」(4.929)[注5]を返す関数のようなものと捉えて分析に活用する方針である[注6]。この方針であれば「最小単位を職業とする多面的数値情報」という性質を過不足なく活かして検討が可能なはずである。
もちろん「そもそも本プロジェクトで取得している職業情報とは時間経過に伴ってどのように、どの程度変動するものなのか」、変化量や規定要因も検討する必要がある。この点についてはデータ開発担当者として筆者自身も今後取り組む予定である。いずれにせよjob tagの数値情報を活用する上で重要なことは過大評価・過小評価をせず、データの活用可否を正しく見極めることである。
本稿がその判断材料の1つとなれば、幸いである。
引用文献
- [1] 日本労働研究機構(2002). 『新しい若年層向け職業ガイダンスツール「職業ハンドブックOHBY(オービィ)」─中学・高校生が自分で職業選び・自己発見ができるガイダンスシステム─』(PDF:405KB)
- [4] Peterson, N. G., Mumford, M. D., Borman, W. C., Jeanneret, P. R., Fleishman, E. A., & Levin, K. Y. (Eds.) (1997). O*NET final technical report. Salt Lake City, UT: Utah Department of Workforce Services.
- [8][10] 労働政策研究・研修機構(2018). 『仕事の世界の見える化に向けて─職業情報提供サイト(日本版O-NET)の基本構想に関する研究─』JILPT資料シリーズNo.203.
- [2][6][9] 労働政策研究・研修機構(2020). 『職業情報提供サイト(日本版O-NET)のインプットデータ開発に関する研究』JILPT資料シリーズNo.227.
- [7] 土屋 隆裕(2008). 『社会教育調査ハンドブック』第3版 国立教育政策研究所(PDF).(2024年9月10日参照)
- [3][5] U.S. Department of Labor (2018). O*NET Data Collection Program: Office of Management and Budget Clearance Package Supporting Statement.(2024年9月10日参照)
脚注
注1 なお「しごと能力プロフィール」という呼称は厚生労働省が独自に設定したもので、当機構の報告書類では「職業プロフィール情報」と表記することが多い。本文でも述べている通り、職業興味や仕事の内容・性質などの「能力」では括れない領域も含まれている。
注2 OHBY(読みは「オービィ」)はOccupation HandBook for Youthから来ている。
注3 MAS法とCSMに関してはJILPT資料シリーズNo.227[9]のpp.67–68、および同書における引用文献を参照されたい。
注4 こうした緻密なサンプリング計画に基づき実際にデータを収集する上で、米国の担当者も相当の苦労があるとのことだった。詳細はJILPT資料シリーズNo.203[10]、pp.39–42のヒアリング結果を参照されたい。
注5 簡易版数値系ダウンロードデータ Ver.5.00に基づく数値の例。なおスキル領域の得点範囲は0~7点であり、4.929という平均値は比較可能な487職業において「AIエンジニア」(5.286)、「システムエンジニア(組込み、IoT)」(5.038)、「情報工学研究者」(4.979)に次ぐ第4位である。
注6 その際、同一バージョンの特定項目の数値データであっても職業によって更新年度が異なる場合がある点に注意が必要である。ダウンロードデータの末尾に領域ごとに「直近更新年度」を示す列があるため、特定の年度のデータに限定したい場合などに参照されたい。