コラム

統計データから間違った結論を出してしまう理由(東京の鉄道は不便なのか)

今回は、統計データからなぜ間違った結論を出してしまうのかについて考察し、統計データに対する疑問の持ち方について解説します。

東京の鉄道は他の先進国より不便?

今回は、次の記事を題材として取り上げて、統計データから誤った結論を出す原因とどうすれば避けられるかについて解説します。

出典:本川 裕「東京の地下鉄駅から徒歩10分圏に住む人はたった13%で主要先進国最低…規模世界一のなのに不便といえるワケ」(2024/5/10) PRESIDENT Online(プレジデントオンライン) 2024/5/13閲覧

上の記事では、OECD加盟国の都市圏の交通データを元に、東京は他の先進国と比較して軌道系の交通機関(=鉄道)が不便であるという結論を出しています。
筆者は記事冒頭で「地下鉄駅から徒歩10分=666m以内に住む都民は全体の13%程度しかいない。実はアクセスがいいとは言えない」と言っています。
しかし、東京都心は網の目のように地下鉄や鉄道路線が張り巡らされているため、この結論は直感に反するものです。
実際にデータを詳細に確認すると、その結論が妥当とは言い難いことがわかります。
この記事では、単に間違っているで終わりではなく、なぜそのような結論になったのかまでを深堀りすることで、統計データの見方について考えていきます。

問題のデータを深堀り

OECD加盟国の都市の徒歩10分以内に公共交通機関を利用できる人口の割合 (交通手段別)。濃紫色のPublic transport stpoは公共交通機関全体であり、大部分の都市で黒横線のバス停とほぼ同じ値である(=他の交通機関がある所にはだいたいバス停がある)。一方、薄紫色のひし形はメトロまたはトラムである。メトロは日本では地下鉄に対応するが、欧米諸国ではこのカテゴリに都市圏の通勤列車(都市高速鉄道)の多くが含まれる。トラムは路面電車やライトレールなどの併用軌道の低速度の交通機関である。オークランドでメトロやトラムの割合が低いのはオークランドの通勤鉄道路線の大部分がメトロでもトラムでもない普通の鉄道であるためである。駅や停留所の位置情報はOpenStreetMapを用いてカバー人口を算出している。出典のFigure 2.13. を転載。出典:Built Environment through a Well-being Lens, OECD iLibrary (2023) 2024/5/14閲覧

上の図は東京の鉄道が不便であるという結論を出した根拠データです。
記事中では日本語訳の上、加工されたこちらの表を掲載していますが、ここでは出典元の表を掲載しています。

出典(原典):Built Environment through a Well-being Lens, OECD iLibrary (2023) 2024/5/14閲覧

この図を見ると、左から10番目の JPN - Tokyo(東京)はPublic transport stpo(公共交通機関)10分圏内の人口が8割であるのに対し、Metro or Tram stop の10分圏内の人口は1割強に留まります。
筆者は、Metro or Tram stop (メトロまたはトラム停留所)を地下鉄と市電と翻訳しています。
実際、記事の図のタイトルは「図表3 地下鉄・市電のカバー率の低さが目立つ東京の公共交通」となっています。

原典のOECDのレポートでこの図(Figure 2.13.)に言及する記述としては、メトロやトラムよりもバスの方が近い人が多い点にふれているのみです。
原典ではこの図を用いて都市間の比較をしておらず、このデータをもって東京の鉄道のカバー率の低さに注目しているのは純粋に筆者の主張であると言えます。
このグラフを見る限り、確かに東京は地下鉄と市電のカバー率が他の先進国の都市と比べて少ないです。
しかし、東京の地下鉄の網の目のような路線図を見ると「徒歩10分圏内人口が1割」というのはかなり違和感のある結果です。

分子がおかしい原因(メトロとは何か)

グラフの結果と違和感の原因について探るために、「メトロ」と「トラム」とは何かについてふれます。
「トラム」は路面電車やライトレールなどの併用軌道を指し、これは日本でも同様です。
一方、「メトロ」に関しては欧米と日本で事情が異なります。

欧米では都市圏内の通勤電車と都市間を結ぶ鉄道は別の組織で運行されるのが一般的です。
そのため同じ鉄道でも別々の呼称でよばれており、都市間を結ぶ鉄道(Railway)に対し、都市圏内の専用軌道の鉄道(=路面電車(トラム)以外の鉄道)をメトロ(Metro)とよびます。
日本では都市内で完結する通勤電車を運行するのは地下鉄であるため、メトロは地下鉄と訳される場合が多いです。
しかし、欧米のメトロはRapid transitとよばれる路面電車以外の鉄道全般を指し、地下鉄以外の都市圏内の通勤電車も含まれます。
そのため、メトロは日本の地下鉄よりもずっと広い概念であり、東急田園都市線やJR中央線快速電車などの都心と郊外を結ぶ一般的な鉄道も含まれます。
欧米諸国では都市圏内の通勤電車(というか公共交通機関全体)は同じ組織が一括して運営する方式が主流なので、一括してメトロとよばれています。
ところが、日本では多くの鉄道会社が入り乱れて都市圏内の交通を分担しているため、地下鉄だけではなくJRや私鉄も通勤電車を運行しています。
中には、欧米ではふつう別組織で運行される都市間鉄道であっても、都市近郊では通勤電車を運行し、都市間特急や貨物列車と通勤電車が同じ線路を走る場合もあります(例:JR中央本線、近鉄大阪線など)。
さらに、東京では地下鉄と通常の鉄道路線の相互直通運転が一般的であり、東京メトロ千代田線とJR常磐線(各駅停車)のように事実上一体となって運行されている例もあります。
このような運行形態は日本特有であり世界的に珍しい事例です。

行き違う東京メトロ16000系電車(左)とJR東日本E233系2000番台電車(右)(JR常磐緩行線の馬橋ー北松戸間、千葉県松戸市)。欧米諸国では都市圏内の交通は一つの組織が一体となって運行される(メトロ)のに対し、日本では複数の鉄道会社が分担して都市圏内の交通を担っている。東京では、一体的な輸送サービスを行うために都心部の地下鉄と郊外の鉄道路線の直通運転が行われている。そのため、地下鉄と郊外鉄道の車両が同じ線路を走る光景が日常的に見られる。出典:Wikimedia Commons, ©MaedaAkihiko, CC BY-SA 4.0, 2024/5/14閲覧

それでは、本当に日本の「メトロ」部分の集計値には地下鉄しか使われていないのでしょうか。
それを確かめるために、OECDのレポートで駅や停留所の位置情報取得に使用したOpenStreetMapの属性情報について見てみます。

出典:JA:Key:railway, OpenStreetMap 2024/5/14閲覧

上のリンク先を見ると、キーと値の一覧および説明が記載されています。
メトロに相当するのはsubwayであり、説明には「地下鉄。主に地下や高架を走る都市の旅客鉄道です。(w:rapid transitを参照)。」と書かれています。
英語を直訳したと思われる不自然な文ですが、リンク先のWikipediaの記事を確認しても、subwayには高架を走る地下鉄と以外の通勤電車が含まれることがわかります。
OpenStreetMapを見ると、東京メトロ銀座線のrouteキーの値がsubwayになっているのに対し、同じく通勤電車に対応するJR京浜東北線のrouteキーの値はrailwayになっています(routeについてはこちらを参照)。
この結果から、OECDのデータのメトロには、欧米では地下鉄以外の通勤電車は含まれるが、日本では地下鉄のみであると言えます。
欧米諸国の「メトロ」を直訳した日本の「地下鉄」の数値を使用して集計したため、日本では分子の値が他の都市よりも小さくなったと言えます。

しかし、まだ疑問が残ります。
いくら分子が地下鉄のみであったとして、東京23区内に網の目のように路線網が広がるため、徒歩10分圏内人口が1割強なのはいくらなんでも少なすぎないかという点です。
そこで、次に分母の「都市人口」について見ていきます。

分母もおかしい(都市人口の定義)

分母にあたる「東京」の人口ですが、東京とはどの範囲を指すのでしょうか。
記事の図表3を見ると、東京は東京23区や東京都のことではなく、機能都市圏としての東京(人口3647万人)であると記載があります。
これは人口規模からいって都市雇用圏である東京都市圏(人口3530万人)とほぼ同じと見なせます。
東京都市圏は1都3県(東京・神奈川・埼玉・千葉)に加えて茨城と山梨の一部まで広がります。

以上をふまえると、OECDのデータでは1都3県の人口を分母として、東京23区周辺にしか走らない地下鉄・路面電車の駅から徒歩10分以内の人口を分子にとって集計していたことがわかります。
OECDのような公的機関のデータであっても、このように実態から著しく乖離した誤解を招く数値を算出し、資料に掲載することがある点は現実として受け止めておくべきでしょう。

それではなぜ、OECDはこのような集計を行ってしまったのでしょうか。
推測になりますが、日本の鉄道の特殊事情に関するドメイン知識の不足または集計の簡略化が考えられます。
欧米諸国では都市の通勤電車は一体となって運行されるメトロが一般的であり、日本では地下鉄のみを指してメトロと呼ぶことを知らなかった可能性があります。
また、この事実を知っていたとしても日本では都市圏内完結の通勤電車とそれ以外の鉄道の境界があいまいであり、個別の国の事情に一々対応していたのでは作業量が膨大になるため、あえて集計しやすい地下鉄のみのデータを使用した可能性もあります。

このような取り扱いはドメイン知識が無いと気づくのが困難であり、データを扱う際のドメイン知識の重要性が認識されます。

間違った結論を出さないためには

それでは、間違った結論を出さないためにはどうすればよいのでしょうか。
やるべきことは、データや集計値に違和感を持ち、それを突き詰めて調べることです。

OECDのデータでは、東京で地下鉄・路面電車の駅から徒歩10分圏内の人口は全体の13%程度しかいないとなっており、筆者もそのように主張しています。
しかし、これは東京の鉄道網に関する一般的なイメージからは、かなり違和感がある結果です。
東京都は47都道府県で最も自家用車の保有比率が低く、多くの人は公共交通機関を利用して生活しています。
この違和感を大事にして、違和感の原因を調べるための深堀りを行うことが間違った結論を出さないために必要なことです。

まず違和感をもつためにはデータの分野(今回は都市交通)についてざっくりとした知識を持つことです。
その上で、違和感を持ったなら、その違和感の原因を要素に分解しながら調べていくます。
今回は、集計値を分子と分母に分解した上で、記事のデータの引用元であるOECDのレポート、さらにはその原典にあたるOpenStreetMapのデータ構造にまで遡って確認しました。

文章の検証可能性

なお、今回このように「違和感」の原因を検証できたのは、出典を明記した検証可能性のある分析だったからです。
記事の主張や議論は出典を明記したデータに基づいており、出典も図表番号まで明記しているため、違和感の原因の検証が容易でした。
さらに言えば、記事ではOECDレポートのMetroを地下鉄、tramを路面電車と正確に翻訳しており、人口の分母が機能都市圏であることを明記しています。
このように出典で使われる用語の意味を正確に理解し、それを適切な日本語に翻訳しているため、データの意味が正しく伝わります。

これは当たり前のことではありません。
この事例であればメトロを「通勤電車」と翻訳してしまえば、地下鉄だけではなく一般的な鉄道も含む数値であると誤解させてしまい、原典にあたらないと正確な指摘ができなくなってしまいます。
しかし、現実には原典とは違うニュアンスや意味に要約されてしまうことが多々あり、さらに言えば出典をきちんと書いていない情報の方が多いです。
その点、この記事では、根拠となるデータと出典を明記した検証可能性がある文章であり、(今回は結論が間違っているとは言え)筆者の分析は信頼性が高いと思います。

世の中にはもっともらしい情報が流れていますが、出典も怪しく検証可能性が皆無の情報が大部分です。
学術論文の信頼性の高いのは正しいからではなく、検証可能性があるからです。
そのような意味では、記事の結論こそ間違っていますが、根拠となるデータと出典を明記した検証可能性がある分析である点は明白であり、質が高いものと言えるでしょう。

参考文献

本川 裕「東京の地下鉄駅から徒歩10分圏に住む人はたった13%で主要先進国最低…規模世界一のなのに不便といえるワケ」(2024/5/10) PRESIDENT Online(プレジデントオンライン) 2024/5/13閲覧
Built Environment through a Well-being Lens, OECD iLibrary (2023) 2024/5/14閲覧
Rapid transit, Wikipedia 2024/5/14閲覧
地下鉄 ウィキペディア 2024/5/14閲覧
JA:Key:railway, OpenStreetMap 2024/5/14閲覧
JA:Relation:route, OpenStreetMap 2024/5/14閲覧
都市雇用圏 ウィキペディア 2024/5/14閲覧

-コラム