鉄道趣味と統計学

記事上部注釈
弊サイトでは実際に利用したサービスなどをアフィリエイトリンク付きで紹介することがあります

鉄道は総合産業です。地域に根差した交通機関であり、多くの技術が関わっているので、鉄道趣味を深めようとすると、多くの学問の知識が必要になります。地理や歴史との関係は言わずもがなですが、他の学問にも関わります。その学問の1つの統計学との関わりを紹介します。

E231系(新木場)

写真1. 混雑する朝の電車(2020年11月に新木場で撮影)

鉄道趣味と統計学の関係性まとめ

鉄道趣味と統計学の関係性に簡単にまとめます。詳細な考えかたなどは以下の章で記します。

・人の流れを分析するには統計学が重要である
・統計学を用いて、ダイヤや混雑などの分析に役立てることが可能である

復習:統計学の基本

写真2. 乗客流動を写真で表現することは難しい(大和で撮影)

統計学といっても奥が深い学問です。職場の研修で統計学の基本を学んだ立場から、統計学の基本をおさらいします。多くの目的があるでしょうが、統計は、多くのデータから規則性を見つけ出すために行うものです。統計を極めようとすると高度な知識が必要となりますが、別分野の趣味のための道具であれば、数値データで解析することと層別、そして相関関係でじゅうぶんです。

数値データでの解析

統計で重要なことは数値データで考えることです。統計的な手法は数学的手法の応用です。そのため、「良い」「悪い」「普通」という定性的な評価ではなく、100%、80%というような数値が良いということです。それも飛び飛びの数値でなく、連続する数値が良いということです。0%、20%、40%、60%、80%、100%では20%刻みのデータになりますが、80%と80.7%を区別できるほうが良いという意味です。

現実問題、連続する数値でデータを採ることは難しいです。それでも、言語データより数値データにすることを意識し、飛び飛びの数値データよりも連続する数値データにすることを意識したいものです。また、数値データを処理する際は、比例尺度になっているかの点に注意する必要があります。比例尺度?簡単にいうと、その数値を2倍にすると、量も2倍になる数値です。混雑率の%や電車の両数や本数はこの比例尺度に属します(混雑率80%は混雑率40%の2倍ですし、10両編成は5両編成の2倍です)。

なお、数値データを処理する際には示量値よりも示強値を採用するほうが良いです。混雑率は1両あたりの混雑を示しているので、示強値です。

※外部サイトにわかりやすい解説記事がありました。物理化学の分野なので、私以外にはわかりにくいかもしれません…。

層別

写真3. 名古屋地区の中央線は多種多様な編成が連結される(鶴舞で撮影)

数値データを処理する際には、多くの人が平均値を採用します。しかし、単純に平均するばかりが能ではありません。名古屋地区のJR中央本線の両数を見る際に、朝ラッシュ時、日中時間帯、夕方ラッシュ時間帯の区分をつけずに集計するのは得策ではありません。名古屋地区のJR中央本線は2両編成、3両編成、4両編成の短い編成を巧みにつなぎ合わせて4両編成~10両編成を組成しており、朝ラッシュ時の名古屋行きは10両編成が基本、日中時間帯は4両編成も混じるためです。

このように「多くのものをいくつかのグループに分けること」を層別といいます。このやり方を採用することで問題点をより具体化することができます。

相関関係

ある2つの数値があります。この2つの数値が関係あるかどうかを探るための概念が相関関係です。最も顕著な例は、気温と扇風機の売れ行きの関係です。気温が高いほど扇風機が売れますから、これら2つは相関関係があるということになります。相関関係は相関係数で表現できます。詳しい式は知らなくとも問題ありません。Excelで散布図を描けば、相関関係の有無を知ることができます。

なお、因果関係と相関関係の違いは要注意です。因果関係ではその2つが直接関係あることを示し、相関関係ではその2つに統計的な関係があることを示しています。例えば、列車本数と駅の利用者数に相関関係があったとして、本当に因果関係があるかは(統計的処理だけでは)わかりません。背景には駅周辺の人口という隠れた因子があるかもしれません。別の言いかたをすると、「因果関係にあるものは相関関係にある」とはいえるが、「相関関係にあるものは因果関係にあるかもしれないし、ないかもしれない」ということです。

鉄道趣味における統計の使いかた

TX2000系(北千住)

写真4. 北千住に停車中のつくばエクスプレス

以上、3つの基本的な概念を鉄道趣味でどう使いこなしているか、を私なりに記します。もちろん、「私が(私の)鉄道趣味にこのように活用している」という例であり、他にどのような使いかたをされるかは自由です。

私は混雑調査の混雑解析に統計の手法を導入しています。それぞれの段階で記します。

段階1:母集団がよく現れる標本を採取

難しいタイトルにしてしまいましたが、統計は限られたデータから全体をつかむことが目的のことが多いです。限られたデータから全体をつかむためには、全体の傾向が反映されるように観測対象を選ぶことが重要です。そのため、私は混雑調査は特定の駅で特定の時間帯の全列車を確認することにしています。朝ラッシュ時や夕ラッシュ時であれば、時々刻々と利用状況は変わるので長めに調査する必要があります。逆に、日中時間帯であれば、ダイヤ上の1サイクル確認すればじゅうぶんでしょう。

また、注意が必要なのが、輸送障害があまりない日を選ぶことです。いいかえれば、「いつもの」利用状況の日を選ぶということです。そのような意味でGWやお盆の平日は混雑調査には適していません。また、最混雑区間を確認するのが得策です。東武北千住や小田急下北沢では2層になっているので、工夫が必要です。東武北千住では複数回の調査が必要になりましたし、小田急の場合は混雑率がそこまで変わらない代々木上原を選択しました。

段階2:なるべく細かな基準でデータを採取

なるべく細かな基準でデータを採取します。混雑率を1%刻みで確認することは不可能ですので、飛び飛びの数値を採用しています。とはいえ、当初よりも細かな粒度で混雑率を確認するように努力しています。具体的にいうと、「混雑ポイント」を20ポイント刻みから10ポイント刻みに変更してます(2018年8月から実施)。

なお、混雑ポイントは現場で目視評価するために先人が編み出した手法です。比例尺度ではない数値です。瞬間的な判断が必要な現場ではともかく、統計的手法で解析するには適していません。

段階3:比例尺度に変換して解析

混雑ポイントは比例尺度ではないため、統計的手法に向いていません(140ポイントは70ポイントの2倍の混雑ではありません)。そのため、一般的な評価尺度の「混雑率」に変換します。混雑ポイントには幅がありますが、便宜上、中央値をとっています。この計算が大変という声もありましょうが、Excelで自動変換するようなシートを作成しています。そのため、10両編成の混雑ポイントを入力したら、その列車の平均混雑率はすぐに算出できます。ここまでくると病気ですね…。

もちろん、10両編成と8両編成が組み合わされる場合なども、きちんと編成両数で割るように自動でExcelのプログラムを組んでいます。この点は仕事よりもしっかりしています!(私の仕事ぶりを知る人がこのサイトを見たら驚くでしょう)

朝ラッシュ時に分析した場合のデータ解析手法を簡単にまとめます。

1) 10~15分間隔で混雑率を層別する
種別ごとの混雑率の差をキャンセルできるように、ダイヤ上の1サイクルで層別します。西武池袋線の朝ラッシュ時のように、快速急行と急行を同等に扱うなど、その路線のダイヤを熟考して層別対象を決めます。多くのやりかたがあると思いますが、私は単純に算術平均です。

2) 種別ごとの混雑率を層別する
次に、種別ごとの混雑率を分析します。私はこれも算術平均という単純な手法です。1)の解析で「時間帯によって混雑率が異なる」という分析がなされていることが多いはずですので、7:50~8:49などのように特定の60分間に絞っています。こうすれば、時間帯による違いは無視できます。

3) 号車ごとの混雑率を層別する
最後に、号車ごとの混雑率を分析します。種別によって混雑する車両が違う場合があります。そのような直感があれば、種別ごとに分析しますし、そうでない場合は種別によらずに分析します。

4) 混雑のムラの原因を推定する
ここまでは統計による機械的な分析です。あくまでも統計は「考えることを助ける道具」であり、統計が何かを導きだすわけではありません。統計の手法で何か傾向がわかったら、その違いが生じる理由を考察します。

鉄道趣味と統計学の融合のまとめ

他分野の知見を活かして、鉄道趣味をより深く堪能する方法を提案いたしました。もちろん、本記事を読んで、趣味的に自身にそぐわないと判断されたのであれば、それはそれで構いません。

鉄道趣味を極めると、他の分野にも興味を示す現象が観測されています。また、学問の修得や社会経験の深化にともない、ご自身の知見が溜まってくることもありましょう。このようにご本人の趣味のありかたはその人のバックグランドに影響され、その人のバックグランドはまた趣味にも影響されます。そうして、人は時々刻々と変化しているのです。そして、安全に配慮していて人に迷惑をかけない限り、他人が趣味に対してつべこべ言うこともないのです。

スポンサーリンク

シェアする

  • このエントリーをはてなブックマークに追加

フォローする