国交省は羽田新ルート案に関して1.7万件もの意見を集めたのだが、内容別の件数の集計を行っていないという(衆院質問主意書への回答)。
国交省の担当者に代わって分析して見えてきたのは、羽田新ルートの運用を心配・懸念する声や国交省の情報公開に後ろ向きの姿勢を問う意見が多いことだった。
※詳細は「羽田新ルート|意見1.7万件を分析して見えたこと」参照。
今回は、さらにテキストマイニング手法を駆使して、住民の声を可視化してみた。
テキストマイニングの方法
フリーソフト「KH Coder」を使うことで、文章データを単語や文節で区切り、それらの出現回数や出現傾向などを解析することができる。
テキストマイニングの対象は、国交省に寄せられた「意見」(1.7万件)そのものではなく、類似した「意見」を集約した「意見要旨」(345件。文字数にして約1万1千字)とした(次図)。
テキストマイニングの対象を「意見要旨」(345件)とした理由は次のとおりである。
国交省が公開している「みなさんからいただいたご意見の取りまとめ【PDF】(152.8MB)」(←「意見冊子」直下に添付されている)は、わざわざ紙に印刷した資料をスキャンしたうえでPDF化されているので、テキストのコピペが簡単にできない(ここでも国交省の隠蔽体質が発揮されている!)。1.7万件の文章全てをテキスト化するのは困難なので、「意見要旨」(345件)の文章をテキストマイニングの対象とした。
「特徴語上位10語」から聞えてくる住民の声
345件の「意見要旨」は、国交省によって、次の4つの「大分類」に分けられている。
- 羽田空港国際線増便の必要性と実現方策【126件】
- 課題への対応方策(対策や運用方法の工夫等)【111件】
- 進め方(全体) 【107件】
- その他【1件】
まず、「KH Coder」を使って、「大分類」ごとに抽出した特徴的な言葉のうち上位10語を次表に示す。
上表から、次のような住民の声が聞えてこないだろうか。
- 「羽田空港国際線増便の必要性と実現方策」:騒音への影響を心配する声
- 「課題への対応方策」:騒音・安全対策が求められている
- 「進め方(全体)」:コミュニケーション(住民への説明)問題
対応分析:国の視点、住民の視点…
つぎに、対応分析(コレスポンデンス分析)の結果を次図に示す。特徴語(上位60語)をクロス集計した結果を可視化することで、「意見要旨」(345件)の理解が進むことが期待できる。
対応分析の結果の解釈の仕方は色々ある。筆者は次のように、横軸は「住民の視点」、縦軸は「国の視点」を示していると解釈した。
- 図の右上に「聞く」「説明」「意見」など「コミュニケーション」に係る特徴語が多いこと、図の中ほどに「騒音」「安全」「事故」など「騒音・事故」に係る特徴語が多いこと、また図左上に「心配」があることから、横軸は「住民の視点」を示していると解釈した。
- 図の上部に「増便」「国際線」「提案」など「増便の必要性」に係る特徴語が多いこと、図の下に「運用」「対策」「補償」など「補償・対策」に係る特徴語が多いことから、縦軸は「国の視点」を示していると解釈した。
円の大きさが特徴語の出現頻度が高いことを表していることを踏まえると、「騒音」や「安全」への「影響」を心配する声が多いということも把握できる。
共起ネットワーク分析:羽田新ルート問題が…
さらに、共起ネットワーク分析をやってみた。この分析によって、どんな言葉が多く出てきていて、どの言葉とどの言葉が一緒に使われていたのかを探ることができる。
特徴語上位60語を対象に、共起ネットワーク分析した結果を次図に示す(円が大きいほど出現回数が多く、線が太いほど関係性が高いことを表している)。
色で分けられたネットワークの言葉を見て、筆者がエイヤっと付けた見出しは、「騒音・安全」「コミュニケーション」「飛行経路の運用時間」「増便の必要性」。羽田新ルートが抱えている問題が浮かび上がってくる。
まとめ
「意見要旨」(345件。文字数にして約1万1千字)の文章を対象にテキストマイニングすることで、住民の声を浮かび上がらせることができた。
特徴語上位10語から、住民の声が聞えてくる。
- 「羽田空港国際線増便の必要性と実現方策」:騒音への影響を心配する声
- 「課題への対応方策」:騒音・安全対策が求められている
- 「進め方」:コミュニケーション(住民への説明)問題
また、共起ネットワーク分析では、「騒音・安全」「コミュニケーション」「飛行経路の運用時間」「増便の必要性」といった、羽田新ルート問題が抱えているキーワードが明らかになった。
ただ、「意見要旨」(345件)の文章は、1.7万件の住民の声をもとに国交省が作成した文章である。そのためバイアスが掛かっている可能性があることにつき留意する必要がある。「意見要旨」(345件)ではなく、1.7万件の文章そのものをテキストマイニングできれば、もっと赤裸々な状況が浮かび上がってくるのかもしれない。