続:マスメディア報道の空白域をビッグデータで可視化する

少なくとも東日本大震災のデータについて、私たちの手法は有効なようです。このプロジェクトは今年度の科研費研究「マス・ソーシャルメディアとビッグデータによる災害情報インテグレート手法の研究」として採択され、実用化に向けて歩を進めています。

2012年に開催された「東日本大震災ビッグデータワークショップ」の成果物について、ハフィントン・ポスト記事「マスメディア報道の空白域をビッグデータで可視化する」で紹介してからちょうど1年が経ちました。

この「東日本大震災マスメディア・カバレッジ・マップ」は、TV放送内容の文字起こしから「報道内で言及された場所」を抽出し、地図にマッピングすることで「TV報道の空白域」を割り出そうとするものでした。その結果、例えば茨城県の鹿島付近や、千葉県の旭付近が報道空白域となっていたことが示されました。さらに株式会社ウェザーニューズの「減災リポート」を重ねることで、TV報道の空白域を、ソーシャルメディアの災害状況報告が補完していたこともわかりました。

その後出版された書籍「データを紡いで社会につなぐ」(筆者著)や「震災ビッグデータ―可視化された〈3・11の真実〉〈復興の鍵〉〈次世代防災〉」(NHKスペシャル「震災ビッグデータ」阿部ディレクター編集)でも、この「メディア・カバレッジ・マップ」が大きく取り扱われています。

今回の記事では、その後の経過について報告します。まず、東日本大震災発生時のデータについて、地面から鉛直方向に時間軸を設定し、時空間的なビジュアライゼーションを施しました。下記のムービーにおいて、カラフルな光点がTV報道で言及された場所を示しています。各局ごとに色を変えてあります。

このビジュアライゼーションによって、TV報道の時空間に沿った密度分布がわかりやすくなりました。例えば、災害直後に頻繁に報道されていたが、その後は触れられていなかった場所、などを把握することができます。また、放送局別に色分けしてあるので、各局による報道対象地域の変化もみてとれます。

各局が入れ替わり立ちかわり報道していた場所がある一方、単一の局のみが中継していた場所があることもわかってきます。普段であれば「独占映像」として扱われる映像かも知れません。しかし、災害時には各局の映像を共有することによって、災害支援に役立てることができそうです。この「メディア・カバレッジ・マップ」はそのためのツールと成り得ます。

また、前述した「減災リポート」の時空間分布もわかります。ピンク色の小円アイコンで示されているのが「減災リポート」です。TV報道と比べ、個々のユーザが即時的に発信できる「減災リポート」は、初動が早いようです。また、どうしてもTV報道は市町村以上の粒度になりがちですが、GPS情報に基づく「減災リポート」は、よりきめ細かい位置を示すことができます。こうした特長は、TVによる災害報道の補完に向いています。つまり、マスメディア報道の空白域を、ソーシャルメディアが補うことができるのです。

このように、少なくとも東日本大震災のデータについて、私たちの手法は有効なようです。このプロジェクトは今年度の科研費研究「マス・ソーシャルメディアとビッグデータによる災害情報インテグレート手法の研究」として採択され、実用化に向けて歩を進めています。

まずはテストとして、東日本大震災と同じように広域災害となった「平成25年台風26号」のデータを処理し、マッピングしてみました。今回は株式会社エム・データから提供された放送メタデータを用いました。放送内容の文字起こしデータに含まれる地名をメタデータ株式会社の5W1H抽出APIで抜き出し、Google Maps APIでジオコーディングしました。

なお現時点では、放送メタデータからの地名抽出とジオコーディングの精度は完全とはいえず、おおまかな傾向がつかめる程度のものです。以下の内容については、その前提でご覧ください。

下記は、各局ごとの報道地域を並べたものです。上から、NHK、CX、TBS、NTV、EXの順です。大きなスケールで比較しても、各局の報道域に偏りがあることがみてとれます。今後、地名抽出の精度を上げ、さらに前述した時空間ビジュアライゼーションを施すことによって、よりはっきりとした傾向がつかめると予想しています。

さらに「減災リポート」と重ねてみた画像がこちらです。東日本大震災の事例と同じく、千葉県などにTV報道の空白域があり、「減災リポート」がそこを埋めているようすがわかります。突発的な地震とは異なり、台風の場合はある程度正確な進路予測ができます。したがって報道空白域は生じにくいと私たちは予測していましたが、このような結果になりました。

先に述べたように、このビジュアライゼーションは、5W1H抽出APIで抜き出された地名を、Google Maps APIで素朴にジオコーディングした結果に拠っています。したがって、地名抽出もジオコーディングも完全とはいえません。とはいえ、おおまかな傾向をつかむことはできます。TV報道や「減災リポート」の詳細な内容はアイコンをクリックすれば確認できますから、人力でエラーを補えます。現状、一般公開するにはまだ難がありますが、たとえば自治体の防災担当者が、災害発生時の初動に活かすといった用途には使えそうです。

今後は、より精度の高い手法を取り入れ、信頼性の高いシステムにしていく予定です。このブログでも、進捗を随時報告していきます。

注目記事