私たちは悪態をつく人たちの国に住んでいる。
仕事でも家でも悪態をつく。政治家も口が悪い。罵ることはストレスを軽くして健康に良いという研究結果もある。
しかし、罵る時にどんな言葉を選ぶかは人それぞれだ。これから挙げる地図は、アメリカの隣接する48州で使われる悪態語の違いを表している。
「Darn(ダーン)」、「Damn(ダム)」、「Bitch(ビッチ)」、「Shit(シット)」、「Fuck(ファック)」、「Asshole(アスホール)」、「Motherfucker(マザーファッカー)」、「Gosh(ゴッシュ)」、「Cunt(カント)」といった代表的な悪態語をマッピングしてみた。
上の地図からわかるように、48州で使われている罵り言葉には地域的なパターンがある。古き良き「Damn」は南部東海岸沿いの州でよく使われるが、都市部の人間は「Fuck」を好む。ニューイングランドで「Cunt」がこんなに人気だったとは初耳だ。
この「悪態語マップ」の作者はイギリスのアストン大学で犯罪言語学の教授を務めるジャック・グリーブ氏で、7月16日にツイッターでこの地図を公開した。彼はサウスカロライナ大学でディアンシェン・グオ氏とともにあるプロジェクトに取り組んでいる。データマイニングのコンテスト「ディギング・イントゥー・データ・チャレンジ」の一環として行われている、位置情報付きツイートを利用した方言マップ作成プロジェクトだ。
具体的に言うと、グリーブ氏は悪態語マップのために2013年10月から2014年11月までに収集した10億近い位置情報付きツイート、単語にすると90億個近くのデータを資料として使った。
グリーブ氏はデータ分析とマップ制作のプロセスについて次のように説明した:
1. すべてのツイートを郡ごとに仕分ける
2. それぞれの郡について、特定の単語(例えばFuck)がツイートの中に出てくる総数を、全ツイートの単語の総数で割ることで、その単語の相対的頻度を計算する。こうすることで、郡ごとのツイート数のバラつきが調整される。ネット上にあるツイッター統計マップのほとんどでは、この調整が行われていないのが大きな問題である。それでは基本的にただの人口密度マップになってしまう。
3. この未完成マップをもとに、ホットスポット分析(Getis-OrdによるGiローカル空間的自己相関分析)を使って基底クラスターを特定する。この処理をしないと地図がごちゃごちゃになってしまいやすい。これが視覚化と解釈の点で非常に役に立つ。
4. Getis-OrdのZ値をマッピングしてクラスターを特定する。具体的に言うと、高いZ値は郡がその単語が相対的によく使われる地域の中にあることを意味し、マイナスのZ値は郡がその単語があまり使われない地域の中にあることを意味する。
グリーブ氏はハフポストUS版へのメールでこう語った。「ツイッターの楽しみになると思っただけなんです。私が書こうとしている学術論文とはあまり関係ありません。悪態語マップはほんとうに私の手から離れてしまったようです」
興味がある方へ。アメリカ人は「Boobs(胸)」より「Butts(尻)」が好きでもある。
この記事はハフポストUS版に掲載されたものを翻訳しました。
【関連記事】
ハフィントンポスト日本版はTwitterでも情報発信しています。@HuffPostJapan をフォロー