シンプソンのパラドックス-合計で見ると、結果が変わる?:研究員の眼

データを用いて、定量的に示された統計値は、見るものに有無を言わせない、圧倒的な切れ味を持つことがある。しかし、一方で...

統計には、物事の優劣を、端的に表すことができるという長所がある。データを用いて、定量的に示された統計値は、見るものに有無を言わせない、圧倒的な切れ味を持つことがある。

しかし、一方で、統計をまとめる人、解釈する人に悪意が働くと、誤った評価や判断に結びつきかねない。統計は、諸刃の剣(もろはのつるぎ)といえる。

統計が人を欺きかねない要素として、昔から、様々なパラドックスが挙げられている。その中で、有名なものの1つに、シンプソンのパラドックスがある。

これは、イギリスの統計学者エドワード・H・シンプソンによって示されたもので、これまでに多くの数学者や、統計学者によって、論じられてきた。以下、このパラドックスを、例を用いて、紹介しよう。

(例)

ある電子メーカーは、第1工場と第2工場の、2つの工場を持っている。それぞれの工場で、製品AとBの2つの製造ラインを持っている。一般に、製品を製造する際は、ある程度、不良品が出てしまうことが避けられない。

各メーカーは、不良品の割合をできるだけ少なくしようと努力している。このメーカーの第1工場、第2工場でも、不良品の割合を抑えようと、品質管理に努めている。しかしそれでも、不良品は発生してしまう。不良品は、検品を通じて把握され、製造ラインから除去される。

ある日の不良品割合を調べたところ、製品Aについては、第1工場5%、第2工場7%、製品Bについては、第1工場2%、第2工場4%となった。表にまとめると、次のようになる。製品A、Bのいずれについても、第1工場の方が、不良品割合が低く、良好な結果となった。

Open Image Modal

ここで、製品Aと製品Bを、合わせて見てみると、どうなるだろうか。2つの製品の合計では、次の表のように、第2工場の方が、第1工場よりも、少しだけ、不良品割合は低い結果となる。即ち、2つの製品を合計して見てみると、第2工場の方が、良好との結果になるのである。

Open Image Modal

なぜ、このようなことが起こるのだろうか。実は、これは、第1工場と第2工場で、主として製造している製品が異なることに起因している。

第1工場は、不良品が出やすい製品Aを中心に、製造を行っている。一方、第2工場は、不良品が出にくい製品Bを、主な製造対象としている。

その結果、個々の製品ごとには第1工場の方が不良品割合が低いにもかかわらず、両方の製品を合計すると、製品Bの取り扱いが多い第2工場の方が、不良品を出さないとの結果となる。

このような状況を、どのように評価すべきかということは、簡単なことではない。各製品の製造ごとに、不良品割合で優れている、第1工場をたたえるべきか。それとも、トータルの不良品割合を抑えている第2工場を評価すべきか。

不良品割合の実績数値だけではなく、品質管理への取り組み姿勢なども含めて、多面的に評価することが必要かもしれない。

なお、このシンプソンのパラドックスを悪用することは、論外である。

上記のような不良品の発生状況が判明したとしよう。この結果を見れば、第1工場の担当者は、製品A、Bそれぞれごとに不良品割合を評価すべきだ、と主張するだろう。

一方、第2工場の担当者は、製品個々の割合はさておき、製品全体での不良品割合が重要だ、と唱えるだろう。しかし、これらは、データや統計を、都合のよいように捉えることで、結果の評価や、それに基づく判断を、自分に有利になるように誘導しようとする動きと言える。

統計の結果は、数値で示されることで、交渉における説得力や、会議等での議論への影響力など、様々な威力を持つ。統計を扱う人が、悪意を持って、その結果を使えば、交渉や会議等が、誤った方向に導かれてしまう恐れがある。

シンプソンのパラドックスで示されるように、統計の結果を、自分にとって都合のよいように解釈して、断片的に表示していくと、統計そのものの信頼性を失わせることにも、つながりかねない。

統計は、最尤(さいゆう)推定法、帰無仮説などの、日常にはあまり見かけられない専門用語で、あふれている。また、統計的検定の結果を表現するときには、細やかな注意が必要となる場合もある。

このように、統計には、ある種のわかりにくさが、付きまとってしまう。こうしたわかりにくさを、減らしていくためにも、統計を扱う人には、真摯な態度が求められると思うが、いかがだろうか。

【関連レポート】

(2017年5月2日「研究員の眼」より転載)

株式会社ニッセイ基礎研究所

保険研究部 主任研究員