p値

p値についてメモしよう。ピーチといっても桃のようには甘くない代物だ。

ある現象の統計的判断をする際に用いられ、ざっくりいうと、この値が小さ目だとめったに起こらないことが起こっている、ということが推論できるのだ。
それを”統計的に有意”と表現する。

たとえばある薬がある病気に効くかどうかということで、ざっくり説明しよう。
仮に薬が効かないとしたときに起こる、そのくすりを使った患者と治療の結果をOとしよう。いろいろ計算してp値が小さ目だったすると、効かないとしたときにはめったに起こらないことが起こっているわけで、それはすなわち効果があるだろうと考えられる。
桃をざっくり割ると、Oに対峙する桃太郎が出てくることを想像すれば、より理解しやすいかもしれないが、それはざっくり、あなた次第かもしれない。

「Science Fiction -あなたが知らない科学の真実」(シュチュアート・リッチー著)ーは、現在いろんな要因で科学的真理の公開の在り様が歪められていることを訴える、とても示唆に富む内容で一読に値するものだ。

荒廃の理由は、いろいろある。研究者と企業の利害関係、不適切な研究設計、途中でいい結論だけを拾うような研究態度、再現性の問題、研究対象の数的規模の問題などいろいろその荒廃の根拠が指摘されているのだが、このp値がいろんなところに出てくる。

p値ハッキングー統計的に有意な結果を得るために、データを操作する行為ーやp値スピンー有意でないp値について、わざとあいまいな表現をする行為―が科学論文のなかにしばしば見つかるという。
たとえばスピンなどはこんな表現が駆使されるのだ。

「有意水準に近づく傾向にある」
「統計的有意性の限界にきわめて近い」
「有意の前後で推移している」
「絶対的にそうではないが、ほぼそうである」

なんと嘆かわしいことだろう。
研究者の方々は改めてこの故事を思い出すべきではないだろうか。

李下、すなわちピーチ下に冠を正さず。

・・・うーん、ざっくりいって、出来はいまいち。