エイプリルフール

エイプリルフールについて、いままでなにかメモを残していないか、「エイプリル」でサイト内検索したがなにもでてこない。ずいぶん前のエイプリーフフールに、カミさんが「このハゲ、アホ」と怒鳴ったので、おもしろい嘘をつく人だとメモしたと思ったのだが、記憶違いだった。
でもなにかメモしているだろうと、「フール」で再検索しようとしたが、よく考えると全部ヒットする恐れがあるのでやめた。
なぜこれほどまでにこだわるのかというと、ランカスター大学の自然言語処理学者がおもしろい研究をしてるからだ。

エイプリーフの嘘も詐欺などの嘘も、嘘は嘘。そう思わない人はウー、思う人はソー、といおうがいうまいが、嘘は嘘だ。
でも似ているようで異なるものであるのも事実。それらの間に共通点があるかないか、研究者らは、370を超えるWebサイトから入手し、14年間にわたって書かれた500を超えるエイプリルフールの記事のデータをまとめあげ、多くの共通点が分かった。
それぞれには以下の特徴があるという。

エイプリルフールでの嘘は本物のニュースとを比べ、
一般的に長さが短い
ユニークな言葉を多く使う
一文が長い
読みやすい
将来のあいまいな事柄を参照する
現在への参照を多く含める
過去の出来事にあまり興味がない
固有名詞がより少い
一人称代名詞を多く使う

虚偽の記事は本物のニュースと比べると、
長さが短い
読みやすい
単純な言葉を使う
句読点がより少ない
固有名詞をより多く含む
一般的には形式的でなく- ‘ヒラリー’などのより多くの名を使用し、より冒涜的でスペルミスを含む
ごく少数の日付を含む
一人称代名詞を多く使う

ちなみにこのデータをもとに研究者は、記事がエイプリルフールの嘘か、虚偽のニュースであるか、あるいは本物のニュース記事であるかを識別するためのAI「クラシファイア」を作ったところ、 エイプリルフールの嘘で75パーセントの正確さで、虚偽のニュース記事では72パーセントの正確さでそうだと見抜いた。また クラシファイアがエイプリルフールの嘘情報について訓練を受け、虚偽のニュースを特定するという課題を設定したときは、65パーセント以上の正確さを記録したという。

メモしているオヤジの訳の正確さが20%以下という難点があるものの、おおよそそんなことがネタ元で述べられている。
ということで試しにエイプリルフールに流れた言葉をチェックしてみたい。
最初にメモしたように残念ながら院長室のメモを使っての検討はできないようなので、4月1日に語られた、阿倍 仲麻呂とは字が異なる、あべさんの言葉をチェックしてみようと思う。

「本日元号を改める政令を閣議決定致しました。新しい元号は令和であります。これは万葉集にある『初春(しよしゆん)の令月(れいげつ)にして、気淑(よ)く風和(やはら)ぎ、梅は鏡前(きやうぜん)の粉(こ)を披(ひら)き、蘭(らん)は珮後(はいご)の香(かう)を薫(かをら)す』との文言から引用したものであります
そして、この令和には人々が美しく心を寄せ合う中で、文化が生まれ育つという意味が込められております。万葉集は1200年あまり前に編纂された日本最古の歌集であるとともに、天皇や皇族、貴族だけでなく防人や農民まで幅広い階層の人々が詠んだ歌が収められ、我が国の豊かな国民文化と長い伝統を象徴する国書であります。」 云々(とても長くなるので全文は
こちら

もういちどエイプリルフールの嘘の特徴を確認すると、一般的に長さが短く、ユニークな言葉を多く使い、一文が長く、読みやすく、将来のあいまいな事柄を参照し、現在への参照を多く含め、過去の出来事にあまり興味がなく、固有名詞がより少く、一人称代名詞を多く使う だった。

あべさんの言葉をチェックすると、文章は長く、万葉の言葉以外はとりわけユニークな言葉が用いられているようでなく、一文もさほどの長さでなく、あいまいな将来は「希望に満ち溢れた新しい時代」程度で、「悠久の歴史と香り高き文化」など現在への言及が少し多い点は気になるが、万葉集をはじめ多くの固有の言葉に触れており、さらには一人称がない。

ということはこの日のあべさんの言葉はエイプリルフールの嘘ではない確率がぐんと高くなる、ということになるのだろう。

まぁ当然といえば至極当然のこと。
じゃあ、なぜそんなチェックしたかって? だって平成時代に「エイプリルフールじゃあるまいし」って発言、結構あったような気がしません?(残り少ない平成にまたあるかもしれないけど)

ネタ元