https://twitter.com/criticssuper/status/1218925331828002816?s=21
乾貴士と木下優樹菜の投稿の縦読みが話題ですね。
そこで、その縦読みが偶然そうなる確率について考えてみました。
日本語は、50音がありますね。51だっけ?50だっけ?まあそのぐらいです。
- あ
- か
- さ
- た
- な
- は
- ま
- や ゆ よ (3)
- ら
- わ を ん (3)
5×8で40ですね。これに、や行、わ行の3音ずつを足して46ですね。
wikiだとこうなってますけど。
- あ
- い
- う
- え
- お
- か
- き
- く
- け
- こ
- さ
- し
- す
- せ
- そ
- た
- ち
- つ
- て
- と
- な
- に
- ぬ
- ね
- の
- は
- ひ
- ふ
- へ
- ほ
- ま
- み
- む
- め
- も
- や
- ゆ
- よ
- ら
- り
- る
- れ
- ろ
- わ
- ゐ
- ゑ
- を
- ん
さて、文頭に、
- ん
- を
が来ないことを考えると、44候補あります。この44候補が、たとえば、
たかしあいしてる (8音
ゆきなだいすき (7音
というように、意味を持つ文章になる確率はどのくらいでしょう。
- あああ
- いいい
- ううう
というような、連続して3回同じ文字が並ぶことによって成立する日本語は無さそうな気がします。
- おお きなおっぱい
- いい おんな
- きき を感じる
- だだ をこねる
というように、2文字連続までならば、意味を成すものが非常に多い。
こういうことも考えながら話を進めて行きます。
あ!!濁音と半濁音忘れてた!!
懐かし〜〜、小学生に戻った気分だわ。
え、
濁音と半濁音ってどれにつくんだっけ、、、。
ああ、これか。
5×5=25ですね。
日本語では、44候補+25(69 ※を、ん、排除)がありますが、それぞれ等しい使用頻度なのでしょうか。いいえ、違います。
こちらの記事によると、
https://www.google.co.jp/amp/s/www.excite.co.jp/news/article-amp/00091179941794/
第1位…「い」833字(8%)
第2位…「ん」660字(6%)
第3位…「か」650字(6%)
第4位…「し」641字(6%)
この4文字だけで全体の26%の使用頻度だそうです。日本語の4分の1は、「い、ん、か、し」の4文字だけで表せる。
逆に
第44位…「ー」(長音)61字(0.6%)
第45位…「む」50字(0.5%)
第46位…「へ」49字(0.5%)
第47位…「ぬ」12字(0.1%)
などの使用頻度は低いようです。
トップ使用頻度と、最も使われていない「ぬ」の間には80倍くらいの差があるようです。これは大変だ。
こちらの記事によると、
トップの「い」が6653、ビリの「づ」が102とされています。
71個あるので、中間にあたる36番目の「よ」の使用頻度が1115です。
6653に102を足して÷2をすると、3300台になりますが、中央値が1115なので、その差分について考えたとき、上位に分布が集まってるということがわかります。
71の分布ランキングの中から、だいたい1/5、2/5、3/5、4/5、5/5となる地点を抜き出して見てみます。
- 1番使われてる 「い」 6653
- 18番目に使われてる 「る」 2376
- 36番目に使われてる 「よ」 1115
- 54番目に使われてる 「び」 358
- 71番目に使われてる 「づ」 102
これ、明らかに上位に偏っています。
中央値の「よ」1115に対して、トップの「い」は5〜6倍ありそうな感じですが、ビリの「づ」は中央値の「よ」1115に対して1/10か1/9かという勢いなので、ひらがなはやはり、
かなり特定のワードの使用頻度が高い
ということがわかります。
使うものはやたら使う、使わないものは使わない、それがひらがなと言えます。
それぞれの使用頻度を計算するのが面倒臭いので、1位に対して18位がおよそ35%の割合であることを踏まえて、
先ほどトップの音である「い」が8%の頻度で使われてることを前提に、8%の35%、すなわち2.8%が18位くらいの音の使用頻度であるとして、
1位から18位間のトータル使用頻度を出しましょう。
8%+2.8%÷2の5.4%を上位18音の平均出現率とすると、
5.4%×18で、97.2%と出てしまいます。
つまり、上位1/4くらいのひらがなでほとんどの日本語がカバーされちゃっていることがわかります。上位1/2にするともっとでしょう。
つまり、事実上、25%とか50%のひらがなでだいたいの日本語ができてしまうわけです。
さきほど、
第1位…「い」833字(8%)
第2位…「ん」660字(6%)
第3位…「か」650字(6%)
第4位…「し」641字(6%)
この4文字だけで全体の26%の使用頻度だという話をしましたけれど、4/71のひらがなで、全体の26%という話を考えるとあり得そうです。
でも、
ほんとでしょうか?
- い
- う
- ん
- し
- の
- か
- と
- た
- に
- れ
- な
- く
- て
- は
- こ
- わ
- き
- る
これだけのひらがなで生活できるでしょうか?
赤ちゃんみたいに、意思疎通するパターンをありとして、なんとか乗り越えられるでしょうか?意味は伝わるでしょうか?
- うんちしたい → うんし!うんし!
- フェラして欲しい → るれるれして!口淫!
- お腹すいた → こはん!こはん!こはん!
- 好意を伝える → しき!しき!好意!好感!
- 仕事行きたく無い → しこと!く!くるし!苦!しことはくるし!!はたれれない!しこと、くるし!!
おお、無理がありますがなんとかなりそうですね💦
まあ、つまり、相当、上位に偏っていることになります。一部のひらがなに偏っていることになります。
でもそれでも少し、汚いというか、成立してるか怪しい日本語です。
さらにそれに続く
がをでりょあもすらじっせつまだちけよ
を追加すると、
- い
- う
- ん
- し
- の
- か
- と
- た
- に
- れ
- な
- く
- て
- は
- こ
- わ
- き
- る
- が
- を
- で
- り
- ょ
- あ
- も
- す
- ら
- じ
- っ
- せ
- つ
- ま
- だ
- ち
- け
- よ
になります。
こうなってくると、
- うんちしたい → うんちしたい!
- フェラして欲しい → 口淫!咥えて!
- お腹すいた → 食事したい
- 好意を伝える → 好き!好意!好感!
- 仕事行きたく無い → 退職したい
と、だいぶ赤ちゃんを抜け出します!
36音でこれだけ言える!
おおお!すごい!!36音でなんとかなりそうです!!
71あるうちの、上位36でこれだけできる。
生活、エロ、恋愛、仕事という分野に渡り、しかも日常的なものとぶっ飛んだものを入れて作文テストしてみましたが、半分くらいの音でこれだけできるというのは大したものです。
では、この中で、
ゆきなだいすき
たかしあいしてる
が作れるでしょうか?
もし、この36文字の中で作れるものであれば、たまたまの可能性は十分あります。
すなわち、街で声をかけた人たちに仕事を聞いた時、社長じゃなくてサラリーマンである場合が多いようなものです。
・・・・・
・・・・・・
・・・・・・・・
- い
- う
- ん
- し
- の
- か
- と
- た
- に
- れ
- な
- く
- て
- は
- こ
- わ
- き
- る
- が
- を
- で
- り
- ょ
- あ
- も
- す
- ら
- じ
- っ
- せ
- つ
- ま
- だ
- ち
- け
- よ
https://twitter.com/takigare/status/1217817436403011584?s=21
たかしあいしてる
、、、はできました!!
ゆきなだいすきは、、、、
、、、
、、、
無理ですね!!💦
ない!
ないぞ!
ゆきなだいすき
の『ゆ』がないぞ!
きなだいすき
はあるけど、ゆが無いぞ!!
ここで問題の文章を見てみましょう。
ゆ、ですね。
https://twitter.com/takigare/status/1217817436403011584?s=21
ゆっくりしよー! 今日はオフやから。 何しようかなあ。 だいぶん暑いなあ Sevilla 今すぐプール飛び込みたい すぐまた合宿やぁ きっちり休んでまた頑張ります
ゆっくりしよう、今日はオフだから
『今日はオフだからゆっくりしよう』、じゃなくて?
謎の倒置表現、コピーライターか、これ笑
あれ?
怪しいですね?
これだけカバー率があるひらがな36音でも、綺麗に作ることができないのです。
ということは、頻度の高いひらがなの中で、ランダムに文字列を生成しても、『話題の文章』が作れないことになります。
しかもそれに加えて、
インスタグラムなどで、意味のある文章を表向きに生成しておきながら、縦並びで意味のある文章を生成される確率は?
もちろん、漢字を使っている分、やりやすさはあると思いますが(漢字は音読み、訓読みがあるので2音備えている)、漢字の読みがひらがなで表せられることに変わりはなく、また、世間で噂されている縦読みは漢字は一致しておらずひらがな読みなので問題ないでしょう。
ただ、成立しない
ゆきなだいすき
を送った方が、7文字中3文字漢字を使っていて、
- 今 (いま、きん、こん)
- 何 (なに、なん、か、いず、あど、あん)
なのですが、つまり、今=い、き、この3音、何=な、か、い、あ、の4音ということで、通常のひらがなよりも複数の音を持っている分成立させやすいのが気になるところです。
とは言え、漢字がその低頻出の『ゆ』にあてられていたらわかりますが、そうではありません。
しかもこの『ゆ』、単体では中央値の『る』に対して13%の出現頻度しかないのです。
下から数えて、14番目です。全71中。
出現頻度下位19%のワードです。
実際、この文章で1番怪しいところは冒頭でしょう。冒頭の倒置的な表現です。
ゆっくりしよー!
今日はオフやから。
何しようかなあ。
だいぶん暑いなあ Sevilla
今すぐプール飛び込みたい
すぐまた合宿やぁ
きっちり休んでまた頑張ります
しかも、ここには意図的な改行が関係してきます。
以上の文章を改行せずにつなげて、句読点を置かなかったりすればまったくわからなくなりますが、この改行が怪しいのです。この改行も一つ、選択性があるもの。
さらに、当事者として怪しまれている男女2人が同時期・同タイミングにお互いのことと思われるお互いに向け合うフレーズを発する確率は?
両者が独立であれば、お互いに意味のある文を向け合う確率は下がりますが、お互いに影響し合う要素が根底にある場合は、話は別です。
優樹菜側の発生した縦読みは、乾側よりも偶然に起こりうるかと思いますが、乾側が大変怪しい。このあたりは、
- パラフレーズ
- SNSコントロール
- 言葉遣い
などに生涯を通して長けていると思われるサイドに軍配が上がると言えます。
不自然さは、乾サイドの投稿の方にあるかもしれません。
母数となる投稿数なども考えなければなりませんが、世間でされている噂や疑惑の根拠は、これだけに留まらず他のものも重ね合わせて推定されていると考えられるでしょう。
最後に余談ですが、我々知的創造産業に従事している人間は、
ランダムで言葉を組み合わせるプログラム
などを用いて、奇想天外な文章からアイデアの種を得るようなことをするのですが、言葉というものはランダムに組み合わせるとなかなかそれっぽいものができないものです。
その証拠に、と言ったらなんですけど、この記事を文頭縦読みしてみてください。全然成立してないでしょう。そんなもんなんですよ、普通の日本語文章は。
2人とも、高卒未満だよね?
日本国民の56%ぐらいは大卒なんだよ。
こんな言葉遊びみたいなことしてたら、・・・・・ねぇ。笑
不倫するならもっとうまくやればいいのに。笑
国民の半分以上は、ゆきなとたかしより勉強してきてるんだから。💦笑
わざとリークしてるのかもしれないけど💦
しかもただでさえ好感度低いのに、ユッキーナは笑
https://twitter.com/takigare/status/1217817436403011584?s=21
https://twitter.com/takigare/status/1217721163108872192?s=21
https://twitter.com/takigare/status/1217718723861078016?s=21
https://twitter.com/takigare/status/1217718723861078016?s=21
https://twitter.com/takigare/status/1217740957996576768?s=21
https://twitter.com/takigare/status/1217743077374230528?s=21
https://twitter.com/takigare/status/1217740710318755840?s=21
https://twitter.com/seeseeda/status/1218081970103578624?s=21
私が乾さんなら、ハットトリックして世間を誤魔化すしか無いですね💦
がんばれ💦
https://youtu.be/nWV815PEp4E
===
"make you feel, make you think."
SGT&BD
(Saionji General Trading & Business Development)
説明しよう!西園寺貴文とは、常識と大衆に反逆する「社会不適合者」である!平日の昼間っからスタバでゴロゴロするかと思えば、そのまま軽いノリでソー◯をお風呂代わりに利用。挙句の果てには気分で空港に向かい、当日券でそのままどこかへ飛んでしまうという自由を履き違えたピーターパンである!「働かざること山の如し」。彼がただのニートと違う点はたった1つだけ!そう。それは「圧倒的な書く力」である。ペンは剣よりも強し。ペンを握った男の「逆転」ヒップホッパー的反逆人生。そして「ここ」は、そんな西園寺貴文の生き方を後続の者たちへと伝承する、極めてアンダーグラウンドな世界である。 U-18、厳禁。低脳、厳禁。情弱、厳禁。