スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

ジップの法則が成り立つ理由

ジップの法則とは、
単語の出現頻度は、単語を出現頻度順に並べた時の順位に反比例する、
という経験則です。言語によらず成り立つようです。
ジップの法則 - Wikipedia

ジップの法則が成り立つ理由が長年疑問だったのですが、
英語の wikipedia に現在わかっていることが少しだけ書いてありました。
Zipf's law - Wikipedia, the free encyclopedia

アルファベットに空白文字を足したものの中から
一様分布にしたがってランダムに文字を選んで並べると、
ほぼジップの法則に従った「文章」ができるそうです。

ようするに、アルファベットの数を s とすると
n 文字の単語の出現確率は (1/s)^n であり、その個数は s^n 。
だから出現頻度 1/k の単語の順位はだいたい k 位になるというわけですかね。
なるほど。

他の分布の場合もジップの法則に従うようになるようなことが
上記ページには書いてあります。

コメント

コメントの投稿

トラックバック


この記事にトラックバックする(FC2ブログユーザー)

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。