Google Ngram Viewerによる最強のダイエットはプロテインダイエットだった
https://yuchrszk.blogspot.com/2014/02/google-ngram-viewer.html
「5百万冊の本から学んだこと」ってTED動画で知った、GoogleのNgram Viewerが楽しいです。
Ngram Viewerは、Googleがスキャンした約500万冊の本のデータをもとに、1500年代から現在までに出版された書籍に出現する語句の頻度をグラフにできるサービス。
まずは、ワイルドカードを使って、1800年から現在までの「ダイエット法」のグラフを出してみました。こうして見ると、 1930年代からタンパク質の地位がガンガン上がっていく一方で、牛乳と野菜の地位がダダ下がりしているのがよくわかりますなぁ。タンパク質の次に多かった単語は「カロリー」で、このへんは順当なところ。
うーん、にしても、もうちょい面白いグラフを作れそうな気もしますが、いまいち思いつかないんだよなぁ。どなたか良いアイデアがあれば教えて下さい。
あとは余談ですが、有名な映画監督の出現頻度も見てみたら、意外なことにウッディ・アレンが1位に。個人的にはスピルバーグのトップを予測していたのでビックリ。まぁ、これはウッディ・アレンが多作なせいかもしれませんが。
ついでに、有名なシリアルキラーのグラフも出してみました。マンソン、バンディ、ダーマーが三強ですね。切り裂きジャックの出現度が低いのが意外でした。