最近、データーマイニングについて勉強しています。
データーマイニングとは、大量のデーターを分析して、なんらかの傾向をつかむ手法のことです。
シェイクスピアの作品に使われている単語を全て解析すると、使用単語の分布が違う作品があることがわかりました。その作品は他人の作品ではないか?という説があります。
ブログデーターを収集して、使われている単語を分析し、急激に使用頻度の増えた言葉をピックアップすることで、今のトレンドを見出そうという試みが、あちこちのサービスで行われています。
この手法を上手く利用すれば、ある話題に対して、「良いのか悪いのか」「+なのか?なのか」を判断できると思うのです。
幾つか本を購入しました。
少しずつ勉強していきます。
|
powerd by amazon360
↑たつをのチャレンジログさんで紹介されてました。
|
powerd by amazon360
↑統計学を研究している友人から教えてもらいました。
コメント