ヌッ

適当

2014-10-14から1日間の記事一覧

文章中から頻出単語の抽出

たぶん自然言語処理に初めて手を出しました. HTMLの記事から頻出単語を抽出して,その頻出単語でキーワード検索して 別の記事をオススメするってのが目的. こういう文章中の単語の抽出には大きく分けて二種類あるとのこと. まず辞書を使う形態素解析とい…