数学、ときどき統計、ところによりIT

理論と実践の狭間で漂流する数学趣味人の記録

データ処理

自然言語処理で文書を美味しく頂くための下拵え

自然言語処理における前処理について思いつくまま書き出した個人的な備忘録です。

形態素解析 MeCab(2)

形態素解析 MeCab(1)の続きです。

形態素解析 MeCab(1)

与えられた任意の文に対して、意味を持つ最小単位の音素(これを形態素と言います)に分解して、音素の品詞を判別する処理を形態素解析と言います。今回は形態素解析を行うツールである MaCab の使い方についての個人的なメモです。

Windows 版 grep

grep は言わずと知れた文字列検索コマンドです。