MeCabの導入手順(CentOS6)
環境
- CentOS 6.4
Mecabインストール手順
Mecabのダウンロード、MeCab 用の辞書のダウンロード
ソースコードを落とす http://taku910.github.io/mecab/#download
Mecab、MeCab用の辞書のインストール
- ダウンロードした2つのファイルをインストール
- UTF-8のオプションを付けないと,後々文字化けに苦しむことになるので注意!
# MeCab本体 $ tar zxvf mecab-x.xx.tar.gz $ cd mecab-x.xx $ ./configure --with-charset=utf8 $ make $ sudo make install #辞書ファイル $ tar zxvf mecab-ipadic-x.x.x-xxxxxxxx.tar.gz $ cd mecab-ipadic-x.x.x-xxxxxxxx $ ./configure --with-charset=utf8 $ make $ sudo make install
試す
[vagrant@localhost mecab-ipadic-2.7.0-20070801]$ mecab 昨日の晩御飯はカレーとラーメンでした。 昨日 名詞,副詞可能,*,*,*,*,昨日,キノウ,キノー の 助詞,連体化,*,*,*,*,の,ノ,ノ 晩 名詞,一般,*,*,*,*,晩,バン,バン 御飯 名詞,一般,*,*,*,*,御飯,ゴハン,ゴハン は 助詞,係助詞,*,*,*,*,は,ハ,ワ カレー 名詞,一般,*,*,*,*,カレー,カレー,カレー と 助詞,並立助詞,*,*,*,*,と,ト,ト ラーメン 名詞,一般,*,*,*,*,ラーメン,ラーメン,ラーメン でし 助動詞,*,*,*,特殊・デス,連用形,です,デシ,デシ た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 。 記号,句点,*,*,*,*,。,。,。 EOS
- ファイルを読み込む場合は第一引数にファイル名を入れる.ファイルを出力する場合は-oオプション ファイル名で出力できる.
$ mecab sample.txt -o sample-result.txt
問題発生時
文字コードの指定をし忘れた場合
- 辞書ファイルを削除する
$ mecab -D # 辞書データの場所を探す $ sudo rm -rf /辞書データのディレクトリ/*
- 文字コード設定をしてインストールし直す
vagrant環境で辞書ファイルをインストールできないとき
- 辞書インストール時にメモリが512MBだとうまくいかないようなので,1GBにするとうまくいくかもしれない。