プロメモグラム

誰が見てもわかるような文章を目指す

MeCabの導入手順(CentOS6)

環境

Mecabインストール手順

Mecabのダウンロード、MeCab 用の辞書のダウンロード

ソースコードを落とす http://taku910.github.io/mecab/#download

  • mecab-x.xx.tar.gzとmecab-ipadic-x.x.x-xxxxxxxx.tar.gzをダウンロード(最新版)

MecabMeCab用の辞書のインストール

  • ダウンロードした2つのファイルをインストール
  • UTF-8のオプションを付けないと,後々文字化けに苦しむことになるので注意!
# MeCab本体
$ tar zxvf mecab-x.xx.tar.gz
$ cd mecab-x.xx
$ ./configure --with-charset=utf8
$ make
$ sudo make install

#辞書ファイル
$ tar zxvf mecab-ipadic-x.x.x-xxxxxxxx.tar.gz
$ cd mecab-ipadic-x.x.x-xxxxxxxx
$ ./configure --with-charset=utf8
$ make
$ sudo make install

試す

[vagrant@localhost mecab-ipadic-2.7.0-20070801]$ mecab
昨日の晩御飯はカレーとラーメンでした。
昨日    名詞,副詞可能,*,*,*,*,昨日,キノウ,キノー
の      助詞,連体化,*,*,*,*,の,ノ,ノ
晩      名詞,一般,*,*,*,*,晩,バン,バン
御飯    名詞,一般,*,*,*,*,御飯,ゴハン,ゴハン
は      助詞,係助詞,*,*,*,*,は,ハ,ワ
カレー  名詞,一般,*,*,*,*,カレー,カレー,カレー
と      助詞,並立助詞,*,*,*,*,と,ト,ト
ラーメン        名詞,一般,*,*,*,*,ラーメン,ラーメン,ラーメン
でし    助動詞,*,*,*,特殊・デス,連用形,です,デシ,デシ
た      助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
。      記号,句点,*,*,*,*,。,。,。
EOS
  • ファイルを読み込む場合は第一引数にファイル名を入れる.ファイルを出力する場合は-oオプション ファイル名で出力できる.
$ mecab sample.txt -o sample-result.txt

問題発生時

文字コードの指定をし忘れた場合

  • 辞書ファイルを削除する
$ mecab -D # 辞書データの場所を探す
$ sudo rm -rf /辞書データのディレクトリ/*

vagrant環境で辞書ファイルをインストールできないとき

  • 辞書インストール時にメモリが512MBだとうまくいかないようなので,1GBにするとうまくいくかもしれない。

参考

手順

MeCabの使い方