最終更新: suezou2121 2013年05月10日(金) 13:06:27履歴
NLTKをインストール
NLTKに書いてあったものもついでに入れてみた。
// アップデート $ sudo apt-get update // easy_installを使えるようにする $ sudo apt-get install python-setuptools # easy_installを使ってNLTKをインストール $ sudo easy_install nltk # 動作試験 $ python Python 2.7.3 (default, Jan 13 2013, 11:20:46) [GCC 4.6.3] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>> import nltk >>>
NLTKに書いてあったものもついでに入れてみた。
$ sudo easy_install pip $ sudo pip install -U numpy $ sudo pip install -U pyyaml
MeCabのページ
http://mecab.googlecode.com/svn/trunk/mecab/doc/in...
インストールはコチラを参考を参考にしました。
http://nltk.googlecode.com/svn/trunk/doc/book-jp/c...
辞書のインストール時に出たエラーの対処法が参考になりました。
http://www.pxt.jp/ja/diary/article/249/index.html
http://mecab.googlecode.com/svn/trunk/mecab/doc/in...
インストールはコチラを参考を参考にしました。
http://nltk.googlecode.com/svn/trunk/doc/book-jp/c...
辞書のインストール時に出たエラーの対処法が参考になりました。
http://www.pxt.jp/ja/diary/article/249/index.html
MeCab のコンパイル時の configure のオプションに --enable-utf8-only を指定すると、MeCab の文字コードが UTF-8 に固定され、内部に EUC-JP や Shift-JIS 用の変換テーブルを埋め込まないため、実行バイナリを小さくすることができる。
$ wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz $ tar zxvf mecab-0.996.tar.gz $ cd mecab-0.996/ $ ./configure --enable-utf8-only --prefix=/usr $ make $ sudo make install
Python から呼び出す利便性を考え、UTF-8 に統一しておくとよい。Unix 環境においては、辞書をインストールする際に、下記のようにすると辞書がUTF-8 でコンパイルされる。
$ wget https://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz $ tar zxvf mecab-ipadic-2.7.0-20070801.tar.gz $ cd mecab-ipadic-2.7.0-20070801/ $ ./configure --with-charset=utf8 --enable-utf8-only $ make $ sudo make install
$ wget https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz $ tar zxvf mecab-python-0.996.tar.gz $ cd mecab-python-0.996/ $ python setup.py build $ sudo python setup.py install
python setup.py build でPython.hが無いと言われた。
どうやらpython2.7-devが必要らしい。
$ apt-get install python2.7-dev
コメントをかく