MeCab を MAMP の PHP で利用していましたが、もう一歩進んで文節に区切りたいと思い、今度は日本語係り受け解析器の CaboCha をインストールしました。
※ * はバージョン番号に差し替えてください。
CRF++ のインストール
CaoboCha をインストールするには、MeCab と CRF++ が必須条件になっています。MeCab は以前インストールしてあるので、CRF++ をインストールします。
Homebrew でインストール
Mac に Homebrew がインストールされている場合は、brew コマンドで CRF++ をインストールできます。
brew install crf++
ソースコードからインストール
次のウェブページから CRF++ のソースコードをダウンロードして展開します。
展開が終わったら、ターミナルで展開したフォルダーに移動してインストールします。
$ cd CRF++-*.*
$ ./configure
$ sudo make
$ sudo make install
CRF++ がインストールされていない状態で、CaboCha をインストールすると、次のエラーが表示されで make で次のエラーが出てしまいます。
chunk_learner.cpp:6:10: fatal error: 'crfpp.h' file not found
CaboCha をインストールする
まず、CaboCha を次のウェブページからダウンロードして展開します。
展開が終わったら、ターミナルを起動して展開したフォルダーに移動してインストールします。
$ cd cabocha-*.*
$ ./configure --with-charset=utf8 --enable-utf8-only
$ sudo make
$ sudo make install
configure で UTF-8 に関するオプションを付けないと、iconv conversion failed. skip this entry:...
という表示がでて、文字エンコーディングの変換に失敗してしまいます。
CaboCha の動作確認
CaboCha が正しくインストールされたことを確認するため、バージョンチェック。
$ cabocha -v
cabocha of *.*
バージョンが表示されれば OK。
php-cabocha のインストール
次に CaboCha を PHP で利用するために、php-cabocha をインストールします。
次のページから php-cabocha のソースコードをダウンロードして展開します。
展開が終わったら、ターミナルで展開したフォルダーに移動してインストールします。
$ cd php-cabocha-master
$ /Applications/MAMP/bin/php/php*.*.*/bin/phpize
$ ./configure --with-php-config=/Applications/MAMP/bin/php/php*.*.*/bin/php-config
$ sudo make
$ sudo make install
php.ini の編集
先ほどインストールした php-cabocha を起動時に読み込むよう php.ini に次の行を追加して保存します。
extension=cabocha.so
php.ini は /Applications/MAMP/bin/php/php*.*.*/conf フォルダーにあります。
php-cabocha の動作確認
php.ini の編集が完了したら、Apache サーバーを再起動して phpinfo の出力内容に cabocha のセクションがあることを確認します。
cabocha
CaboCha support | enabled |
コメントを残す