2007年11月19日月曜日

茶筌chasen-2.4.2, Darts 0.31, UniDic1.3.5のインストール

最新版茶筌chasen-2.4.2をDarts 0.31、UniDic1.3.5と組み合わせてインストールしました。結構落とし穴があるようなので、参考のためにブログに記します。

Darts 0.31のインストール

wget http://chasen.org/~taku/software/darts/src/darts-0.31.tar.gz
tar xvzf darts-0.31.tar.gz
cd darts-0.31
./configure

*configure error: C++ prerrocessor "/lib/cpp" fails sanity check
などのエラーが出たら、C++のコンパイラがインストールされていないということなので、gcc-c++をインストールする。
yum install gcc-c++

そして作業再開。

make
make install

chasen-2.4.2のインストール

wget http://keihanna.dl.sourceforge.jp/chasen-legacy/26441/chasen-2.4.2.tar.gz
tar xvzf chasen-2.4.2.tar.gz
./configure --with-darts=/usr/local/include --with-libiconv=/usr/local

gcc(g++) verison 3.4.3以上でコンパイルエラーが起こるので、lib/dartsdic.cppの180行目を以下のように修正する。

修正前:(const char*)keys[size] = key.data();
修正後:keys[size] = (char*)key.data();

make
make install

uniDic-1.3.5のインストール


システムをEUCで統一しているので、http://www.tokuteicorpus.jpから個別ファイル->Linuxと進んで、UniDic-chasen-1.3.5_eucj.tar.gzをダウンロードする。

tar xvzf UniDic-chasen-1.3.5_eucj.tar.gz

/unidicというディレクトリに辞書ファイルや文法ファイルが入るので、それを/usr/local/lib/chasen/dicの下に移動する。

mv unidic /usr/local/lib/chasen/dic

これで/usr/local/lib/chasen/dicの下にipadicとunidicが並ぶ格好になる。

ipadicを使いたい時は、

chasen -r /usr/local/lib/chasen/dic/ipadic/chasenrc

unidicを使いたい時は、

chasen -r /usr/local/lib/chasen/dic/unidic/chasenrc

とすればよい。