いまちょっと個人的にstatistical machine translationに興味があるので、とりあえずmosesをインストールして動かしてみよう!ってなった。
まずはありものの言語モデル等でmosesを動かすことが目標。
あと仕事じゃないので家のWIndows、すなわちCygwin環境での実行。
Cygwinインストール
まずは本家Cygwinからsetup.exeをダウンロードして使う。
cygwinのインストールは基本的にsetup.exe使うだけだけど、設定とかは
を参照しました。
lapack, boost, ssh emacs, zip, bzip, libtools, ncurses,wget,automake,zshなど思いつくものを全部入れる。
ターミナルから右クリックとかでメニューとか、Cygwinオワコンとかいう人もいるけど着実に便利になってるよね。
を実施します。
mosesと関連ライブラリ
mosesのインストールについては
が参考になりました。ただ、そのままでは通らないところもあったので
そこは試行錯誤。
まずはGIZA++はそのまま入りました。
SRILMはなぜかインストールがどうしても通らなかったので
IRSTLMだけインストールしています。
次のページ、boostはcygwinでパッケージされているのでパス。
mosesのインストールですが、
インストールコマンドは
./bjam -jX (XはCPU数)
だけでした。オプションつけると逆に動きません。
まずはテスト
この段階で欧米言語なら動くので、
にあるとおりにサンプルコードをダウンロードしてテスト。
Das ist eine klines haus. を翻訳する。
実行ディレクトリにnbest.txtというファイルができて、
おお、ちゃんと並んでいる!
日本語もやりたい
のでMecabを次はインストールしよう.
試行錯誤の挙句、
で配布してくれているパッチを当ててようやくmecabのインストールに成功。