Bag of ML Words

ML = Machine Learning, Music Love, and Miscellaneous things in daily Livings

moses on Cygwin/Windows

いまちょっと個人的にstatistical machine translationに興味があるので、とりあえずmosesをインストールして動かしてみよう!ってなった。

 

まずはありものの言語モデル等でmosesを動かすことが目標。

あと仕事じゃないので家のWIndows、すなわちCygwin環境での実行。

 

Cygwinインストール

まずは本家Cygwinからsetup.exeをダウンロードして使う。

cygwinのインストールは基本的にsetup.exe使うだけだけど、設定とかは

takuya-1st.hatenablog.jp

を参照しました。

lapack, boost, ssh emacs, zip, bzip, libtools, ncurses,wget,automake,zshなど思いつくものを全部入れる。

ターミナルから右クリックとかでメニューとか、Cygwinオワコンとかいう人もいるけど着実に便利になってるよね。

 

各種ツールやライブラリはgithubでとってくるから、

cygwin上でgithubをつかるようにするために

http:// https://github.com/NIFTYCloud-C4SA/support/wiki/%E3%82%B5%E3%83%9D%E3%83%BC%E3%83%88-GitHub%E3%81%AE%E5%A7%8B%E3%82%81%E6%96%B9(Cygwin%E7%B7%A8)

を実施します。

 

mosesと関連ライブラリ

mosesのインストールについては

が参考になりました。ただ、そのままでは通らないところもあったので

そこは試行錯誤。

 

まずはGIZA++はそのまま入りました。

SRILMはなぜかインストールがどうしても通らなかったので

IRSTLMだけインストールしています。

次のページ、boostはcygwinでパッケージされているのでパス。

 

mosesのインストールですが、

インストールコマンドは

./bjam -jX  (XはCPU数)

 だけでした。オプションつけると逆に動きません。

 

まずはテスト

この段階で欧米言語なら動くので、

d.hatena.ne.jp

にあるとおりにサンプルコードをダウンロードしてテスト。

Das ist eine klines haus. を翻訳する。

実行ディレクトリにnbest.txtというファイルができて、

f:id:Dr_KayAi:20160401221409p:plain

おお、ちゃんと並んでいる!

 

日本語もやりたい

のでMecabを次はインストールしよう.

試行錯誤の挙句、

ちらのうら - CygwinでMeCabインストール。

で配布してくれているパッチを当ててようやくmecabのインストールに成功。