jubatusを試してみる

前々から気になっていて、社内でも話題に上がったので試用する。

随時追記していく。

Jubatusとは

Jubatus は以下の特徴を持ったオンライン機械学習向け分散処理フレームワークです。

http://jubat.us/ja/index.html

Jubatusのインストール

brewのtapを使ってインストールする。

2013/12/07現在Mac OSX用は試験的サポート段階。

$ brew tap jubatus/jubatus

$ brew install --HEAD pficommon

$ brew install jubatus

http://jubat.us/ja/quickstart.html#mac-os-x

途中developer toolsがないと言われたので素直に従う。

Warning: No developer tools installed.

You should install the Command Line Tools.

Run xcode-select --install to install them.

brew install --HEAD pficommonの段でmakeがこけた。

試行錯誤した結果、brewgccが4.2を使っていたのをbrew install gcc48して

brew install --HEAD pficommon --cc=gcc-4.8

brew install jubatus --enable-mecab --cc=gcc-4.8

としたら通った。(ついでにmecab使えるようにoptionつけた)

Jubatusクライアントのインストール

クライアントアプリケーションはC++, Python, Ruby または Javaで記述出来る。

今回はPythonクライアントを使う(Python 2.7移行が必要)

$sudo pip install jubatus

http://jubat.us/ja/quickstart.html#python

Classifierを試す

JubatusクライアントにはClassifier、Recommender、Regression、Graph、Stat、Anomaly、Nearnest_Neighbor、Clusteringの機能があるが、今回はClassifierを試してみる。

多値分類機能(Classifier)とは、入力データを複数グループに分類する機能であり、スパムメールの判定などに利用することができます。

Classifierのチュートリアルをやってみる。

http://jubat.us/ja/tutorial/classifier_python.html

追記(2014/01/10)

OSX10.9はnot supportになっていた。。

10.9 (Mavericks) is NOT supported due to c++ library issues.