Pythonで書けるDeepLearningのライブラリを比較してみた - のんびりしているエンジニアの日記

皆さんこんにちは
お元気ですか。私は元気です。

ChainerのAdvent Calendar第16日目です。
DeepLearningのライブラリの比較を行ってみました。

日本製PFIが開発したライブラリ。個人的には書きやすくて結構好き。
時系列ニューラルネットワークが組みやすいことを売りにしている。

Googleが公開したことで、評判のライブラリ。
やたらとニュースになるほど凄かったが、果たして他とくらべてどうなのか。

Theanoを基盤として書きやすくしたライブラリ
Kaggleで使っている人が多いとかなんとか・・・、
因みに私が見る限り、Kaggleで使っている人は、nolearnを使って書いている人が多いですね。

f:id:tereka:20151216002150p:plain

個人的には豊富なExampleと書きやすいのが嬉しいところ。
cupyを使えばnumpy likeにGPUコードを書くことができる。
日本の開発者が活発で、様々なModelのExampleがgithubに公開されている。

＜要望＞
①個人的にはscikit-learnっぽくかけるとありがたいです。
②chainer1.5から__call__を使用して書けるようになったのですが、予測したいときはどのメソッドを呼び出して、学習したい時はどうすればよいのかがまだわかっていない（多分私だけ）。

個人的にこのライブラリが現状そこまで良いと思えないが、今後、高速に発展していくと思われる。
見やすい可視化機能とシンボル型の記述で、自動微分が不要なところが拡張性があって良いと思う。また、google直々に使われている機械学習のwrapperを記載しており、商業的には高速で発展する勢いがある。

とりあえず、可視化もいいですが、流石に遅いので、高速化してください。

シンボル型の記述で、自動微分が不要なところが拡張性があって良いと思う。
古くからあるので、研究者間では使われているのでしょうか。
因みに学生時代は私もTheanoでDeep Learningの基礎を学びました。

因みに多くのKaggleのサンプルコードには、Lasagneで書かれている内容がある。

せっかくなので、速度に関することは実験してみました。

以下の3層ネットワークを構築し、速度を比較してみました。（データはMNIST先生）

急ピッチだったのでExcelで仕上げました。これぐらいだと楽です。

f:id:tereka:20151215234020p:plain

f:id:tereka:20151215233549p:plain

CPUだけのTensorFlowは速いけれども、GPU実行した途端、他のライブラリより遅くなってる。噂には聞いていましたが、正直、これには驚きです。（どうしてそうなった。）
ChainerのCPU何かあるのかな…。学習すればするほど、一回の学習時間が遅くなっていってるのですが。
基本的にLasagneとChainerだと、GPUベースだとどっちを使っても良いと思います。
tensorflowのCPUは比較的高速で、chainerは遅かった。tensorflowだけ8threadで動作しているだけかもしれませんが。。。。

Chainerのcupyによる拡張と書きやすさ。個人的にはこれが気に入っています。
レイヤーをコンストラクタとして、与えて、学習ができれば更に使い勝手がよくなると思います。
（イメージとしてはscikit-learnでしょうか。）