ユーザ用ツール

サイト用ツール


chainer2プログラミングの全体図

Chainerプログラミングの全体図

Chainer2でMNIST目次

Chainer2プログラミングの全体図

あくまで一例として記載させていただきます。

WEB上のMNISTのサンプルコードを読んでいると、Kerasだと皆ほぼ同じコードになるのに、Chainerだと人によってコードが結構異なる感じで、初心者には本当にとっつきにくいイメージでした。

Chainer 1.11.0から、Trainerというものが導入されたらしく、このサイトでは、Trainerを用いた記載方法のみ解説します。最初はIteratorとか意味不明な言葉が出てきて混乱しやすいですが、我慢して、Iterator、Dataset、Optimizer、Model、Updater、Extensionsを勉強していくしかありません。(Trainerを使用しないプログラミングができるレベルの人は、Trainerを理解してさっさと使われるのだと思われます。)

Trainerを利用する場合のChainer全体図

Trainerとは、Chainerで学習を行う際に使用すると便利なChainerのモジュールです。

いきなりTrainerと言われてもさっぱりだと思いますが、コードをコピペして1個ずつ理解するのみです!

Trainerの構造は、以下のようになっているらしいです。

(出典:Chainerビギナー向けチュートリアル Vol.1

私も最初にこの図を見たときは何がなんだかさっぱり分かりませんでしたが、この図をみながら、なんとなく、以下の全体図にざっと目を通して下さい。以後、具体的なコードを勉強するときに、『いま、全体図の中でどこのコードを書いているのか?』を把握しながら、Jupyter Notebookに自分の手でコードを写経して実行していくのがお勧めです。

●Chainer2プログラミングの流れ

# ---------- train.py ---------- #
(1)#1 Chainerを使用するためのimport文

(2)#2 データの準備・設定
from chainer import iterators
# trainerを利用するために、Iteratorを定義してdatasetにアクセスできるようにする

(3)#3 モデルの記述
class MyModel(Chain):
    def __init__(self):
       super(MyModel,self).__init__(
            # パラメータを含む関数の宣言
        )
    def __call__(self, ...):
    # モデルを記載

(4)#4 モデルと最適化アルゴリズムの設定
model = MyModel()
model = L.Classifier(model)
optimizer = optimizers.Adam()
optimizer.setup(model)

(5)#5 学習と結果の出力
# UpdaterにIteratorとOptimizerを渡す
from chainer import training
updater = training.StandardUpdater(train_iter, optimizer, device=gpu_id)
# TrainerにUpdaterを渡す
trainer = training.Trainer(updater, (max_epoch, 'epoch'), out='mnist_result')
# TrainerにExtensionを追加
from chainer.training import extensions
    # trainer.extend()で、学習の進行状況を表すプログレスバーや、lossのグラフ化と画像の保存などを行う
# 学習を実行
trainer.run()

(6)#6 学習結果のパラメータの保存
# Save paramaters
chainer.serializers.save_npz('my_mnist.model', model)

# ---------- predict.py ---------- #
(7)#7 推測
import numpy as np
import chainer import serializers
# Network definition
    # train.py と同じModelを定義
# modelをClassifier化し、train.pyでの学習結果のパラメータをloadする
model = L.Classifier(MLP(1000, 10))
serializers.load_npz('my_mnist.model' model)

# 推測したい画像を読みこんでNumpy配列に変換し、chainerのVariableに変換
# (詳細は後述)
x = chainer.Variable(image)
# chainer.links.Classifierのpredictorで推測
y = model.predictor(x)
predict = np.argmax(y.data)

print("predict:" , predict)

もう一度、Trainerの構造を、今度はテキストで記載。

Trainer
  |-Updater
      |-Iterator
          |-Dataset
      |-Optimizer
          |-Model
  |-Extensions 

Chainer2でMNISTのコード

以下にコードそのものを記載します。非常に長く取っつきにくいコードですが、次回以降、順に解説させていただきます。

なお、今回はMNISTのデータセットを、Chainerがあらかじめ用意したものを使って学習を行いますが、画像データからChainer用データセットに変換する方法については、Chainer2用自前データの準備をご覧下さい。(かなりややこしいので、最初は、以下のコードを写経してから、自前データの準備に進むのがお勧めです。)

train_mnist_mlp.py

Predict_mnist_mlp.py

次のページから、上記コードについて順番に解説していきます。

(1)Chainer2を使用するためのimport文

参考文献

https://qiita.com/abechi_17/items/b271b7042fae126616d7

Chainer 2.0 のMNISTサンプルで推論を動かす
abechi_17
2017年07月01日に投稿

Chainer 2.0 のMNISTサンプル(公式Document)
https://github.com/chainer/chainer/tree/v2.0.0/examples/mnist

Chainerの基本的な使い方

https://github.com/dsanno/deep-learning-study/blob/master/doc/chainer_basic.md

Trainerについては、以下のスライドが非常に参考になります。(といっても、私にはスライド内容の5%くらいしか理解できていない気がします、、、)

Chainer の Trainer 解説と NStepLSTM について
Published on Apr 11, 2017

https://www.slideshare.net/Retrieva_jp/chainer-trainer-nsteplstm

次節以降

MNISTを例に、一つずつ解説させていただきたいと思います。

いつもあまり面白くないMNISTですが、Chainer2プログラミングを理解する上で避けて通れないので、頑張ってやってみたいと思います。

リンク

chainer2プログラミングの全体図.txt · 最終更新: 2018/10/07 by 127.0.0.1

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki