Chainer:超簡単なAutoEncoderの脳の中を見てみよう

2017年 03月 11日

Irisデータで実験したAutoEncoderの、中間層（ノード数２）の中身は次のようになっていた。
各グラフが１回の実験を示し、９回実験したものを並べてみた。
もちろん同じデータで同じ条件で実験したのだが、こんなに違う。
目盛りも図毎にかなり異なる。
つまり、

同じデータを与え、ほとんど似た結果が出ても、中間層の状態は同じにはならない。

中間層は２ノードの層が１つあるだけ。この２つのノードのそれぞれをｘ軸、ｙ軸とし、Irisの種類にによって、RGBの３色で中間層のノードの値をプロットしてみた。
Irisの種類によって、偏りがあるのがわかる。
とくに、R(赤)は、G、Bとははっきり分かれている。

では、この図をどうやって作ったか、プログラムの説明をしよう。

今までは、学習し、評価し、それで終わりのプログラムであったが、今回は全データを学習に用い、中間層の中身を取り出して、その中間層の中身を返す関数にオートエンコーダの１回分の処理をまとめ、execonce() とした。

def execonce():
# Initialize model
model = MyAE()
optimizer = optimizers.SGD()
optimizer.setup(model)

# Learn
n = 150
for j in range(3000):
x = Variable(xtrain)
model.cleargrads()    # model.zerograds() は古い
loss = model(x)
loss.backward()
optimizer.update()

# get middle layer data
x = Variable(xtrain, volatile='on')
yt = F.sigmoid(model.l1(x))
ans = yt.data

return ans

学習が終わったところで、今度はmodelではなく、その中の中間層の値が決まる所まで実行し、中間層のノードが入っているdataだけを取り出して返す。これで、execonce()を呼ぶと、各入力データに対する中間層の２ノードの値がまとめて帰ってくる。

では、このexeconce() を直接実行してみよう。

>>> ans = execonce()
>>> ans.shape
(150, 2)
>>> ans[:5]
array([[ 0.99554908,  0.00865224],
[ 0.99200833,  0.01623198],
[ 0.99302506,  0.01248077],
[ 0.992621  ,  0.02188915],
[ 0.99591887,  0.00837815]], dtype=float32)
>>>

ちゃんとデータ数１５０個に対し、２つの値が求まっている。
これを、Irisの種類に応じて色分けして表示すると、何か分かるかも知れない。

ということで、最初に示した図が得られるのだが、そのあたりは次回説明しよう。

< 前の記事へ次の記事へ >

2025年1月22日

インターン体験記 2024！

#人事ブログ

Chainer:超簡単なAutoEncoderの脳の中を見てみよう

インターン体験記 2024！

＃人気の記事

＃タグ

＃アーカイブ