スポンサーリンク

WindowsでMNISTデータの中身(gzファイルの中身)を見てみる(1)

機械学習で必ずといっていいほど最初に出てくるデータセット

● irisデータ(あやめのなんちゃらの数値データの塊)

● MNIST(手書き数字)

この、MNISTの本家サイトは以下

http://yann.lecun.com/exdb/mnist/

ここからダウンロードできる4つのファイルは、すべて、gz 形式となっており、ダウンロードしても、そのままでは、Windowsでは解凍することができない。

(1)本家サイトから、4つのgzファイルをダウンロード

(2)Windowsでgzファイルを解凍するためのソフトはいろいろあるらしいのだが、私はLhaplus

https://forest.watch.impress.co.jp/library/software/lhaplus/

をダウンロードしてインストールしてみた。

インストールファイルをダウンロードしてインストールして直後に出てくる以下の画面で、gz のチェックボックスをONにして、OK を押す。

(3)t10k-images-idx3-ubyte.gz をダブルクリック

t10k-images.idx3-ubyte という、さらにわけのわからない拡張子のファイルが展開された。

上記ダウンロードサイトに解説があるのだが、さっぱり分からない。

あ、これ以上は私には無理です。ごめんなさい。。。

あきらめる。

しばらくしたあと、以下のようなサイトを見つけたが、私には写経すらできなさそう。。。

(参考)

http://y-uti.hatenablog.jp/entry/2014/07/23/074845

https://qiita.com/kinmojr/items/4c7a003aa19f8dcf4c4f

https://qiita.com/jkkch/items/d4009fff1722a52be8dc

https://qiita.com/jkkch/items/d4009fff1722a52be8dc

(3) MNIST画像をPNG画像で出力する
Posted by user on 2013年10月5
https://nnet.dogrow.net/blog3/

→これなら僕にもできるかも?GNU-Octaveを使用するらしい。

Octaveといえば、CourseraのMachine Learningで、さわったことがあった!

http://twosquirrel.mints.ne.jp/?p=9063

そのときインストールした、Octave 4.0.3 を用いて、次回、上記サイトのコードを試してみたい!

AI,Python

Posted by twosquirrel