WindowsでMNISTデータの中身(gzファイルの中身)を見てみる(1)
機械学習で必ずといっていいほど最初に出てくるデータセット
● irisデータ(あやめのなんちゃらの数値データの塊)
● MNIST(手書き数字)
この、MNISTの本家サイトは以下
http://yann.lecun.com/exdb/mnist/
ここからダウンロードできる4つのファイルは、すべて、gz 形式となっており、ダウンロードしても、そのままでは、Windowsでは解凍することができない。
(1)本家サイトから、4つのgzファイルをダウンロード
(2)Windowsでgzファイルを解凍するためのソフトはいろいろあるらしいのだが、私はLhaplus
https://forest.watch.impress.co.jp/library/software/lhaplus/
をダウンロードしてインストールしてみた。
インストールファイルをダウンロードしてインストールして直後に出てくる以下の画面で、gz のチェックボックスをONにして、OK を押す。
(3)t10k-images-idx3-ubyte.gz をダブルクリック
t10k-images.idx3-ubyte という、さらにわけのわからない拡張子のファイルが展開された。
上記ダウンロードサイトに解説があるのだが、さっぱり分からない。
あ、これ以上は私には無理です。ごめんなさい。。。
あきらめる。
しばらくしたあと、以下のようなサイトを見つけたが、私には写経すらできなさそう。。。
(参考)
http://y-uti.hatenablog.jp/entry/2014/07/23/074845
https://qiita.com/kinmojr/items/4c7a003aa19f8dcf4c4f
https://qiita.com/jkkch/items/d4009fff1722a52be8dc
https://qiita.com/jkkch/items/d4009fff1722a52be8dc
(3) MNIST画像をPNG画像で出力する
Posted by user on 2013年10月5
https://nnet.dogrow.net/blog3/
→これなら僕にもできるかも?GNU-Octaveを使用するらしい。
Octaveといえば、CourseraのMachine Learningで、さわったことがあった!
http://twosquirrel.mints.ne.jp/?p=9063
そのときインストールした、Octave 4.0.3 を用いて、次回、上記サイトのコードを試してみたい!
ディスカッション
コメント一覧
まだ、コメントがありません