ニューラルネットワーク(最近は主にGAN)について絶賛勉強中ではありますが、実際に書いてみるといろんなデータセットを使うことになります。 今回はその中でもCIFAR-10についての覚書です。
参考にしたのはこちら。
CIFAR-10
内容
約6万枚のラベル付きデータとなっており、10種類の画像から構成される。
ダウンロードサイト
CIFAR-10 and CIFAR-100 datasets
構成
python versionを解答すると、下記のような構成になっている
- readme.html
- batches.meta ラベル名のリスト
- data_batch_1 教師データ1
- data_batch_2 教師データ2
- data_batch_3 教師データ3
- data_batch_4 教師データ4
- data_batch_5 教師データ5
- test_batch テストデータ
画像
データセット
- airplane
- automobile
- bird
- cat
- deer
- dog
- frog
- horse
- ship
- truck
サイズ
32 × 32
使い方
読み込み
dict形式で読み込まれる。