PyTorch 教程-在PyTorch中的CIFAR-10和CIFAR-100数据集
在前一个主题中,我们学习了如何使用无尽的数据集来识别数字图像。无尽数据集是深度学习的入门数据集,因为它的简单性。无尽数据集是深度学习的“Hello World”。
CIFAR-10(加拿大高级研究所) 将更难分类,并且将带来新的障碍,我们需要克服这些障碍。它是一组通常用于训练机器学习和计算机视觉算法的图像集合。CIFAR-10数据集包含50000个训练图像和10000个验证图像,使得这些图像可以在10个不同的类别之间进行分类。
CIFAR-10数据集包含60000张30x30像素的彩色图像,分为10个类别,每个类别有6000张图像。该数据集分为一个测试批次和五个训练批次,每个批次包含10000张图像。在测试批次中,有1000张图像,这些图像是从每个类别中随机选择的。训练批次包含以随机顺序排列的其余图像。一些训练批次可能包含来自一个类别的图像比另一个类别的图像更多。
这些类别将是完全互斥的,例如汽车和卡车之间不会有重叠。汽车类别包括类似轿车和SUV的物体。卡车类别仅包括大卡车,不包括皮卡。与MNIST数据集相反,这些类别内的对象在性质上更加复杂且极其丰富。通过查看CIFAR数据集,我们意识到鸟类和猫类不仅仅包括一种类型。鸟类和猫类包含许多不同类型的鸟和猫,它们在大小、颜色、放大倍数、不同角度和不同姿势上都有所不同。
与无尽数据集不同,尽管有许多方法可以书写数字1和数字2,但它们并不那么多样化,并且无尽数据集是灰度标量。CIFAR数据集包含更大的32x32彩色图像,每个图像有三个不同的颜色通道。现在我们面临的最大问题是,表现良好的LeNet模型是否足以对CIFAR数据集进行分类?
CIFAR-100数据集
它与CIFAR-10数据集类似,唯一的区别在于它有100个类别,每个类别包含600个图像。每个类别有100个测试图像和500个训练图像。这100个类别被分成20个超类别,每个图像都带有一个“粗”标签(它所属的超类别)和一个“细”标签(它所属的类别)。
CIFAR-100数据集中有以下类别:
序号 | 超类别 | 类别 |
---|---|---|
1. | 水生哺乳动物 | 海狸,海豚,水獭,海豹,鲸鱼 |
2. | 花卉 | 兰花,罂粟花,玫瑰,向日葵,郁金香 |
3. | 鱼类 | 水族馆鱼,比目鱼,鳐鱼,鲨鱼,鳟鱼 |
4. | 食品容器 | 瓶子,碗,罐头,杯子,盘子 |
5. | 家用电器 | 时钟,计算机键盘,灯,电话,电视 |
6. | 水果和蔬菜 | 苹果,蘑菇,橙子,梨,甜椒 |
7. | 家具 | 床,椅子,沙发,桌子,衣柜 |
8. | 大型食肉动物 | 熊,豹,狮子,老虎,狼 |
9. | 昆虫 鳝鱼、甲壳虫、蝴蝶、毛虫、蟑螂 | |
10. | 大型人造户外物品 | 桥,城堡,房子,道路,摩天大楼 |
11. | 大型自然户外场景 | 云,森林,山脉,平原,海 |
12. | 中型哺乳动物 | 狐狸,箭猪,负鼠,浣熊,臭鼬 |
13. | 大型杂食性和食草动物 | 骆驼,牛,黑猩猩,大象,袋鼠 |
14. | 非昆虫无脊椎动物 | 螃蟹,龙虾,蜗牛,蜘蛛,虫子 |
15. | 爬行动物 | 鳄鱼,恐龙,蜥蜴,蛇,龟 |
16. | 人类 | 婴儿,男孩,女孩,男人,女人 |
17. | 树木 | 枫树,橡树,棕榈树,松树,柳树 |
18. | 小型哺乳动物 | 仓鼠,老鼠,兔子,鼩鼱,松鼠 |
19. | 交通工具1 | 自行车,公共汽车,摩托车,皮卡,火车 |
20. | 交通工具2 | 割草机,火箭,有轨电车,坦克,拖拉机 |