python计算机视觉深度学习工具4图像分类数据集(机器学习常用数据集)
MNIST
图片.png
此数据集是正确分类手写数字,0-9。
MNIST(NIST:National Institute of Standards and Technology,M为modified), 数据经过预解决,以减轻计算机视觉的解决负担,该数据集专注于数字识别。训练集 (training set) 由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局 (the Census Bureau) 的工作人员.
此数据集是正确分类手写数字0-9。在许多情况下它是机器学习算法排名的标准。Geoffrey Hinton将数据集形容为”the drosophila of machine learning”。
MNIST本身包含60,000个训练图像和10,000个测试图像。每个特征向量是784-dim,对应于图像的28×28灰度像素强度。这些灰度像素强度是无符号整数,落在[0,255]范围内。
下载
wiki参考
Animals:狗,猫和熊猫
image.png
每种动物1000张,共有3000张图片。可以在我们的CPU或者GPU上快速训练深度学习模型并取得正当的精确性。
CIFAR-10
image.png
CIFAR-10由60,000 32323 (RGB)图像组成。
CIFAR-10由10类组成,包括:飞机,汽车,鸟,猫,鹿,狗,青蛙,马,船和卡车。
尽管很容易训练在MNIST上取得> 97%分类精度的模型,但在CIFAR-10(以及更大集CIFAR-100)很难取得这样的模型。
挑战来自于物体出现方式的巨大差异。
参考: https://www.cs.toronto.edu/~kriz/cifar.html
SMILES
image.png
SMILES数据集由面部图像组成,这些图像要么是微笑的,要么是不笑的,数据集中有13,165个灰度图像,每个图像大小64*64。数据集中的图像被紧紧地裁剪在脸部附近,允许我们设计机器学习算法专注于微笑识别。
Kaggle:Dogs vs. Cats
Dogs vs. Cats挑战是Kaggle比赛的一部分,旨在设计学习算法正确地将图像分类为包含狗或者猫。共提供了25,000张图片
使用不同的图像分辨率。
image.png
参考:https://www.kaggle.com/c/dogs-vs-cats/data
Flowers-17
image.png
Flowers-17数据集是17类别的数据集,每个类别有80个图像,由Nilsback等人策划。
Flowers-17为具备挑战性的数据集,由于规模大,视角,背景负责,变化的光照条件和类内变化。
参考:http://www.robots.ox.ac.uk/~vgg/data/flowers/17/
Flowers-17
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » python计算机视觉深度学习工具4图像分类数据集(机器学习常用数据集)