经典的数据集汇总
| 名称 | 训练集 | 测试集 | 说明 | |
| MNIST手写体数据集 | 60000张 | 10000张 | 10个类别,每张图片28*28 | 单标签、多分类 |
| IMDB电影评论数据集 |
25000条评论 50%正 50%负 |
25000条评论 50%正 50%负 |
二分类 | |
| 路透社数据集 | 8982个样本 | 2246个样本 |
46个不同的新闻主题,训练集中每个主题都有至少10个样本 每个样本都是一个整数列表 |
单标签、多分类 |
| 波士顿房价数据集 | 404条 | 102条 | 506条样本,每个样本有13个特征,特征的取值范围可能不一样 | 回归 |
|
猫狗图像数据集 2013年kaggle比赛 |
自定义 | 自定义 |
12500张猫 12500张狗 |
CNN |
| ImageNet数据集 |
140万张标记图像, 1000个不同种类,包含许多动物类别,其中包含不同种类的猫和狗 |
CNN | ||
| Glove词嵌入 400000个单词的100维嵌入向量 | LSTM、RNN | |||
| 耶拿天气数据集 | 每10分钟记录14个不同的量(比如气温、气压、湿度、风向等) |
LSTM 温度预测 |
||
| CelebA名人人脸数据集 | 超过20万张名人肖像 | VAE | ||
| CIFAR10数据集 | 50000张32*32的RGB图像,有10个类别,每个类别5000张图像 | GAN | ||
浙公网安备 33010602011771号