K12全学段多学科题库数据集:覆盖小学初中高中10个学科4599道题目完整数据,包含题目内容标准答案详细解析知识点标注及1517个图片文件资源,适用于智能教育系统开发AI模型训练题库建设个性化学习推荐等应用场景
参考数据:K12数据集
引言与背景
K12题库数据集是一个面向基础教育阶段的综合性题库资源,涵盖了小学、初中、高中三个学段的主要学科,共计包含4599道高质量的题目。该数据集对于教育技术研究、智能教学系统开发、自然语言处理模型训练以及教育数据分析具有重要的应用价值。
数据集包含了完整的题目元数据、原始题目内容、标准答案、详细解析、知识点标注等丰富信息。其中,部分题目还包含了图片资源,这些图片文件与题目内容一一对应,为理解题目提供了重要的视觉辅助。数据集的完整性和多样性使其成为教育AI领域研究和应用开发的宝贵资源。
在科研应用方面,该数据集可用于训练和评估智能问答系统、自动解题模型、知识点推荐算法等。在产业应用方面,数据集可支撑在线教育平台的题库建设、个性化学习推荐系统、智能批改系统等产品的开发。算法的训练和应用需要大规模、高质量的标注数据,而本数据集正是满足这一需求的优质资源。
数据基本信息
数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---|---|---|---|---|
| subjectName | 字符串 | 学科名称 | 语文、数学、英语、物理... | 100.0% |
| _id | 字符串 | 题目唯一标识符 | 71c7d734b9e740e09965eee85b291f04... | 100.0% |
| logicQuesTypeName | 字符串 | 题目类型 | 解答、单选、填空、判断... | 100.0% |
| question | 字符串 | 题目内容 | 学校图书馆那丰富的图书又像磁石一样吸引着我。(缩句)... | 100.0% |
| difficulty | 整数 | 题目难度 | 1-5,数值越大难度越高... | 100.0% |
| gradeGroupName | 字符串 | 学段名称 | 小学、初中、高中... | 100.0% |
| subjectId | 字符串 | 学科ID | 1、2、3、4... | 100.0% |
| is_img | 整数 | 是否包含图片 | 0表示无图片,1表示有图片... | 100.0% |
| answer | 字符串 | 标准答案 | 图书吸引着我。... | 100.0% |
| Analysis | 字符串 | 题目解析 | 本题考查缩句。缩句是汉语语法中的一种常见操作...... | 100.0% |
| gradeGroupId | 字符串 | 学段ID | 1表示小学,2表示初中,3表示高中... | 100.0% |
| knowledge | 数组 | 知识点标签 | ["句", "基础知识"]... | 95.7% |
| options | 字符串 | 选择题选项 | A:①②③ | |
| B:③④① | ||||
| C:①③④... | 43.9% |
数据分布情况
学科分布
| 学科名称 | 记录数量 | 占比 | 累计占比 |
|---|---|---|---|
| 数学 | 600 | 13.05% | 13.05% |
| 英语 | 600 | 13.05% | 26.09% |
| 语文 | 599 | 13.02% | 39.12% |
| 化学 | 400 | 8.70% | 47.81% |
| 历史 | 400 | 8.70% | 56.51% |
| 地理 | 400 | 8.70% | 65.21% |
| 政治 | 400 | 8.70% | 73.91% |
| 物理 | 400 | 8.70% | 82.60% |
| 生物 | 400 | 8.70% | 91.30% |
| 科学 | 400 | 8.70% | 100.00% |
学段分布
| 学段名称 | 记录数量 | 占比 | 累计占比 |
|---|---|---|---|
| 初中 | 2000 | 43.49% | 43.49% |
| 高中 | 1799 | 39.12% | 82.60% |
| 小学 | 800 | 17.40% | 100.00% |
题型分布
| 题型名称 | 记录数量 | 占比 |
|---|---|---|
| 解答 | 1934 | 42.05% |
| 单选 | 1905 | 41.42% |
| 填空 | 645 | 14.02% |
| 判断 | 86 | 1.87% |
| 多选 | 15 | 0.33% |
| 多选多 | 7 | 0.15% |
| 完形填空 | 6 | 0.13% |
| 连词成句 | 1 | 0.02% |
难度分布
| 难度等级 | 记录数量 | 占比 |
|---|---|---|
| 1 | 473 | 10.28% |
| 2 | 1504 | 32.70% |
| 3 | 2321 | 50.47% |
| 4 | 262 | 5.70% |
| 5 | 39 | 0.85% |
图片分布
| 是否含图片 | 记录数量 | 占比 |
|---|---|---|
| 有图片 | 1517 | 32.99% |
| 无图片 | 3082 | 67.01% |
数据规模与类型
数据集共包含4599道题目,覆盖10个学科,3个学段,8种题型。数据格式为JSON Lines(每行一个JSON对象),便于逐行读取和处理。数据集还包含1517道带图片的题目,对应1517个图片文件(PNG和JPG格式),图片文件存储在独立的image目录中,通过题目中的is_img字段和图片路径可以建立对应关系。所有题目均包含完整的题目内容、标准答案和详细解析,2019道题目包含选择题选项。所有题目均标注了知识点标签,共出现31653次知识点标注,涵盖4331个不同的知识点标签。
数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---|---|---|
| 完整原始文件 | 数据集包含1517个图片文件,与题目一一对应,图片格式为PNG和JPG | 支持基于图像的题目理解、OCR识别、图文混排题目处理等应用 |
| 高质量标注信息 | 所有题目均包含标准答案和详细解析,4599道题目有完整解析,每道题目标注了知识点标签 | 可用于监督学习、知识图谱构建、智能推荐系统训练 |
| 多学段全覆盖 | 覆盖小学、初中、高中三个学段,10个主要学科 | 支持跨学段知识体系研究、个性化学习路径推荐 |
| 题型多样性 | 包含8种题型,涵盖选择题、填空题、解答题等 | 支持多种题型的自动批改、智能组卷、题目难度评估 |
| 难度标注完整 | 所有题目标注了1-5级难度,难度分布均匀 | 支持个性化推荐、自适应学习系统开发 |
| 数据规模适中 | 共4599道题目,数据量适中便于快速实验和验证 | 适合算法原型开发、模型快速迭代、教育资源有限的研究团队 |
数据样例
说明:由于数据集包含完整的图片文件,部分题目的图片无法在文章中直接展示。实际数据集中,所有标注为is_img=1的题目都包含对应的图片文件,图片文件路径可通过题目中的图片引用获取。以下展示的是元数据样例,涵盖了不同学科、学段、题型的多样性特征。
元数据样例
样例 1
{
"_id": "dca9938bc7f241df8323394e29754257",
"question": "常用于测量液体体积的仪器是( )\n",
"answer": "A",
"Analysis": "A选项:量筒用于量取液体的体积,故正确;\nB选项:试管可以用作少量液体的反应器,不能用来测量液体体积,故错误;\nC选项:烧杯可以用作大量液体的反应器,溶解稀释液体,一般不用来测量液体体积,故错误;\nD选项:水槽用于排水法收集气体,不能用来测量液体体积,故错误;\n故选A。\n",
"options": "A:量筒\n\nB:试管\n\nC:烧杯\n\nD:水槽\n",
"logicQuesTypeName": "单选",
"subjectId": "5",
"is_img": 0,
"difficulty": 1,
"gradeGroupId": "2",
"gradeGroupName": "初中",
"subjectName": "化学",
"knowledge": [
"希望学精品题",
"量筒的使用及误差分析",
"实验常用的仪器",
"常见仪器的使用注意事项",
"科学探究",
"学习基本的实验技能"
]
}
样例 2
{
"_id": "410fe40216e94f33904b9b820b05ee35_1_1",
"question": "某小组同学对生活中水展开了项目式学习探究。\n\n【项目一】:探究自来水的生产过程\n\n如图1是自来水的生产过程。据图回答:\n\n<img alt=\"\" height=\"131\" src=\"image/ed6cc07a-acfe-4041-9ea3-58cdd07730ae.png\" width=\"367\" />\n\n该过程中没有使用的净水方法是 ___ ___ 。(填字母序号)\n",
"answer": "A\nB",
"Analysis": "自来水的生产过程使用的净水方法有沉淀、过滤、吸附和消毒等,没有蒸馏,则该过程中使用的净水方法有AB。\n",
"options": "A:沉淀\n\nB:过滤\n\nC:蒸馏\n",
"logicQuesTypeName": "多选",
"subjectId": "5",
"is_img": 1,
"difficulty": 3,
"gradeGroupId": "2",
"gradeGroupName": "初中",
"subjectName": "化学",
"knowledge": []
}
样例 3
{
"_id": "410fe40216e94f33904b9b820b05ee35_1_3",
"question": "某小组同学对生活中水展开了项目式学习探究。\n\n【项目一】:探究自来水的生产过程\n\n如图1是自来水的生产过程。据图回答:\n\n<img alt=\"\" height=\"131\" src=\"image/ed6cc07a-acfe-4041-9ea3-58cdd07730ae.png\" width=\"367\" />\n\n在净水时,可用明矾作混凝剂沉降小颗粒不溶性杂质,其化学式为 $$\\text{KAl}{{\\left( \\text{S}{{\\text{O}}_4} \\right)}_{n}}\\cdot 12{{\\text{H}}_2}\\text{O}$$,$$n$$ 的值为 ___ ___ 。\n",
"answer": "$$2$$",
"Analysis": "在 $$\\text{KAl}{{(\\text{S}{{\\text{O}}_4})}_{n}}\\cdot 12{{\\text{H}}_2}\\text{O}$$ 中,钾元素显 $$+1$$ 价,铝元素显 $$+3$$ 价,硫酸根显 $$-2$$ 价,根据化合物中正负化合价的代数和为零可得 $$+1+(+3)+(-2)\\times n=0$$,则 $$n=2$$。\n",
"options": "",
"logicQuesTypeName": "填空",
"subjectId": "5",
"is_img": 1,
"difficulty": 3,
"gradeGroupId": "2",
"gradeGroupName": "初中",
"subjectName": "化学",
"knowledge": []
}
样例 4
{
"_id": "410fe40216e94f33904b9b820b05ee35_2",
"question": "某小组同学对生活中水展开了项目式学习探究。\n\n【项目一】:探究自来水的生产过程\n\n【项目二】:认识水的蒸发\n\n图2反映烧杯内的水在不同温度下汽化时发生变化的微观示意图,请将 $$50{}^\\circ \\text{C}$$ 时相同空间内对应的微观示意图补充完整 ___ ___ (图中“●”表示氧原子,“○”表示氢原子)。\n\n<img alt=\"\" height=\"123\" src=\"image/6952c17e-2354-44fc-a8aa-1e15d6778021.png\" width=\"257\" />\n",
"answer": "<img alt=\"\" height=\"77\" src=\"/data/new_tk/images/new_img/2_5/image_15/e4d0fe4c-3c18-4c31-87e3-2bb45c3c6486.png\" width=\"85\" />\n",
"Analysis": "温度越高,分子之间的间隔越大,分子热运动越快,蒸发越快,空气中的水分子更多,因此,与 $$20{}^\\circ \\text{C}$$ 时对应的微观示意图相比,$$50{}^\\circ \\text{C}$$ 时相同空间内对应的微观示意图为:<img alt=\"\" height=\"77\" src=\"/data/new_tk/images/new_img/2_5/image_6/e4d0fe4c-3c18-4c31-87e3-2bb45c3c6486.png\" width=\"85\" />。\n",
"options": "",
"logicQuesTypeName": "解答",
"subjectId": "5",
"is_img": 1,
"difficulty": 3,
"gradeGroupId": "2",
"gradeGroupName": "初中",
"subjectName": "化学",
"knowledge": [
"物质组成的表示",
"由水分解判断元素组成",
"化合价",
"增进对科学探究的理解",
"身边的化学物质",
"水与常见的溶液",
"科学探究的基本方法和环节",
"希望学精品题",
"水",
"水的组成",
"试题类型",
"科学探究与创新意识",
"科学探究",
"微观粒子特征的实际应用及影响因素",
"微观粒子特征的模型表示",
"水的净化",
"电解水实验的现象、结论及注意事项",
"物质的化学变化",
"物质构成的奥秘",
"影响化学反应速率的因素",
"微观粒子的特征",
"求某元素/原子团的化合价",
"自来水厂的净水流程和净水常用的方法",
"实验方案设计",
"微粒构成物质",
"素养"
]
}
样例 5
{
"_id": "410fe40216e94f33904b9b820b05ee35_4",
"question": "某小组同学对生活中水展开了项目式学习探究。\n\n【项目一】:探究自来水的生产过程\n\n【项目四】探究影响电解水速率的因素\n\n以收集 $$20\\ \\text{mL}$$ 氢气为标准,记录时间和收集氧气的体积,实验数据如下表:\n\n<table align=\"center\" border=\"1\" cellpadding=\"0\" cellspacing=\"0\" style=\"width:515px\">\n\t<tbody>\n\t\t<tr>\n\t\t\t<td style=\"text-align:center\"> </td>\n\t\t\t<td>\n\t\t\t温度 $$/{}^\\circ \\text{C}$$\n</td>\n\t\t\t<td>\n\t\t\t外加电压 $$/\\text{V}$$\n</td>\n\t\t\t<td>\n\t\t\t氧气 $$/\\text{mL}$$\n</td>\n\t\t\t<td>\n\t\t\t时间 $$/\\text{s}$$\n</td>\n\t\t</tr>\n\t\t<tr>\n\t\t\t<td>\n\t\t\t①\n</td>\n\t\t\t<td>\n\t\t\t$$15$$\n</td>\n\t\t\t<td>\n\t\t\t$$6$$\n</td>\n\t\t\t<td>\n\t\t\t$$9.9$$\n</td>\n\t\t\t<td>\n\t\t\t$$54.6$$\n</td>\n\t\t</tr>\n\t\t<tr>\n\t\t\t<td>\n\t\t\t②\n</td>\n\t\t\t<td>\n\t\t\t$$15$$\n</td>\n\t\t\t<td>\n\t\t\t$$9$$\n</td>\n\t\t\t<td>\n\t\t\t$$10.0$$\n</td>\n\t\t\t<td>\n\t\t\t$$23.4$$\n</td>\n\t\t</tr>\n\t\t<tr>\n\t\t\t<td>\n\t\t\t③\n</td>\n\t\t\t<td>\n\t\t\t$$15$$\n</td>\n\t\t\t<td>\n\t\t\t$$12$$\n</td>\n\t\t\t<td>\n\t\t\t$$9.0$$\n</td>\n\t\t\t<td>\n\t\t\t$$15.0$$\n</td>\n\t\t</tr>\n\t\t<tr>\n\t\t\t<td>\n\t\t\t④\n</td>\n\t\t\t<td>\n\t\t\t$$30$$\n</td>\n\t\t\t<td>\n\t\t\t$$6$$\n</td>\n\t\t\t<td>\n\t\t\t$$9.6$$\n</td>\n\t\t\t<td>\n\t\t\t$$46.2$$\n</td>\n\t\t</tr>\n\t</tbody>\n</table>\n实验①②③可探究 ___ ___ 对电解水速率的影响,欲探究温度对电解水速率的影响,应选择的实验组是 ___ ___ (填实验序号).根据表中数据得出电解的最佳温度和电压是 ___ ___ .\n",
"answer": "外加电压\n①④\n$$30{}^\\circ \\text{C}$$、$$12\\ \\text{V}$$",
"Analysis": "根据表中数据可知,实验①②③温度相同,外加电压的大小不同,则实验①②③可探究外加电压对电解水速率的影响,欲探究温度对电解水速率的影响,其他条件相同,温度不同,则应选择的实验组是①④;根据实验①②③可知,温度相同,外加电压越大,收集等体积的气体所需时间越短,反应速率越快,根据实验①④可知,外加电压相同,温度越高,收集等体积的气体所需时间越短,反应速率越快,故根据表中数据得出的结论是温度越高,外加电压越大,电解水的速率越快,根据表中数据得出电解的最佳温度和电压是 $$30{}^\\circ \\text{C}$$、$$12\\ \\text{V}$$。\n",
"options": "",
"logicQuesTypeName": "填空",
"subjectId": "5",
"is_img": 0,
"difficulty": 3,
"gradeGroupId": "2",
"gradeGroupName": "初中",
"subjectName": "化学",
"knowledge": [
"物质组成的表示",
"由水分解判断元素组成",
"化合价",
"增进对科学探究的理解",
"身边的化学物质",
"水与常见的溶液",
"科学探究的基本方法和环节",
"希望学精品题",
"水",
"水的组成",
"试题类型",
"科学探究与创新意识",
"科学探究",
"微观粒子特征的实际应用及影响因素",
"微观粒子特征的模型表示",
"水的净化",
"电解水实验的现象、结论及注意事项",
"物质的化学变化",
"物质构成的奥秘",
"影响化学反应速率的因素",
"微观粒子的特征",
"求某元素/原子团的化合价",
"自来水厂的净水流程和净水常用的方法",
"实验方案设计",
"微粒构成物质",
"素养"
]
}
样例 6
{
"_id": "c2f8c7c97e7b475cb941283c580348eb",
"question": "用如图所示装置及药品进行实验,能达到对应实验目的的是( )\n\n<table align=\"center\" border=\"1\" cellpadding=\"0\" cellspacing=\"0\" style=\"width:515px\">\n\t<tbody>\n\t\t<tr>\n\t\t\t<td>\n\t\t\t<img alt=\"\" height=\"82\" src=\"image/584c51a3-9c63-4147-a3e3-7558c1ff0e40.png\" width=\"42\" />\n</td>\n\t\t\t<td>\n\t\t\t<img alt=\"\" height=\"84\" src=\"image/ca4c9d3a-ea11-4150-bed4-84f62f095442.png\" width=\"154\" />\n</td>\n\t\t\t<td>\n\t\t\t<img alt=\"\" height=\"98\" src=\"image/8d10b6a6-c8af-4550-8845-40f0bd1e9ba2.png\" width=\"99\" />\n</td>\n\t\t\t<td>\n\t\t\t<img alt=\"\" height=\"96\" src=\"image/031d9b8b-7fdd-4b72-897b-eb986ac621f3.png\" width=\"83\" />\n</td>\n\t\t</tr>\n\t\t<tr>\n\t\t\t<td>\n\t\t\tA收集氧气\n</td>\n\t\t\t<td>\n\t\t\tB证明二氧化锰是该反应的催化剂\n</td>\n\t\t\t<td>\n\t\t\tC监控 $${{\\text{O}}_2}$$ 流速\n</td>\n\t\t\t<td>\n\t\t\tD验证蜡烛燃烧生成水\n</td>\n\t\t</tr>\n\t</tbody>\n</table>",
"answer": "D",
"Analysis": "A选项:氧气密度比空气大,应用向上排空气法收集,该选项不能达到实验目的;\nB选项:催化剂是指能改变反应速率,但反应前后质量和化学性质不变,该实验只能证明二氧化锰能改变过氧化氢的分解速率,但不能证明反应前后质量和化学性质不变,该选项不能达到实验目的;\nC选项:氧气不易溶于水,若想监控氧气的流速,则应将氧气直接通入水中,即氧气从长管通入,该选项不能达到实验目的;\nD选项:干冷烧杯内壁有水雾,则说明蜡烛燃烧生成水,该选项能达到实验目的。\n故选D。\n",
"options": "A:A\n\nB:B\n\nC:C\n\nD:D\n",
"logicQuesTypeName": "单选",
"subjectId": "5",
"is_img": 1,
"difficulty": 2,
"gradeGroupId": "2",
"gradeGroupName": "初中",
"subjectName": "化学",
"knowledge": [
"科学探究的基本方法和环节",
"希望学精品题",
"增进对科学探究的理解",
"实验方案设计",
"科学探究"
]
}
样例 7
{
"_id": "5820dc5aa9cc4397a372328d1144b1ae_5",
"question": "$$2023$$ 年 $$10$$ 月 $$31$$ 日,神舟十六号载人飞船回收舱顺利返回,航天员在中国空间站完成各项任务,因此,保障航天员的氧气需求至关重要。那么,空间站的氧气从哪里来?\n\nⅠ.从地球带上去\n\n空间站是一个相对封闭的场所,解决“气体从哪里来”的问题必然伴生着“气体往哪里去”的问题。为此,科学家设计了生物再生生命保障系统,实现了“水—氧—碳”的循环转化。下列叙述正确的是(填序号) ___ ___ 。\n",
"answer": "A\nB\nC",
"Analysis": "A选项:“水 $$-$$ 氧 $$-$$ 碳”的循环转化,不需要携带大量氧气,减少了氧气的携带量,减轻了火箭和飞船的载重,该选项叙述正确;\nB选项:生物再生生命保障系统中不需要氢气,系统需要对氢气进行转化,该选项叙述正确;\nC选项:人体代谢产物中的水,设计系统时应考虑这部分水的净化,该选项叙述正确。\n故选ABC。\n",
"options": "A:“水—氧—碳”的循环转化,减少了氧气的携带量,减轻了火箭和飞船的载重\n\nB:电解水在产生氧气的同时产生氢气,系统需要对氢气进行转化\n\nC:人体代谢产物中含有大量的水,设计系统时应考虑这部分水的净化\n",
"logicQuesTypeName": "多选",
"subjectId": "5",
"is_img": 0,
"difficulty": 3,
"gradeGroupId": "2",
"gradeGroupName": "初中",
"subjectName": "化学",
"knowledge": [
"我们周围的空气",
"空气",
"身边的化学物质",
"水与常见的溶液",
"希望学精品题",
"空气的成分与各成分体积分数",
"氧气",
"水",
"水的组成",
"试题类型",
"微观粒子特征的实际应用及影响因素",
"工业制取氧气",
"电解水实验的现象、结论及注意事项",
"检验气体是否为氧气",
"物质构成的奥秘",
"氧气的性质和用途",
"微观粒子的特征",
"氧气的制取实验",
"自然界中的氧循环和碳循环、氮循环",
"氧气的物理性质",
"氮气",
"微粒构成物质"
]
}
样例 8
{
"_id": "d5fa351e2ee0423989f4e69f9f71d79f",
"question": "关注实验安全,规范实验操作下列相关说法不正确的是\n<table border=\"1\" name=\"optionsTable\" style=\"width:100%;table-layout:fixed;\" cols=\"1\"><tr><td>A.酒精洒落在实验台燃烧起来,应立刻用水浇灭</td></tr><tr><td>B.加热高锰酸钾制氧气时,试管口放一团棉花,可防止加热时粉末状物质进入导管</td></tr><tr><td>C.在实验室泡蔗糖水喝</td></tr><tr><td>D.实验室要正确使用火源,并束好长发,系紧宽松衣物</td></tr></table>",
"answer": "AC\n",
"Analysis": "\n【详解】\nA、不慎碰倒酒精灯,不要惊慌,应立即用湿抹布盖灭,不可用水浇灭,故说法错误;\nB、高锰酸钾制取氧气实验中,试管口放一团棉花可防止加热时试管内的粉末状物质进入导管,故说法正确;\nC、实验室中的蔗糖不能泡水喝,实验室中任何药品不能品尝,故说法错误;\nD、要正确使用酒精灯,并束好长发、系紧宽松衣物,以免引起火灾,故说法正确。\n故选AC。\n",
"options": "",
"logicQuesTypeName": "解答",
"subjectId": "5",
"is_img": 0,
"difficulty": 1,
"gradeGroupId": "2",
"gradeGroupName": "初中",
"subjectName": "化学",
"knowledge": [
"基本实验操作",
"实验室制取氧气的方法",
"我们周围的空气",
"实验与安全",
"氧气的制取实验",
"氧气",
"物质的加热",
"酒精灯的使用方法和注意事项",
"身边的化学物质",
"化学实验安全规则",
"科学探究",
"学习基本的实验技能"
]
}
样例 9
{
"_id": "9b9379a6f85d438b925ad5ff5b6e6f0d",
"question": "陈旭麓在《近代中国社会的新陈代谢》中提到:“1840年,在炮口的逼迫下,中国蹒跚地走入近代。随后的一百余年里,驱使中国社会脱出常轨,改道变形。”这场“炮口的逼迫下”的历史事件( )\n<table border=\"1\" name=\"optionsTable\" style=\"width:100%;table-layout:fixed;\" cols=\"2\"><tr><td>A.推翻了中国封建专制制度</td><td>B.成为中国近代化的开端</td></tr><tr><td>C.使中国开始沦为半殖民地半封建社会</td><td>D.标志着洋务运动的破产</td></tr></table>",
"answer": "C\n",
"Analysis": "\n【详解】\n依据题干“1840年,在炮口的逼迫下,中国蹒跚地走入近代。随后的一百余年里,驱使中国社会脱出常轨,改道变形”,结合所学知识可知,1840年鸦片战争爆发,鸦片战争后西方列强的侵略打断了中国社会的正常发展进程,中国由主权独立、领土完整的封建国家转变为半殖民地半封建社会,逐步半殖民地半封建化,社会性质发生了根本变化,C项正确;辛亥革命清帝退位,推翻了中国封建专制制度,排除A项;洋务运动是中国近代化的开端,排除B项;甲午中日战争中北洋水师全军覆没,标志着洋务运动的破产,排除D项。故选C项。\n",
"options": "",
"logicQuesTypeName": "解答",
"subjectId": "8",
"is_img": 0,
"difficulty": 2,
"gradeGroupId": "2",
"gradeGroupName": "初中",
"subjectName": "历史",
"knowledge": [
"侵略与反抗",
"《南京条约》",
"鸦片战争",
"中国近代史"
]
}
样例 10
{
"_id": "b1ab1392d1ec4f0c8c0ce71225fd8976",
"question": "如下图是《民权画报》于1912年8月13日刊登的一幅讽刺漫画,画中有一只猿猴手持五色旗,在地球上绕圈子跑动。该漫画( )\n<img src=\"image/f621a97ecbfd8000108bad9e22c3088e.png\" style=\"vertical-align:middle;\" alt=\"\" width=\"186px\" height=\"204px\">\n<table border=\"1\" name=\"optionsTable\" style=\"width:100%;table-layout:fixed;\" cols=\"2\"><tr><td>A.继承了传统文人画的风格</td><td>B.证实了袁世凯复辟帝制</td></tr><tr><td>C.描绘了生物进化论内涵</td><td>D.反映了当时政治转型艰难</td></tr></table>",
"answer": "D\n",
"Analysis": "\n【详解】\n根据题干“一只猿猴手持民国五色旗,在地球上绕圈子跑动”并结合所学知识可知,五色旗是民国旗帜,漫画中猿猴举着民国旗帜跑向了专制,这讽刺了袁世凯窃取辛亥革命的胜利果实,漫画反映了当时政治转型的艰难,D项正确;传统文人画强调的是写意,漫画明显不属于传统文人画,排除A项;袁世凯复辟帝制已经到了1916年,所以漫画不能证实袁世凯复辟帝制,排除B项;描绘了生物进化论的内涵与漫画信息“共和、专制”无关,排除C项。故选D项。\n",
"options": "",
"logicQuesTypeName": "解答",
"subjectId": "8",
"is_img": 1,
"difficulty": 3,
"gradeGroupId": "2",
"gradeGroupName": "初中",
"subjectName": "历史",
"knowledge": [
"辛亥革命与中华民国的建立",
"近代化的探索",
"中华民国建立",
"中国近代史"
]
}
样例 11
{
"_id": "d246ebf4bb404aecbb23f813ad81a963",
"question": "2024年7月23日,我国科研团队在嫦娥五号月球样品中,发现了一种富含水分子和铵的未知矿物晶体——ULM-1。这是科学家首次在月壤中发现分子水。我国进行太空探索的意义主要有( )\n①开发利用太空中丰富的生物资源②利用太空的物理环境进行科学实验\n③探索空间环境对人类生存的影响④为人类和平利用太空贡献中国方案\n<table border=\"1\" name=\"optionsTable\" style=\"width:100%;table-layout:fixed;\" cols=\"4\"><tr><td>A.①②③</td><td>B.②③④</td><td>C.①③④</td><td>D.①②④</td></tr></table>",
"answer": "B\n",
"Analysis": "\n【详解】\n太空为真空环境,就目前的科学手段而言,无法证明其有生物资源存在,①错误;太空提供了一个与地球截然不同的物理环境,如微重力、高真空、强辐射等。这些条件为科学实验提供了独特的平台,使得在地球上难以进行或成本高昂的实验得以在太空中实现,②正确;了解太空环境对人类生存的影响,不仅有助于我们更好地保护地球环境,还能为未来的太空居住和施行提供必要的科学依据,③正确;中国作为航天大国,积极参与太空探索活动,不仅提升了自身的科技实力和国际地位,还为全球太空治理和和平利用太空贡献了中国方案,④正确。B正确,ACD错误。故选B。\n",
"options": "",
"logicQuesTypeName": "解答",
"subjectId": "9",
"is_img": 0,
"difficulty": 3,
"gradeGroupId": "2",
"gradeGroupName": "初中",
"subjectName": "地理",
"knowledge": [
"自然地理",
"地球和地图"
]
}
样例 12
{
"_id": "24e5d5cebb7d4e229663ceb9a8fb2f24",
"question": "一般来说,在相同图幅的情况下,比例尺小的地图,表示的范围大,呈现的内容较为简略。下列是关于北京市的四幅地图。若图幅相同,则其中比例尺最小的是( )\n<img src=\"image/d47c48fa713c176cb1fc64580bd6eeb4.png\" style=\"vertical-align:middle;\" alt=\"\" width=\"481px\" height=\"134px\">\n<table border=\"1\" name=\"optionsTable\" style=\"width:100%;table-layout:fixed;\" cols=\"4\"><tr><td>A.①</td><td>B.②</td><td>C.③</td><td>D.④</td></tr></table>",
"answer": "B\n",
"Analysis": "\n【详解】\n相同图幅,范围越大,比例尺越小,内容越简略;范围越小,比例尺越大,内容越详细。四幅图幅相同的地图,②图中国地图范围最大,则比例尺最小,B正确,ACD错误。故选B。\n",
"options": "",
"logicQuesTypeName": "解答",
"subjectId": "9",
"is_img": 1,
"difficulty": 2,
"gradeGroupId": "2",
"gradeGroupName": "初中",
"subjectName": "地理",
"knowledge": [
"比例尺",
"地图三要素",
"地图",
"自然地理",
"地球和地图"
]
}
样例 14
{
"_id": "8d0e4e0fa7f94ea9bc5a71b266d03161",
"question": "读下图漫画《村民议事》。从漫画中我们可以感受到( )\n<img src=\"image/dbc64ae4a0aba0b3f53858e0c7586e4b.jpg\" style=\"vertical-align:middle;\" alt=\"\" width=\"250px\" height=\"167px\">\n①我国发展基层民主 ②村民可以直接管理国家事务\n③村民民主意识增强 ④我国根本政治制度得以落实\n",
"answer": "B",
"Analysis": "\n【详解】\n本题考查基层群众自治制度、增强民主意识的要求。\n①③:漫画中《村民议事》,有利于我国发展基层民主,落实基层群众自治制度,有利于村民民主意识增强,提高村民的主人翁意识,①③符合题意;\n②:村民可以间接管理国家事务,②说法错误;\n④:我国的根本政治制度是人民代表大会制度,材料强调的是基层群众自治制度,④说法错误;\n故本题选B。\n",
"options": "A:①②\nB:①③\nC:②④\nD:③④",
"logicQuesTypeName": "单选",
"subjectId": "10",
"is_img": 1,
"difficulty": 2,
"gradeGroupId": "2",
"gradeGroupName": "初中",
"subjectName": "政治",
"knowledge": [
"参与民主生活",
"公民增强民主意识的做法",
"我与国家和社会",
"人民当家作主",
"基层群众自治制度",
"民主与法治",
"增强民主意识",
"我国的政治和经济制度",
"基本政治制度",
"追求民主价值"
]
}
样例 15
{
"_id": "70dbc5f0d4fe4679b44ff28479acab6c",
"question": "和谐关系,共同构建\n以下是初中生小闽生活中的两段对话:\n<table border=\"1\" style=\"width:525.923px;border-width:1px 1px 1px 1px;border-style:solid solid solid solid;border-color:black;border-collapse: collapse;\"><tr ><td style=\"width:217px;border-width:1px 1px 1px 1px;border-style:solid solid solid solid;border-color:black;\">对话一\n爸爸:爸妈,周末我们带孩子回去,陪你们吃饭、唠唠嗑。\n叔叔:爸妈对不起!我有任务,不能回家陪你们过节了。小时候您常说,“对祖国的忠,就是最大的孝”,可是我好多年没回家看你们了……\n爷爷:你们都是孝顺的孩子,“修身以尽孝,建功以报国”,你们做得很好。\n小闽:这就是家风吧,我也会传承下去的!</td><td style=\"width:208px;border-width:1px 1px 1px 1px;border-style:solid solid solid solid;border-color:black;\">对话二\n小闽:刘老师,虽然您一直要求严格,但我知道您很关心我们,最近总听您咳嗽,您要多注意身体。\n刘老师:谢谢小闵,你的关心让我很感动、很开心。最近天气转凉,你也要注意。\n小闽:谢谢老师提醒。我还想跟您请教一道题目,我觉得有另一种更简单的解法。\n刘老师:是吗,我们一起来讨论下。</td><td style=\"border-width:1px 1px 1px 1px;border-style:solid solid solid solid;border-color:black;\"><br /></td></tr></table>请你任选一段对话,结合所学知识,谈谈你的感悟。\n",
"answer": "选择对话一:①家风作为一种无形的力量,会融入家庭成员的血脉中,潜移默化地影响家庭成员的价值观念、性格特征、道德修养和行为习惯等。②优良家风引导我们向上向善,促进家庭幸福和谐。③孝亲敬老是中华民族的传统美德,也是公民的法定义务。④我们要积极传承孝敬父母的优良传统。\n选择对话二:①彼此尊重、教学相长、携手共进,是师生交往理想而美好的状态;②我们应主动理解、关心老师;真诚接受老师的引领和指导。\n",
"Analysis": "\n【分析】\n考点考查: 孝敬父母、传承良好家风、建立良好的师生关系\n能力考查:调动和运用知识,论证和探究问题 \n核心素养:健全人格\n【详解】\n第一步:审设问,明确主体、作答范围及作答角度; \n本题的设问主体是中学生,需要运用孝敬父母、传承良好家风、建立良好的师生关系的知识,从感悟类习题的角度进行作答; \n第二步:审材料,提取关键词,链接教材知识; \n关键词①:“对祖国的忠,就是最大的孝”;这就是家风吧,我也会传承下去的→可链接家风的重要性;传承良好家风;\n关键词②:周末我们带孩子回去,陪爸妈吃饭、唠唠嗑→可链接孝亲敬老是中华民族的传统美德,也是公民的法定义务;要积极传承孝敬父母的优良传统;\n关键词③:小闽与刘老师相互理解、共同讨论问题→可链接彼此尊重、教学相长、携手共进;我们应主动理解、关心老师;真诚接受老师的引领和指导;\n第三步:整合信息,组织答案。\n",
"options": "",
"logicQuesTypeName": "解答",
"subjectId": "10",
"is_img": 0,
"difficulty": 4,
"gradeGroupId": "2",
"gradeGroupName": "初中",
"subjectName": "政治",
"knowledge": [
"建立良好的师生关系的做法",
"正确认识老师的表扬与批评",
"让家更美好",
"孝亲敬长的做法",
"亲情之爱",
"师生交往",
"家的意味",
"正确面对老师的引领和指导",
"建立良好的师生关系",
"我与他人和集体",
"师生之间",
"师长情谊"
]
}
应用场景
1. 智能教育系统开发
该数据集可用于开发智能教育系统,包括智能题库管理、自动组卷、个性化学习推荐等功能。系统可以根据学生的学段、学科、知识点掌握情况,从数据集中筛选合适的题目进行推荐。题目的难度标注可以用于构建自适应学习路径,根据学生的答题表现动态调整题目难度。数据集中丰富的知识点标签可以用于构建知识图谱,实现知识点之间的关联分析和学习路径规划。对于包含图片的题目,系统可以集成OCR技术识别图片中的文字和图形,实现图文混排题目的智能处理。标准答案和详细解析可以用于开发智能批改系统,自动评估学生的答题情况并提供个性化反馈。
2. 自然语言处理模型训练
数据集中的题目内容、答案、解析等文本信息可以用于训练自然语言处理模型,包括题目理解、答案生成、解析生成等任务。题目内容可以作为输入,答案作为输出,训练seq2seq模型实现自动解题。解析文本可以用于训练模型生成题目的详细解答过程,帮助学生理解解题思路。知识点标签可以用于多标签分类任务,训练模型自动识别题目涉及的知识点。不同题型的题目可以用于训练模型处理多种类型的教育文本。数据集的规模适中,适合用于模型的原型开发和快速实验,也可以作为大规模预训练数据集的补充。
3. 教育数据挖掘与分析
数据集可以用于教育数据挖掘研究,分析题目的难度分布、知识点覆盖情况、题型分布等。通过对题目内容的文本分析,可以挖掘题目的语言特征、复杂度特征等,用于题目质量评估。知识点标签的共现分析可以揭示知识点之间的关联关系,用于构建学科知识体系。不同学段、学科的题目分布可以用于分析教育资源的分配情况。难度标注可以用于研究题目的难度评估标准,验证难度标注的合理性和一致性。包含图片的题目可以用于研究图文混排题目的特征,分析图片在题目理解中的作用。
4. 智能批改与评估系统
数据集中的标准答案和解析可以用于开发智能批改系统,自动评估学生的答题情况。对于选择题,系统可以比较学生的答案与标准答案,实现快速批改。对于主观题,系统可以基于标准答案和解析,使用自然语言处理技术评估学生答案的相似度和正确性。详细解析可以用于生成个性化反馈,指出学生的错误点和改进方向。难度标注可以用于分析学生的能力水平,根据答题正确率和题目难度评估学生的学习情况。知识点标签可以用于分析学生的知识掌握情况,识别薄弱知识点并推荐相关练习。
5. 教育资源推荐系统
数据集可以用于构建教育资源推荐系统,根据学生的学段、学科、学习进度等因素推荐合适的题目。系统可以基于协同过滤、内容过滤等推荐算法,从数据集中筛选符合学生需求的题目。知识点标签可以用于实现基于知识点的推荐,当学生需要练习某个知识点时,系统可以推荐相关的题目。难度标注可以用于实现难度自适应的推荐,根据学生的能力水平推荐合适难度的题目。题型的多样性可以满足不同学习场景的需求,如复习、练习、测试等。包含图片的题目可以用于推荐需要视觉理解的题目,丰富推荐内容的多样性。
结尾
K12题库数据集是一个高质量、多维度、全学段覆盖的教育资源数据集,共包含4599道题目,涵盖了小学、初中、高中三个学段的主要学科。数据集的核心优势在于包含完整的原始文件(1517个图片文件)和高质量的标注信息(标准答案、详细解析、知识点标签)。这些优势使得数据集在教育AI研究、智能教育系统开发、自然语言处理模型训练等领域具有重要的应用价值。
数据集采用JSON Lines格式存储,结构清晰,易于处理和分析。每道题目都包含完整的元数据信息,便于快速检索和筛选。图片文件与题目内容一一对应,支持基于图像的题目理解应用。数据集的多学段、多学科、多题型特点使其成为教育AI领域研究和应用开发的宝贵资源。
该数据集适用于算法研究人员、教育技术开发者、在线教育平台建设者等不同角色的需求。无论是用于模型训练、系统开发还是数据分析,数据集都能提供高质量的标注数据和丰富的应用场景。有需要可私信获取更多信息。
浙公网安备 33010602011771号