任务:收集数学知识数据,设计知识库结构。
进展:我们从公开数据集(如MathStackExchange、OpenWebText)和大学教材(如《高等数学》《线性代数》)中提取数学相关数据,整理基础运算、公式推导、常见定理等信息。
问题:数据格式不统一,难以直接使用。
解决方案:编写Python脚本清洗数据,统一格式为JSON,便于后续处理。