寒假第九天

数据收集与知识库设计

  • 任务:收集数学知识数据,设计知识库结构。

  • 进展:我们从公开数据集(如MathStackExchange、OpenWebText)和大学教材(如《高等数学》《线性代数》)中提取数学相关数据,整理基础运算、公式推导、常见定理等信息。

  • 问题:数据格式不统一,难以直接使用。

  • 解决方案:编写Python脚本清洗数据,统一格式为JSON,便于后续处理。

posted @ 2025-02-14 14:29  努力不掉发  阅读(6)  评论(0)    收藏  举报