6.3

下午实现了RAGService的核心逻辑:
1)文档分块:chunk-size=2000字符,overlap=100字符,按段落边界切分
2)向量化:调用AI模型的getEmbedding()接口生成1024维向量
3)检索:向量余弦相似度 + 关键词匹配双重策略,Top-K=15
4)自动分类:关键词快速匹配 + AI兜底分类
为了保证生成内容的准确性,设计了三层兜底策略:RAG检索→获取完整文档→AI自主生成。这样即使知识库内容不足,也能产出有实质内容的课件。
晚上准备了知识库数据,整理了9大学科(语文、数学、英语、物理、化学、生物、历史、地理、政治)共98篇教学文档,编写了批量导入脚本。

posted @ 2026-06-16 10:31  YKKKKKKKKKK  阅读(0)  评论(0)    收藏  举报