合集-项目实训
摘要:—— written by Unalome (2025.04.02) Haystack是一个由deepset开发的开源RAG框架,旨在构建生产就绪的LLM应用、检索增强生成管道及大型文档集合上智能工作的搜索系统。 一、Retrieval:文本检索技术 对应文件 haystack/components
阅读全文
摘要:—— written by Unalome (2025.04.09) 一. 测试deepseek-api 获取deepseek的api-key和url地址并进行连接测试,为接下来的一系列测试打下模型支持的基础。 from openai import OpenAI # deepseek-API cli
阅读全文
摘要:—— written by Unalome (2025.04.15-16) 一. 引入jieba分词提升Haystack-RAG中文后续检索精度 通过替换Haystack默认的英文分词工具,结合jieba的精确模式和搜索引擎模式对中文文本进行切分,同时过滤停用词并加载领域自定义词典,显著提升了文档预
阅读全文
摘要:—— written by Unalome (2025.04.26) 一. 获取服务器信息 1. 从管理员处获得服务器信息: 机器编号:A06 IP地址:xxxxxx 用户名:deepseek 密码:xxxxxx 2. 使用tabby连接服务器 首先从官网下载Tabby安装包并解压 在配置与连接中创
阅读全文
摘要:—— written by Unalome (2025.04.29-30) 由于最终的输出界面需要对用户友好,当前阶段的目标为将终端流式输出的转为自建前端的输出,以便后续接入Cherry Studio。 一、FastAPI+SSE流式输出到前端 1. FastAPI基础配置 CORS跨域处理 解决前
阅读全文
摘要:以下是四月份的工作量和项目进度的总结汇报: 一、项目整体进展 本项目基于Haystack框架构建生产级RAG(检索增强生成)系统,覆盖技术选型、核心功能开发、中文优化、服务器部署、前端交互全流程。通过五周迭代,实现以下核心成果: 技术架构分析:完成BM25检索、语义排序、Pipeline设计的深度解
阅读全文
摘要:—— written by Unalome (2025.06.07) 本次优化改动幅度较大,主要针对预处理分块和检索,优化后的整体检索和性能都有了非常优秀的提升。其中主要优化函数主要由队友们编写,本人负责各模块的连接与组装 一、分块方法优化 由原本的按固定长度暴力分块改为智能分块(固定长度与语义感知
阅读全文
摘要:—— written by Unalome (2025.06.09) 本次优化主要针对对话上下文的记忆功能,添加相关代码后实现了查询时对上下问的关联,对真实的对话场景有更好的表现力。 一、追问意图识别机制 在对话系统中,用户的后续提问往往依赖于历史对话内容(如“请举个例子”)。为实现对这类追问的精准
阅读全文