客户投诉知识库建设
背景
客户希望把投诉的案例和解决生成知识库给客服任务搜索参考。投诉案例有各种各样的格式,PDF,WORD,内容的格式也是五花八门,有表格的,也有文本的。
技术实现
我们最终需要把投诉的材料转化成QA对存储在 向量数据库里面。
方案1
人工处理转化
方案2
直接丢给大模型,让大模型做总结生成QA对。
不好的方案:不能直接通过切片生成,比如一个PDF有一万字,问题描述在前500字,问题处理在最后500字,按段落切片后,知识就发散了,当用户搜索到问题的描述,找不到解决办法。