2025-12-05 PQ v.Next日志记录
2025-12-05 PQ v.Next日志记录
项目核心信息目前初步预计在这里进行开发测试(后续到develop):
https://z.gitee.cn/zgca/repos/zgca/aipq/tree/feature%2FKG_test
接下来的功能由于是探索题目生成的,因此暂时在GitHub上进行测试,后续再尝试并入PQ中:
代码仓库地址:https://github.com/undoubtable/KG_allprocess
今日进度 (4*5):
当前任务:知识图谱的搭建工作,尝试从PDF文件中提取实体和关系搭建知识图谱。
最初计划时间:160 小时
已经花费时间:64 小时
还有剩余时间:96 小时
进度说明:
目前已经实现了从PDF文件通过OCR提取文本,随后结合NRE模型更好地处理文本以提取实体和关系。

下一步目标:
目前只是提取实体和关系,随后导入Neo4j中,但是这些提取出来的实体比较准确,关系的话效果貌似一般,对于关系的话都是related to这样子的。因此下一步想要尝试是否可以结合LLM进行更好的实体和关系提取。
进度图示:

燃尽图的变化:


浙公网安备 33010602011771号