2025-12-05 PQ v.Next日志记录

2025-12-05 PQ v.Next日志记录

项目核心信息目前初步预计在这里进行开发测试(后续到develop):

https://z.gitee.cn/zgca/repos/zgca/aipq/tree/feature%2FKG_test

接下来的功能由于是探索题目生成的,因此暂时在GitHub上进行测试,后续再尝试并入PQ中:

代码仓库地址:https://github.com/undoubtable/KG_allprocess

今日进度(4*5):

当前任务:知识图谱的搭建工作,尝试从PDF文件中提取实体和关系搭建知识图谱。

最初计划时间:160 小时

已经花费时间:64 小时

还有剩余时间:96 小时

进度说明:

目前已经实现了从PDF文件通过OCR提取文本,随后结合NRE模型更好地处理文本以提取实体和关系。

image-20251216100927-smr3gxf

下一步目标:

目前只是提取实体和关系,随后导入Neo4j中,但是这些提取出来的实体比较准确,关系的话效果貌似一般,对于关系的话都是related to这样子的。因此下一步想要尝试是否可以结合LLM进行更好的实体和关系提取。

进度图示:

image-20251216101247-4czem6d

燃尽图的变化

image-20251216100122-xtyrulc

posted @ 2025-12-16 11:04  Bingzheng  阅读(5)  评论(0)    收藏  举报