会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
zjz2333
首页
归档
管理
相册
zjz2333
阅读 思考 实践 总结
博客园
首页
新随笔
联系
订阅
管理
2025年7月15日
基于Output Distribution的一种数据污染探测方法
摘要: Generalization or Memorization: Data Contamination and Trustworthy Evaluation for Large Language Models 摘要: 在当前LLM训练数据不透明,模型黑盒,合成数据增加,作者提出CDD(Contamin
阅读全文
posted @ 2025-07-15 15:22 zjz2333
阅读(26)
评论(0)
推荐(0)
2023年12月2日
NaLLM 项目总结
摘要: NaLLM 项目总结 前后端分离,前端Vue3,后端Fastapi 项目的整体界面如图: 主要实现三种功能: Unstructured Import:实现非结构化文本的知识图谱提取和实体关系、去重等操作,最终返回提取的实体、关系和对应的属性,本项目也提供了将原始提取结果转换为CSV文件的类,便于结果
阅读全文
posted @ 2023-12-02 13:00 zjz2333
阅读(987)
评论(0)
推荐(0)
2023年11月19日
Neo4j基础学习
摘要: 还是参考微信公众号的一篇文章 “关于图数据库(Neo4j)你应该知道的一切” 先简单介绍一下,Neo4j相关的服务 Neo4j 数据库,又名为Noe4j DBMS 同时还有Neo4j AuraDB,是一种完全托管的云服务。 比较重要的还有Cypher,是neo4j的查询语言 采用neo4j数据库主要
阅读全文
posted @ 2023-11-19 16:59 zjz2333
阅读(133)
评论(0)
推荐(0)
2023年11月12日
Neo4j+Langchain实现非结构化知识图谱增强QA
摘要: 微信公众号的一篇文章,着重介绍如何使用知识图谱来增强大语言模型QA的问答效果 1. 核心架构 核心架构如下: 可以通过Neo4j的向量索引和Neoconj图数据的强大能力来实现检索增强的生成系统,提供精确且上下文丰富的答案。 两条路: 向量相似性搜索来检索非结构化信息, 访问图数据库来提取结构化信息
阅读全文
posted @ 2023-11-12 19:49 zjz2333
阅读(5432)
评论(0)
推荐(0)
2023年11月2日
论文阅读:InstructIE: A Chinese Instruction-based Information Extraction Dataset
摘要: 主要提出了一种数据集Instruction-based IE,要求模型根据指令来提取信息。 1. Instruction 为IE任务创建特定的数据集式消耗事时间与资源的。 面对这些挑战的常见方法: Seq2seq提出 TANL将其视为自然语言增强的翻译任务。 UIE提出一种text-to-struc
阅读全文
posted @ 2023-11-02 22:03 zjz2333
阅读(409)
评论(0)
推荐(0)
2023年10月25日
论文阅读:DeepKE:A Deep Learning Based Knowledge Extraction Toolkit for Knowledge Base Population
摘要: DeepKE,支持数据集和模型的结合来实现非结构化数据中信息的提取。 同时提出框架和一系列的组件来实现足够的模块化和可扩展性。 项目地址 先根据paper做一个介绍 1. Introduction 现存的KB是在实体和关系方面是不完备的。 常见的一些标志性的应用: Spacy(实体识别) OpenN
阅读全文
posted @ 2023-10-25 22:34 zjz2333
阅读(665)
评论(0)
推荐(0)
2023年10月22日
论文阅读:Unifying Large Language Model and Knowledge Graph:A RoadMap
摘要: 1 Introduction 大模型和知识图谱结合的综述。 简单介绍一下大模型和知识图谱的优缺点: 如上所示。 本文主要划分为三个模块,分别为: KG-enhanced LLMs LLM-augmented KGs Synergized LLM + KG 2 Background 主要介绍了LLM和
阅读全文
posted @ 2023-10-22 11:05 zjz2333
阅读(389)
评论(0)
推荐(0)
2023年10月8日
论文阅读:A Lightweight Knowledge Graph Embedding Framework for Efficient Inference and Storage
摘要: ABSTRACT 现存的KGE方法无法适用于大规模的图(由于存储和推理效率的限制) 作者提出了一种LightKG框架: 自动的推断出码本codebooks和码字codewords,为每个实体生成合适的embedding。 同时,框架中包含残差模块来实现码本的多样性,并且包含连续函数来近似的实现码字的
阅读全文
posted @ 2023-10-08 11:04 zjz2333
阅读(162)
评论(0)
推荐(0)
2023年10月5日
论文阅读:iterator zero-shot llm prompting for knowledge graph construction
摘要: Abstract 知识图谱,一种相互连接和可解释的结构。 生成需要更多的人力、领域知识、并需要适用于不同的应用领域。 本论文提出借助LLM,通过0-shot和外部知识不可知的情况下生成知识图谱。 主要贡献: 迭代的prompting提取最终图的相关部分 0-shot,不需要examples 一个可扩
阅读全文
posted @ 2023-10-05 19:54 zjz2333
阅读(383)
评论(0)
推荐(0)
2023年9月15日
论文阅读: Co-design Hardware and Algorithm for Vector Search
摘要: 1. Introduction 介绍一下论文背景, 向量检索常用于 搜索引擎,推荐系统,LLM和科学计算等 对应的常用的硬件向量检索方法,IVF-PQ 其中IVF:将多个向量聚类, PQ将向量压缩 而为了最大化IVF-PQ的效果,也会面临很多的挑战 在芯片设计的过程中,会遇到针对六个阶段如何设计合适
阅读全文
posted @ 2023-09-15 21:10 zjz2333
阅读(307)
评论(0)
推荐(0)
下一页
公告