会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
zjz2333
首页
归档
管理
相册
zjz2333
阅读 思考 实践 总结
博客园
首页
新随笔
联系
订阅
管理
1
2
下一页
2025年7月15日
基于Output Distribution的一种数据污染探测方法
摘要: Generalization or Memorization: Data Contamination and Trustworthy Evaluation for Large Language Models 摘要: 在当前LLM训练数据不透明,模型黑盒,合成数据增加,作者提出CDD(Contamin
阅读全文
posted @ 2025-07-15 15:22 zjz2333
阅读(26)
评论(0)
推荐(0)
2023年12月2日
NaLLM 项目总结
摘要: NaLLM 项目总结 前后端分离,前端Vue3,后端Fastapi 项目的整体界面如图: 主要实现三种功能: Unstructured Import:实现非结构化文本的知识图谱提取和实体关系、去重等操作,最终返回提取的实体、关系和对应的属性,本项目也提供了将原始提取结果转换为CSV文件的类,便于结果
阅读全文
posted @ 2023-12-02 13:00 zjz2333
阅读(987)
评论(0)
推荐(0)
2023年11月19日
Neo4j基础学习
摘要: 还是参考微信公众号的一篇文章 “关于图数据库(Neo4j)你应该知道的一切” 先简单介绍一下,Neo4j相关的服务 Neo4j 数据库,又名为Noe4j DBMS 同时还有Neo4j AuraDB,是一种完全托管的云服务。 比较重要的还有Cypher,是neo4j的查询语言 采用neo4j数据库主要
阅读全文
posted @ 2023-11-19 16:59 zjz2333
阅读(133)
评论(0)
推荐(0)
2023年11月12日
Neo4j+Langchain实现非结构化知识图谱增强QA
摘要: 微信公众号的一篇文章,着重介绍如何使用知识图谱来增强大语言模型QA的问答效果 1. 核心架构 核心架构如下: 可以通过Neo4j的向量索引和Neoconj图数据的强大能力来实现检索增强的生成系统,提供精确且上下文丰富的答案。 两条路: 向量相似性搜索来检索非结构化信息, 访问图数据库来提取结构化信息
阅读全文
posted @ 2023-11-12 19:49 zjz2333
阅读(5432)
评论(0)
推荐(0)
2023年11月2日
论文阅读:InstructIE: A Chinese Instruction-based Information Extraction Dataset
摘要: 主要提出了一种数据集Instruction-based IE,要求模型根据指令来提取信息。 1. Instruction 为IE任务创建特定的数据集式消耗事时间与资源的。 面对这些挑战的常见方法: Seq2seq提出 TANL将其视为自然语言增强的翻译任务。 UIE提出一种text-to-struc
阅读全文
posted @ 2023-11-02 22:03 zjz2333
阅读(409)
评论(0)
推荐(0)
2023年10月25日
论文阅读:DeepKE:A Deep Learning Based Knowledge Extraction Toolkit for Knowledge Base Population
摘要: DeepKE,支持数据集和模型的结合来实现非结构化数据中信息的提取。 同时提出框架和一系列的组件来实现足够的模块化和可扩展性。 项目地址 先根据paper做一个介绍 1. Introduction 现存的KB是在实体和关系方面是不完备的。 常见的一些标志性的应用: Spacy(实体识别) OpenN
阅读全文
posted @ 2023-10-25 22:34 zjz2333
阅读(666)
评论(0)
推荐(0)
2023年10月22日
论文阅读:Unifying Large Language Model and Knowledge Graph:A RoadMap
摘要: 1 Introduction 大模型和知识图谱结合的综述。 简单介绍一下大模型和知识图谱的优缺点: 如上所示。 本文主要划分为三个模块,分别为: KG-enhanced LLMs LLM-augmented KGs Synergized LLM + KG 2 Background 主要介绍了LLM和
阅读全文
posted @ 2023-10-22 11:05 zjz2333
阅读(389)
评论(0)
推荐(0)
2023年10月8日
论文阅读:A Lightweight Knowledge Graph Embedding Framework for Efficient Inference and Storage
摘要: ABSTRACT 现存的KGE方法无法适用于大规模的图(由于存储和推理效率的限制) 作者提出了一种LightKG框架: 自动的推断出码本codebooks和码字codewords,为每个实体生成合适的embedding。 同时,框架中包含残差模块来实现码本的多样性,并且包含连续函数来近似的实现码字的
阅读全文
posted @ 2023-10-08 11:04 zjz2333
阅读(162)
评论(0)
推荐(0)
2023年10月5日
论文阅读:iterator zero-shot llm prompting for knowledge graph construction
摘要: Abstract 知识图谱,一种相互连接和可解释的结构。 生成需要更多的人力、领域知识、并需要适用于不同的应用领域。 本论文提出借助LLM,通过0-shot和外部知识不可知的情况下生成知识图谱。 主要贡献: 迭代的prompting提取最终图的相关部分 0-shot,不需要examples 一个可扩
阅读全文
posted @ 2023-10-05 19:54 zjz2333
阅读(383)
评论(0)
推荐(0)
2023年9月15日
论文阅读: Co-design Hardware and Algorithm for Vector Search
摘要: 1. Introduction 介绍一下论文背景, 向量检索常用于 搜索引擎,推荐系统,LLM和科学计算等 对应的常用的硬件向量检索方法,IVF-PQ 其中IVF:将多个向量聚类, PQ将向量压缩 而为了最大化IVF-PQ的效果,也会面临很多的挑战 在芯片设计的过程中,会遇到针对六个阶段如何设计合适
阅读全文
posted @ 2023-09-15 21:10 zjz2333
阅读(307)
评论(0)
推荐(0)
1
2
下一页
公告