会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deeplearningmachine
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
下一页
2024年11月18日
PGML:向量数据库内一体化的RAG框架
摘要: 架构总览 特性: ● 支持数据库中进行的ai和ml分析 ● 支持gpu加速 ● 集成多种开源llm和rag框架 ● 支持传统的机器学习模型 使用方法 云端试用 官方提供了云服务试用,根据要求注册账号即可: 注册地址 本地部署 官方提供了docker镜像,执行如下命令即可安装 docker run \
阅读全文
posted @ 2024-11-18 21:52 深度学习机器
阅读(230)
评论(0)
推荐(0)
2024年9月9日
一文梳理RAG(检索增强生成)的现状与挑战
摘要: 一 RAG简介 大模型相较于过去的语言模型具备更加强大的能力,但在实际应用中,例如在准确性、知识更新速度和答案透明度方面,仍存在不少问题,比如典型的幻觉现象。因此,检索增强生成 (Retrieval-Augmented Generation, RAG) 被当作于大模型应用开发的一种新范式。RAG是指
阅读全文
posted @ 2024-09-09 21:54 深度学习机器
阅读(503)
评论(0)
推荐(0)
2024年8月27日
大模型RAG应用开发之PDF解析工具对比
摘要: 一 汇总 类型 名称 地址 OCR 提取表格内容 保留文本顺序 提取图片 保存成md格式 其他特性 传统PDF解析库 pymupdf https://github.com/pymupdf/PyMuPDF ❌ ✔️ ✔️ ✔️ ❌ ● 表格提取● 自定义字体 传统PDF解析库 pdfminer htt
阅读全文
posted @ 2024-08-27 22:24 深度学习机器
阅读(6864)
评论(0)
推荐(0)
2024年7月31日
Magic-PDF:端到端PDF文档解析神器 构建高质量RAG必备!
摘要: 项目结构 流程解析 预处理的作用是判断文档内容是否需要进行OCR识别,如果是普通可编辑的PDF文档,则使用PyMuPDF库提取元信息。 模型层除了常规的OCR、版面结构分析外,还有公式检测模型,可提取公式内容,用于后续把公式转化为Latex格式。但是目前暂无表格内容识别,官方预计1个月之内会放出。
阅读全文
posted @ 2024-07-31 22:31 深度学习机器
阅读(1550)
评论(0)
推荐(0)
2024年7月29日
RAG文档解析利器:Deepdoc
摘要: 项目结构 Deepdoc是RAG框架RAGFLOW中使用的文档解析工具。 |--deepdoc |--parser |--resume |--entities |--step_one.py |--step_two.py |--docx_parser.py |--pdf_parser.py |--ex
阅读全文
posted @ 2024-07-29 22:53 深度学习机器
阅读(1840)
评论(0)
推荐(0)
2024年7月22日
DB-GPT:LLM应用的集大成者
摘要: 整体架构 架构解读 可以看到,DB-GPT把架构抽象为7层,自下而上分别为: 运行环境:支持本地/云端&单机/分布式等部署方式。顺便一提,RAY是蚂蚁深度参与的一个开源项目,所以对RAY功能的支持应该非常完善。 训练层:由子项目DB-GPT-Hub提供。以LLM为基,包含多种数据集和微调方法的微调框
阅读全文
posted @ 2024-07-22 21:23 深度学习机器
阅读(276)
评论(0)
推荐(0)
2024年7月7日
基于Sentence Transformer微调向量模型
摘要: Sentence Transformer库升级到了V3,其中对模型训练部分做了优化,使得模型训练和微调更加简单了,跟着官方教程走了一遍,顺利完成向量模型的微调,以下是对官方教程的精炼和总结。 一 所需组件 使用Sentence Transformer库进行向量模型的微调需要如下的组件: 数据数据:
阅读全文
posted @ 2024-07-07 16:10 深度学习机器
阅读(690)
评论(0)
推荐(0)
2024年6月26日
热门开源Text2SQL框架
摘要: Chat2DB 项目地址:https://github.com/chat2db/Chat2DB 简介:Chat2DB是一个通用的SQL客户端和数据分析工具,能够辅助生成SQL,同时支持对话式的数据分析功能,提供了网页、客户端2种使用方式,它支持几乎所有流行的数据库,并且chat2DB还开源了7B的S
阅读全文
posted @ 2024-06-26 23:25 深度学习机器
阅读(1080)
评论(0)
推荐(0)
2024年5月15日
记使用pdf.js过程遇到的坑
摘要: 最近项目中需要用到js库来渲染pdf文件,调研后发现无论是reach-pdf.js或者是svelte-pdf.js都是在pdf.js基础上做了些许精简,反而功能还不如原始的pdf.js来得全面。但是原始的库几乎没有像样的代码示例,而能搜索到的大多数代码不少都是十几年前的了,在这个过程中踩了不少坑,做
阅读全文
posted @ 2024-05-15 21:38 深度学习机器
阅读(884)
评论(0)
推荐(0)
2024年5月10日
开源RAG框架汇总
摘要: 前言 本文搜集了一些开源的基于LLM的RAG(Retrieval-Augmented Generation)框架,旨在吸纳业界最新的RAG应用方法与思路。如有错误或者意见可以提出,同时也欢迎大家把自己常用而这里未列出的框架贡献出来,感谢~ RAG应用框架 RAGFlow 项目地址:https://g
阅读全文
posted @ 2024-05-10 23:59 深度学习机器
阅读(9710)
评论(0)
推荐(0)
上一页
1
2
3
下一页
公告