会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
八一菜刀
专注大模型、RAG检索增强生成、开源等领域的分享,微信公众号:"八一菜刀"
博客园
首页
新随笔
联系
订阅
管理
[置顶]
实战0-1,Java开发者也能看懂的大模型应用开发实践!!!
摘要: 前言 在前几天的文章《续写AI技术新篇,融汇工程化实践》中,我分享说在RAG领域,很多都是工程上的实践,做AI大模型应用的开发其实Java也能写,那么本文就一个Java开发者的立场,构建实现一个最基础的大模型应用系统。 而大模型应用系统其实在目前阶段,可能应用最广的还是RAG领域,因此,本文也是通过
阅读全文
posted @ 2023-10-12 13:56 Knife4j
阅读(5489)
评论(1)
推荐(1)
[置顶]
oss-server 小型对象存储系统
摘要: oss-server 项目介绍 oss-server是针对项目开发时提供的小型对象存储系统,开发者在针对文件上传时业务剥离,同时方便文件迁移,为满足单个项目,多个系统的情况下,提供统一的oss服务 oss-server主要提供功能: 1、上传功能 2、文件在线管理功能(包括文件的预览、内部上传、删除
阅读全文
posted @ 2018-06-13 13:06 Knife4j
阅读(2966)
评论(0)
推荐(1)
[置顶]
前后端对接的思考及总结
摘要: 说在前面的话 随着前端NodeJs技术的火爆,现在的前端已经非以前传统意义上的前端了,各种前端框架(Vue、React、Angular......)井喷式发展,配合NodeJs服务端渲染引擎,目前前端能完成的工作不仅仅局限于CSS,JS等方面,很多系统的业务逻辑都可以放在前端来完成,例如我司的管控
阅读全文
posted @ 2018-04-22 13:03 Knife4j
阅读(25345)
评论(3)
推荐(5)
2025年7月22日
企业AI知识库的文件解析痛点-Word格式解析优化(准确率95%)-100%开源
摘要: 一、前言 在大模型和RAG(检索增强生成)技术飞速发展的今天,企业AI知识库建设已成为AI落地的核心战场。而文件解析是所有参与做企业AI知识库开发者所避免不了的难题。 本文将结合我在开发TorchV AIS企业级AI知识库产品中碰到的解析Word的问题,将Word文档(.doc及.docx)高效、准
阅读全文
posted @ 2025-07-22 13:00 Knife4j
阅读(915)
评论(1)
推荐(1)
2024年8月17日
非结构化数据解析 &GenAI的应用探索和实践(文字稿)
摘要: 以下内容是8.15日我在上海张江科学会堂举办的“GOTC(全球开源技术峰会)” 与 “GOGC(全球开源极客嘉年华)” 分享内容文字稿,分享给大家。 一、前言 大家下午好, 我叫肖玉民,来自杭州萌嘉网络科技有限公司,很荣幸受主办方的邀请,来参加此次GOTC2024的分享。 我们是一家刚成立不久的初创
阅读全文
posted @ 2024-08-17 09:44 Knife4j
阅读(535)
评论(0)
推荐(1)
2024年8月7日
QWen2-72B-Instruct模型安装部署过程
摘要: 最近在给我们的客户私有化部署我们的TorchV系统,客户给的资源足够充裕,借此机会记录下部署千问72B模型的过程,分享给大家! 一、基础信息 操作系统:Ubuntu 22.04.3 LTS GPU: A800(80GB) * 8 内存:1TB 二、软件信息 Python: 3.10 Pytorch:
阅读全文
posted @ 2024-08-07 12:23 Knife4j
阅读(3935)
评论(1)
推荐(0)
2024年7月8日
RAG工程实践拦路虎之一:PDF格式解析杂谈
摘要: 背景 PDF(Portable Document Format)是一种广泛用于文档交换的文件格式,由Adobe Systems开发。它具有跨平台性、固定布局和易于打印等特点,因此在商业、学术和个人领域广泛应用。然而,PDF文件的解析一直是一个具有挑战性的问题,因为其内部结构的复杂性和多样性,使得提取
阅读全文
posted @ 2024-07-08 09:14 Knife4j
阅读(3076)
评论(0)
推荐(3)
2024年7月3日
我对《RAG/大模型/非结构化数据知识库类产品》技术架构的思考、杂谈
摘要: 1、前言 在6.28/29的稀土掘金开发者大会RAG专场上,我们公司CEO员外代表TorchV分享了我们在《RAG在企业应用中落地的难点与创新》 其中最后分享了两个观点: AI在应用场景落地时有三个特点:功能小、质量高、价值大 如果说做产品是把一横做好的话,那么去做企业落地服务就是一竖,从需求和方案
阅读全文
posted @ 2024-07-03 09:41 Knife4j
阅读(1181)
评论(0)
推荐(1)
2024年4月2日
创业:大模型RAG系统三个月的开发心得和思考
摘要: 1. 前言 自从和员外上家公司离职后,我们就自己搞公司投入到了RAG大模型的AI产品应用的开发中,这中间有一个春节,前后的总时间大概是三个月左右,在这三个月期间,基本是昼夜兼程啊,到今天3月底结束,产品目前看是有了一个基础的雏形。 在这期间,员外负责整个产品的营销、商业客户的洽谈等方面的内容,我和阿
阅读全文
posted @ 2024-04-02 10:02 Knife4j
阅读(3085)
评论(1)
推荐(4)
2024年3月27日
TorchV的RAG实践分享(三):解析llama_index的数据存储结构和召回策略过程
摘要: 1.前言 LlamaIndex是一个基于LLM的数据处理框架,在RAG领域非常流行,简单的几行代码就能实现本地的文件的对话功能,对开发者提供了极致的封装,开箱即用。 本文以官方提供的最简单的代理示例为例,分析LlamaIndex在数据解析、向量Embedding、数据存储及召回的整个源码过程。 通过
阅读全文
posted @ 2024-03-27 09:46 Knife4j
阅读(1617)
评论(2)
推荐(0)
2024年3月22日
TorchV的RAG实践分享(二):基于ElasticSearch的混合检索实战&原理分析
摘要: 概述 在昨天员外分享的《TorchV的RAG实践分享(1)——RAG的定位、技术选型和RAG技术文章目录》一文中介绍了TorchV的由来,也分享了我们的几个基线产品和应用架构的方向,我们想的是在创业的过程中,将我们自己的一些产品理念、技术心得都通过公众号发文的方式分享出来,更多的和行业内的专家们共同
阅读全文
posted @ 2024-03-22 10:53 Knife4j
阅读(2821)
评论(4)
推荐(1)
2021年4月20日
Spring Security框架中踢人下线技术探索
摘要: 1.背景 在某次项目的开发中,使用到了Spring Security权限框架进行后端权限开发的权限校验,底层集成Spring Session组件,非常方便的集成Redis进行分布式Session的会话集群部署。系统正式上线后,各个部署节点能够非常方便的进行集群部署,用户的Session会话信息全部保
阅读全文
posted @ 2021-04-20 21:17 Knife4j
阅读(2995)
评论(0)
推荐(3)
下一页
公告