摘要: 前言 在前几天的文章《续写AI技术新篇,融汇工程化实践》中,我分享说在RAG领域,很多都是工程上的实践,做AI大模型应用的开发其实Java也能写,那么本文就一个Java开发者的立场,构建实现一个最基础的大模型应用系统。 而大模型应用系统其实在目前阶段,可能应用最广的还是RAG领域,因此,本文也是通过 阅读全文
posted @ 2023-10-12 13:56 Knife4j 阅读(2942) 评论(0) 推荐(1) 编辑
摘要: oss-server 项目介绍 oss-server是针对项目开发时提供的小型对象存储系统,开发者在针对文件上传时业务剥离,同时方便文件迁移,为满足单个项目,多个系统的情况下,提供统一的oss服务 oss-server主要提供功能: 1、上传功能 2、文件在线管理功能(包括文件的预览、内部上传、删除 阅读全文
posted @ 2018-06-13 13:06 Knife4j 阅读(2650) 评论(0) 推荐(1) 编辑
摘要: 说在前面的话 随着前端NodeJs技术的火爆,现在的前端已经非以前传统意义上的前端了,各种前端框架(Vue、React、Angular......)井喷式发展,配合NodeJs服务端渲染引擎,目前前端能完成的工作不仅仅局限于CSS,JS等方面,很多系统的业务逻辑都可以放在前端来完成,例如我司的管控 阅读全文
posted @ 2018-04-22 13:03 Knife4j 阅读(24881) 评论(3) 推荐(5) 编辑
摘要: 以下内容是8.15日我在上海张江科学会堂举办的“GOTC(全球开源技术峰会)” 与 “GOGC(全球开源极客嘉年华)” 分享内容文字稿,分享给大家。 一、前言 大家下午好, 我叫肖玉民,来自杭州萌嘉网络科技有限公司,很荣幸受主办方的邀请,来参加此次GOTC2024的分享。 我们是一家刚成立不久的初创 阅读全文
posted @ 2024-08-17 09:44 Knife4j 阅读(39) 评论(0) 推荐(0) 编辑
摘要: 最近在给我们的客户私有化部署我们的TorchV系统,客户给的资源足够充裕,借此机会记录下部署千问72B模型的过程,分享给大家! 一、基础信息 操作系统:Ubuntu 22.04.3 LTS GPU: A800(80GB) * 8 内存:1TB 二、软件信息 Python: 3.10 Pytorch: 阅读全文
posted @ 2024-08-07 12:23 Knife4j 阅读(974) 评论(1) 推荐(0) 编辑
摘要: 背景 PDF(Portable Document Format)是一种广泛用于文档交换的文件格式,由Adobe Systems开发。它具有跨平台性、固定布局和易于打印等特点,因此在商业、学术和个人领域广泛应用。然而,PDF文件的解析一直是一个具有挑战性的问题,因为其内部结构的复杂性和多样性,使得提取 阅读全文
posted @ 2024-07-08 09:14 Knife4j 阅读(850) 评论(0) 推荐(2) 编辑
摘要: 1、前言 在6.28/29的稀土掘金开发者大会RAG专场上,我们公司CEO员外代表TorchV分享了我们在《RAG在企业应用中落地的难点与创新》 其中最后分享了两个观点: AI在应用场景落地时有三个特点:功能小、质量高、价值大 如果说做产品是把一横做好的话,那么去做企业落地服务就是一竖,从需求和方案 阅读全文
posted @ 2024-07-03 09:41 Knife4j 阅读(440) 评论(0) 推荐(1) 编辑
摘要: 1. 前言 自从和员外上家公司离职后,我们就自己搞公司投入到了RAG大模型的AI产品应用的开发中,这中间有一个春节,前后的总时间大概是三个月左右,在这三个月期间,基本是昼夜兼程啊,到今天3月底结束,产品目前看是有了一个基础的雏形。 在这期间,员外负责整个产品的营销、商业客户的洽谈等方面的内容,我和阿 阅读全文
posted @ 2024-04-02 10:02 Knife4j 阅读(1669) 评论(1) 推荐(4) 编辑
摘要: 1.前言 LlamaIndex是一个基于LLM的数据处理框架,在RAG领域非常流行,简单的几行代码就能实现本地的文件的对话功能,对开发者提供了极致的封装,开箱即用。 本文以官方提供的最简单的代理示例为例,分析LlamaIndex在数据解析、向量Embedding、数据存储及召回的整个源码过程。 通过 阅读全文
posted @ 2024-03-27 09:46 Knife4j 阅读(708) 评论(2) 推荐(0) 编辑
摘要: 概述 在昨天员外分享的《TorchV的RAG实践分享(1)——RAG的定位、技术选型和RAG技术文章目录》一文中介绍了TorchV的由来,也分享了我们的几个基线产品和应用架构的方向,我们想的是在创业的过程中,将我们自己的一些产品理念、技术心得都通过公众号发文的方式分享出来,更多的和行业内的专家们共同 阅读全文
posted @ 2024-03-22 10:53 Knife4j 阅读(1227) 评论(4) 推荐(1) 编辑
摘要: 1.背景 在某次项目的开发中,使用到了Spring Security权限框架进行后端权限开发的权限校验,底层集成Spring Session组件,非常方便的集成Redis进行分布式Session的会话集群部署。系统正式上线后,各个部署节点能够非常方便的进行集群部署,用户的Session会话信息全部保 阅读全文
posted @ 2021-04-20 21:17 Knife4j 阅读(2460) 评论(0) 推荐(1) 编辑
摘要: 1.前言 通常我们在使用Spring Boot框架时,如果没有特别指定接口的序列化类型,则会使用Spring Boot框架默认集成的Jackson框架进行处理,通过Jackson框架将服务端响应的数据序列化成JSON格式的数据。 本文主要针对在Spring Boot框架中使用Jackson进行处理的 阅读全文
posted @ 2021-03-26 10:49 Knife4j 阅读(2985) 评论(0) 推荐(1) 编辑