会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
tgltt
博客园
首页
新随笔
联系
订阅
管理
2026年3月30日
NPU环境安装部署GOT及初步测试OCR2.0效果
摘要: 一、 GOT安装环境 1、环境搭建 GOT安装需要依赖Python 3.10,且相关依赖包版本如下: torch==2.0.1 torchvision==0.15.2 transformers==4.37.2 tiktoken==0.6.0 verovio==4.3.1 accelerate==0.
阅读全文
posted @ 2026-03-30 16:56 tgltt
阅读(17)
评论(0)
推荐(0)
2026年3月27日
dify使用&RAG开发指南(保姆级攻略)
摘要: 一、访问Dify 在浏览器中访问http://XXX.XXX.XXX.XXX/apps,然后使用账号信息登录图1。 图1 Dify登录界面 成功登录后,可看到图2Dify工作室界面。 图2 Dify工作室 二、构建RAG应用 2.1构建知识库 点击图2上方的知识库标签,可看到图3中的知识库标签页。
阅读全文
posted @ 2026-03-27 16:03 tgltt
阅读(85)
评论(0)
推荐(0)
Agent原理
摘要: 本文阐述的Agent是浅层Agent,是一种通过ReAct方式进行推理的LLM执行方式,即LLM推理一次,然后观察推理结果,再决定下一步做什么,必要是会调用外部工具获取相应的数据,并补充到提示词里,是一种走一步、看一步的执行方式,有 别于工作流那种预规划工作流的深层agent。 1. Agent的实
阅读全文
posted @ 2026-03-27 15:03 tgltt
阅读(39)
评论(0)
推荐(0)
基于LLM的问数方案
摘要: 方案有以下两种: - 以NL2SQL为核心 即LLM根据用户指令生成SQL,然后SQL查询数据库,再将查到的数据生成图表,此种方案需LLM生成问数所需数据的SQL,因此其扩展性比较差,尤其在多表查询时性能较差,经常陷于生成SQL错误纠正的旋涡; - 以NL2Semantic2SQL为核心, 即LLM
阅读全文
posted @ 2026-03-27 14:33 tgltt
阅读(22)
评论(0)
推荐(0)
RAG知识库原理
摘要: 一、如何与LLM交互? 绝大多数的交互场景,用户向LLM提出一个Question,LLM返回一个Answer。 二、LLM的局限—无法更新自身知识 LLM一旦训练完成并发布后,其自身所拥有的知识,无法与时俱进。 三、如何弥补LLM无法更新自身知识的局限? 原因 LLM自身知识无法与时俱进,是由于LL
阅读全文
posted @ 2026-03-27 14:31 tgltt
阅读(39)
评论(0)
推荐(0)
Palantir本体论(Ontology)
摘要: 1、本体论(Ontology)为何大行其道? 将企业软件系统的设计理念,从传统的“以数据为中心”,转向了“以决策为中心”,因为企业或组织存续的本质,是在内外部环境瞬息万变的挑战下,持续执行最有效的决策。 构成决策的三大要素: 数据(Data) 做出决策所依据的信息。 逻辑(Logic) 评估和推理决
阅读全文
posted @ 2026-03-27 09:25 tgltt
阅读(828)
评论(0)
推荐(0)
深度学习概述
摘要: 一、神经网络(Neural Network, NN) 深度学习的理论基础是神经网络,而神经网络的基本组成单元是神经元,这些概念都是借鉴于生物学中的神经网络的概念,神经元是人体神经系统的基本组成单元,神经系统包含脑、脊髓等,这些组织是人体的控制系统,控制着人的生理、心理活动,而AI仿生的是人脑,作为机
阅读全文
posted @ 2026-03-27 09:24 tgltt
阅读(19)
评论(0)
推荐(0)
大模型实践基础
摘要: 一、如何获取大模型? 基于大模型开发应用,首先要获取到大模型的权重文件文件,然后部署大模型,再基于大模型开发上层应用。 业内目前使用大模型有两类方式: 第一类方式,基于各大模型厂商提供的API,以免费或计费的方式调用大模型,这类方式最简单,但可能需要一定的费用。 第二类方式,在三方托管平台或其他途径
阅读全文
posted @ 2026-03-27 09:22 tgltt
阅读(41)
评论(0)
推荐(0)
Sweep AI概述
摘要: Sweep AI的目标是取代码初级程序员(Junior Developer),可以根据需求或bug描述,自动从GitHub上拉取工程源码,将需求或bug描述自动转换为相应的代码改动,从而实现需求开发或bug修复,当然都是些简单的需求和bug,因这个工具的核心能力依赖ChatGPT-4,所以并没有试用
阅读全文
posted @ 2026-03-27 09:21 tgltt
阅读(43)
评论(0)
推荐(0)
大模型排查代码问题的制约因素
摘要: 1、输入长度 理论上,大模型是可以从工程总体角度去分析多线程问题,但现实是现在的大模型,对输入长度是有限制的,尤其开源大模型,其最大长度一般<=128K个token,换算为字符数,大约是512K个字符,而商用的软件系统,随便一个工程,甚至其一个功能模块都可能远超512K个字符,因此,需要寻找一个能够
阅读全文
posted @ 2026-03-27 09:20 tgltt
阅读(5)
评论(0)
推荐(0)
下一页
公告