tgltt - 博客园

2026年6月2日

摘要： 1、概述清华大学推出的开源K线模型Kronos，是第一款金融领域的K线基础大模型。其提出将K线token化的方法，值得借鉴和研究。 2、总体流程图1 描述了Kronos将K线token化的流程，包含两个阶段：第一个阶段，将K线抽象为open、close、high、low四个特征，然后经由Enco 阅读全文

posted @ 2026-06-02 16:23 tgltt 阅读(22) 评论(0) 推荐(0)

2026年3月30日

NPU环境安装部署GOT及初步测试OCR2.0效果

摘要：一、 GOT安装环境 1、环境搭建 GOT安装需要依赖Python 3.10，且相关依赖包版本如下： torch==2.0.1 torchvision==0.15.2 transformers==4.37.2 tiktoken==0.6.0 verovio==4.3.1 accelerate==0. 阅读全文

posted @ 2026-03-30 16:56 tgltt 阅读(32) 评论(0) 推荐(0)

2026年3月27日

dify使用&RAG开发指南(保姆级攻略)

摘要：一、访问Dify 在浏览器中访问http://XXX.XXX.XXX.XXX/apps，然后使用账号信息登录图1。图1 Dify登录界面成功登录后，可看到图2Dify工作室界面。图2 Dify工作室二、构建RAG应用 2.1构建知识库点击图2上方的知识库标签，可看到图3中的知识库标签页。阅读全文

posted @ 2026-03-27 16:03 tgltt 阅读(202) 评论(0) 推荐(0)

Agent原理

摘要：本文阐述的Agent是浅层Agent，是一种通过ReAct方式进行推理的LLM执行方式，即LLM推理一次，然后观察推理结果，再决定下一步做什么，必要是会调用外部工具获取相应的数据，并补充到提示词里，是一种走一步、看一步的执行方式，有别于工作流那种预规划工作流的深层agent。 1. Agent的实阅读全文

posted @ 2026-03-27 15:03 tgltt 阅读(71) 评论(0) 推荐(0)

基于LLM的问数方案

摘要：方案有以下两种： - 以NL2SQL为核心即LLM根据用户指令生成SQL，然后SQL查询数据库，再将查到的数据生成图表，此种方案需LLM生成问数所需数据的SQL，因此其扩展性比较差，尤其在多表查询时性能较差，经常陷于生成SQL错误纠正的旋涡; - 以NL2Semantic2SQL为核心，即LLM 阅读全文

posted @ 2026-03-27 14:33 tgltt 阅读(37) 评论(0) 推荐(0)

RAG知识库原理

摘要：一、如何与LLM交互？绝大多数的交互场景，用户向LLM提出一个Question，LLM返回一个Answer。二、LLM的局限—无法更新自身知识 LLM一旦训练完成并发布后，其自身所拥有的知识，无法与时俱进。三、如何弥补LLM无法更新自身知识的局限？原因 LLM自身知识无法与时俱进，是由于LL 阅读全文

posted @ 2026-03-27 14:31 tgltt 阅读(96) 评论(0) 推荐(0)

Palantir本体论(Ontology)

摘要： 1、本体论(Ontology)为何大行其道？将企业软件系统的设计理念，从传统的“以数据为中心”，转向了“以决策为中心”，因为企业或组织存续的本质，是在内外部环境瞬息万变的挑战下，持续执行最有效的决策。构成决策的三大要素：数据(Data) 做出决策所依据的信息。逻辑(Logic) 评估和推理决阅读全文

posted @ 2026-03-27 09:25 tgltt 阅读(1840) 评论(0) 推荐(0)

深度学习概述

摘要：一、神经网络(Neural Network, NN) 深度学习的理论基础是神经网络，而神经网络的基本组成单元是神经元，这些概念都是借鉴于生物学中的神经网络的概念，神经元是人体神经系统的基本组成单元，神经系统包含脑、脊髓等，这些组织是人体的控制系统，控制着人的生理、心理活动，而AI仿生的是人脑，作为机阅读全文

posted @ 2026-03-27 09:24 tgltt 阅读(35) 评论(0) 推荐(0)

大模型实践基础

摘要：一、如何获取大模型？基于大模型开发应用，首先要获取到大模型的权重文件文件，然后部署大模型，再基于大模型开发上层应用。业内目前使用大模型有两类方式: 第一类方式，基于各大模型厂商提供的API，以免费或计费的方式调用大模型，这类方式最简单，但可能需要一定的费用。第二类方式，在三方托管平台或其他途径阅读全文

posted @ 2026-03-27 09:22 tgltt 阅读(91) 评论(0) 推荐(0)

Sweep AI概述

摘要： Sweep AI的目标是取代码初级程序员(Junior Developer)，可以根据需求或bug描述，自动从GitHub上拉取工程源码，将需求或bug描述自动转换为相应的代码改动，从而实现需求开发或bug修复，当然都是些简单的需求和bug，因这个工具的核心能力依赖ChatGPT-4，所以并没有试用阅读全文

posted @ 2026-03-27 09:21 tgltt 阅读(74) 评论(0) 推荐(0)

公告