上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 156 下一页
摘要: 检索增强生成(RAG)早已不是简单的向量相似度匹配加 LLM 生成这一套路。LongRAG、Self-RAG 和 GraphRAG 代表了当下工程化的技术进展,它们各可以解决不同的实际问题。 传统 RAG 的核心限制 标准的 RAG 流程大概是这样的:把文档分割成小块、向量化、通过余弦相似度检索、喂 阅读全文
posted @ 2025-11-22 23:26 deephub 阅读(20) 评论(0) 推荐(0)
摘要: CrewAI是一个可以专门用来编排自主 AI 智能体(Autonomous AI Agents) 的Python 框架,你可以把它理解为在代码层面组建一个“虚拟团队”,给每个 Agent 分配特定的角色、目标,让它们协同处理那些单个 LLM 搞不定的复杂任务。 https://avoid.overf 阅读全文
posted @ 2025-11-21 19:49 deephub 阅读(24) 评论(0) 推荐(0)
摘要: 深度学习模型参数量和训练数据集的爆炸式增长,以 Llama 3.1 为例:4050 亿参数、15.6 万亿 token 的训练量,如果仅靠单 GPU可能需要数百年才能跑完,或者根本无法加载模型。 并行计算(Parallelism)通过将训练任务分发到多个 GPU(单机多卡或多机多卡),并利用通信原语 阅读全文
posted @ 2025-11-20 21:59 deephub 阅读(19) 评论(0) 推荐(0)
摘要: 在软件开发领域,提到轻量级、嵌入式的本地数据库,我们首先会想到 SQLite,它快速且无需独立服务进程。现在检索增强生成(RAG)和向量数据库的世界里,一个定位相似的新工具出现了。你可以把LEANN看作是嵌入式、轻量级的向量数据库。它完全不需要依赖庞大的数据中心或者 GPU 集群。一个个人专属的 R 阅读全文
posted @ 2025-11-19 21:22 deephub 阅读(26) 评论(0) 推荐(0)
摘要: 很多人把 groupby 理解成单纯的求和、计数这类操作,比如说算算总收入、数数用户量,然后就没了。实际上它的应用场景要广得多:计算组内特征、数据标准化、构造滚动指标、合并不同维度的统计结果,甚至处理一些复杂的嵌套数据结构。 所以本文将介绍10个实际工作中比较有用的技巧,文章的代码都是可以直接拿来用 阅读全文
posted @ 2025-11-18 20:42 deephub 阅读(19) 评论(0) 推荐(0)
摘要: 这几天好像这个叫 TOON 的东西比较火,我们这篇文章来看看他到底是什么,又有什么作用。TOON 全称 Token-Oriented Object Notation,它主要解决的问题就是当你把JSON 输入给LLM 的时候,token 消耗太高了。一个长 JSON 数组扔进模型token 计数直接起 阅读全文
posted @ 2025-11-17 21:45 deephub 阅读(41) 评论(0) 推荐(0)
摘要: Python 3.14 引入的改进大多数都很细微,但这些小变化会让代码写起来更流畅,运行也更稳定。本文整理了 10 个实用的特性改进,每个都配了代码示例。 https://avoid.overfit.cn/post/8312efd2a1e94496be1c636ab538cb38 阅读全文
posted @ 2025-11-16 22:26 deephub 阅读(14) 评论(0) 推荐(0)
摘要: 处理大数据集或者生成报告、创建中间文件的时候,很多文件其实根本不需要永久保存。这时候可以用临时目录来解决这个问题。Python 标准库里的 tempfile 模块能创建用完就自动消失的临时文件和目录,省去手动清理的麻烦。临时目录就是个生命周期很短的文件夹,专门用来存放那些不需要长期保留的数据。用完之 阅读全文
posted @ 2025-11-15 21:14 deephub 阅读(11) 评论(0) 推荐(0)
摘要: 模型训练完能够到达85%的准确率,很多人觉得就差不多了。但是通过超参数优化能让模型释放真正的潜力。最后那3-5个点的提升,往往决定了你的模型是"还行"还是"能打"。这篇文章会把Grid Search和Random Search这两种最常用的超参数优化方法进行详细的解释。从理论到数学推导,从优缺点到实 阅读全文
posted @ 2025-11-14 22:16 deephub 阅读(18) 评论(0) 推荐(0)
摘要: 搞过量化交易的人都清楚,测试策略的时候流程能有多乱:Pandas 管数据、Matplotlib 画图、Backtrader 跑回测,最后还要再用 Excel 做汇总。本来想简单验证个想法,结果工具链越搞越复杂,最后自己都不知道在干什么了。 QF-Lib(Quantitative Finance Li 阅读全文
posted @ 2025-11-13 19:58 deephub 阅读(31) 评论(0) 推荐(0)
上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 156 下一页