随笔分类 -  LLM

摘要:38K Stars 的 daily_stock_analysis:LLM 驱动的零成本股票分析系统,5 分钟部署 一个 Python 项目,2026 年 1 月才创建,5 个月攒了 38,848 Stars 和 37,525 Forks。在 GitHub Trending 上长期霸榜,被 Hello 阅读全文
posted @ 2026-05-26 10:00 iTech 阅读(10) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-26 Top 10 AI 技术要闻 Anthropic 发布 knowledge-work-plugins:知识工作场景的 Claude 插件集合 Anthropic 官方推出 knowledge-work-plugins 开源仓库,为 Claude 在知识工作场 阅读全文
posted @ 2026-05-26 07:16 iTech 阅读(8) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-25 Top 10 AI 技术要闻 DeepSeek Reasonix:高缓存效率与低成本的原生 AI 编码 Agent DeepSeek 发布了 Reasonix,这是一款原生 AI 编码 Agent,在 HN 上引发热议。其核心亮点在于极高的 KV Cache 阅读全文
posted @ 2026-05-25 07:13 iTech 阅读(38) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-24 Top 10 AI 技术要闻 StreetAI Memory:适用于 LLM 的持久化记忆方案,输入 Token 可减少高达 80% StreetAI Memory 是一个位于应用层与 LLM API 之间的持久化记忆中间件,使用 SQLite 存储对话数据 阅读全文
posted @ 2026-05-24 07:31 iTech 阅读(14) 评论(0) 推荐(0)
摘要:DeepSeek 刚做了一个让整个 LLM API 市场震动的决定:V4 Pro 的 75% 折扣永久化。 这不是限时促销。从 2026 年 5 月 31 日促销期结束后,V4 Pro 的定价将正式调整为原价的 1/4。一个支持 1M 上下文、具备推理能力、开源权重的旗舰模型,输入 $0.435/百 阅读全文
posted @ 2026-05-23 10:30 iTech 阅读(501) 评论(0) 推荐(0)
摘要:选模型的时候,你得开 OpenAI 定价页、Anthropic 定价页、Google 定价页、DeepSeek 定价页……每个页面排版不一样,单位不统一(有的是 1K token,有的是 1M token),还有的藏在文档深处。 Models.dev 把这件事标准化了。一个开源数据库,收录 130+ 阅读全文
posted @ 2026-05-23 10:24 iTech 阅读(24) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-23 Top 10 AI 技术要闻 Launch HN: Superset (YC P26) — Agent 时代的全新 IDE Superset 是 Y Combinator P26 批次孵化的一款专为 AI Agent 时代设计的集成开发环境。与传统 IDE 阅读全文
posted @ 2026-05-23 07:13 iTech 阅读(30) 评论(0) 推荐(0)
摘要:3.5 个月 4.3 万 Star:nanobot 凭什么成为最火的开源 AI Agent 2026 年 2 月 1 日,GitHub 上出现了一个新仓库。3 个半月后,它的 Star 数突破了 4.3 万,Fork 数超过 7500。 这个项目叫 nanobot,来自香港大学数据科学实验室(HKU 阅读全文
posted @ 2026-05-22 23:19 iTech 阅读(20) 评论(0) 推荐(0)
摘要:市面上的 AI 教程大多教你调 API。你学会了调 ChatGPT 的接口,却说不清 Attention 到底在算什么。你跟着教程跑通了 RAG,但让你解释 loss 曲线为什么震荡,你卡住了。 AI Engineering from Scratch 解决的正是这个断层。435 节课、20 个阶段、 阅读全文
posted @ 2026-05-22 21:12 iTech 阅读(47) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-22 Top 10 AI 技术要闻 OpenAI 模型推翻离散几何核心猜想,解决 80 年数学难题 OpenAI 宣布其内部通用推理模型成功推翻了 1946 年由数学家 Paul Erdős 提出的单位距离猜想(Unit Distance Conjecture), 阅读全文
posted @ 2026-05-22 07:24 iTech 阅读(34) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-21 Top 10 AI 技术要闻 Andrej Karpathy 官宣加入 Anthropic,重返大模型研发前线 OpenAI 联合创始人、前特斯拉 AI 总监 Andrej Karpathy 正式宣布加入 Anthropic。Karpathy 是深度学习领域 阅读全文
posted @ 2026-05-21 07:13 iTech 阅读(86) 评论(0) 推荐(0)
摘要:12-Factor Agents:从 21k Star 的开源项目看 AI Agent 的正确构建姿势 你有没有过这样的经历:用 LangChain 或 CrewAI 搭了个 Agent demo,效果惊艳,老板看了直说"上生产"。然后你花了两个月把它从 80% 的完成度推到 95%,却发现框架的抽 阅读全文
posted @ 2026-05-20 17:11 iTech 阅读(27) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-20 Top 10 AI 技术要闻 Anthropic 收购 Stainless:API 到 SDK 的自动化生成工具 Anthropic 宣布收购总部位于纽约的 Stainless 公司,该公司专注于从 API 规范自动生成类型安全的 SDK。Stainless 阅读全文
posted @ 2026-05-20 07:13 iTech 阅读(46) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-19 Top 10 AI 技术要闻 纯C#实现的GPT-2推理引擎,每个Token零内存分配 这个名为 Overfit 的开源项目用纯 C# 实现了 GPT-2 模型的推理引擎,最大亮点是每个 Token 生成过程中实现零内存分配。项目展示了在不依赖 Python 阅读全文
posted @ 2026-05-19 07:14 iTech 阅读(34) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-18 Top 10 AI 技术要闻 Zerostack:用纯 Rust 打造的 Unix 风格 AI 编码代理 Zerostack 是一个在 Hacker News 上引发广泛关注的全新开源编码代理项目,其核心设计灵感来源于 Unix 哲学——每个组件只做一件事并 阅读全文
posted @ 2026-05-18 07:14 iTech 阅读(128) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-17 Top 10 AI 技术要闻 TinySearch——为小型语言模型提供快速网络访问,避免上下文冗余 TinySearch 是一个开源项目,专为小型语言模型(SLM)设计的轻量级搜索工具。它解决了小模型在联网检索时面临的核心问题:传统 RAG 方案往往将大量 阅读全文
posted @ 2026-05-17 07:14 iTech 阅读(75) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-16 Top 10 AI 技术要闻 OpenAI Codex 正式登陆 ChatGPT 移动端,手机可远程控制 AI 编程任务 OpenAI 宣布 Codex 编码代理功能已正式集成到 ChatGPT 移动应用中,用户无需打开笔记本电脑即可通过手机远程监控和管理 阅读全文
posted @ 2026-05-16 07:13 iTech 阅读(124) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-15 Top 10 AI 技术要闻 Claude Code 推出 Agent View:一个人同时指挥十个 AI 写代码 Anthropic 为 Claude Code 发布了全新的 Agent View 功能,开发者可以通过一个界面同时管理多达 10 个 AI 阅读全文
posted @ 2026-05-15 07:13 iTech 阅读(80) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-14 Top 10 AI 技术要闻 Dead.letter (CVE-2026-45185):人类与 LLM 在 Exim 邮件服务器 RCE 漏洞发现中的巅峰对决 安全研究公司 Xbow 披露了一个影响广泛的 Exim 邮件服务器远程代码执行漏洞 CVE-202 阅读全文
posted @ 2026-05-14 07:20 iTech 阅读(41) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-13 Needle: 将 Gemini 工具调用能力蒸馏进 26M 参数模型 Needle 项目展示了一项令人瞩目的模型蒸馏成果——将 Google Gemini 的工具调用(Tool Calling)能力压缩到仅 26M 参数的微型模型中。这意味着开发者可以在资 阅读全文
posted @ 2026-05-13 17:11 iTech 阅读(130) 评论(0) 推荐(0)