摘要: 我们可以从数学建模的角度,对比自回归语言模型(AR)与扩散语言模型(DLM)在文本生成任务中的核心机制和损失函数设计。 📐 数学模型对比:AR vs DLM 模型类型 数学建模方式 损失函数 生成方式 上下文建模 AR 模型 条件概率链式分解:\(P(x_1, x_2, ..., x_T) = \ 阅读全文
posted @ 2025-08-11 14:47 ffl 阅读(3) 评论(0) 推荐(0)
摘要: 原文:https://research.google/blog/achieving-10000x-training-data-reduction-with-high-fidelity-labels/ 这篇文章来自 Google Research,标题为《Achieving 10,000x train 阅读全文
posted @ 2025-08-08 22:17 ffl 阅读(13) 评论(0) 推荐(0)
摘要: 背景:Deepseek里用算术平均来作为价值函数的替代,后面有人用几何平均改进了训练的稳定性。微博 @马少平 THU 转评:“几何平均对极值不敏感”,我们找AI给个实际的对比: 我们来用实际例子对比一下算术平均和几何平均在面对极值时的表现差异。 ⚖️ 定义回顾 类型 计算方式 对极值敏感性 算术平均 阅读全文
posted @ 2025-08-06 18:42 ffl 阅读(3) 评论(0) 推荐(0)
摘要: AI味浓厚的文章: “代码不是资产”这句话在技术圈里常被引用,背后其实是对**价值创造**和**长期可持续性**的反思。 ### 🧱 为什么有人说“代码不是资产”? 这句话的核心观点是:**代码本身并不具备长期价值,只有它所承载的知识、结构和能力才是资产。** #### 🔍 原因包括: - ** 阅读全文
posted @ 2025-08-06 18:03 ffl 阅读(4) 评论(0) 推荐(0)
摘要: 单向门:易于验证非常重要 https://www.jasonwei.net/blog/asymmetry-of-verification-and-verifiers-law 阅读全文
posted @ 2025-07-22 23:03 ffl 阅读(15) 评论(0) 推荐(0)
摘要: 原文:https://arxiv.org/html/2507.13334v2 Context Engineering 的优化目标公式 \[\mathcal{F}^* = \arg\max_{\mathcal{F}} \mathbb{E}_{\tau \sim \mathcal{T}} \left[ 阅读全文
posted @ 2025-07-22 23:00 ffl 阅读(61) 评论(0) 推荐(0)
摘要: 原文:https://www.trivialorwrong.com//2016/06/08/machine-learning-literally.html AI改写的介绍如下: 🧠 Machine Learning in Hardware: 分支预测器的 MDP 学习过程详解 在机器学习的世界里, 阅读全文
posted @ 2025-07-22 17:45 ffl 阅读(15) 评论(0) 推荐(0)
摘要: 《Context Engineering for AI Agents: Lessons from Building Manus》深入探讨了如何通过上下文设计优化 AI Agent 的性能。以下是左侧内容的摘要: 原文:https://manus.im/blog/Context-Engineering 阅读全文
posted @ 2025-07-22 16:11 ffl 阅读(89) 评论(0) 推荐(0)
摘要: https://github.com/pollen-robotics/AmazingHand 阅读全文
posted @ 2025-07-17 23:41 ffl 阅读(42) 评论(0) 推荐(0)
摘要: 你的表述涉及到数学中的递推关系,特别是神经网络中的反向传播(Backpropagation, BP)和强化学习中的贝尔曼(Bellman)递推。让我来整理并澄清一下你的问题,并提供一个简洁且准确的解答。 1. 数学中的递推关系 在数学中,递推关系(recurrence relation)通常描述一个 阅读全文
posted @ 2025-07-16 01:29 ffl 阅读(11) 评论(0) 推荐(0)
摘要: PyRoki 是加州大学伯克利分校发布的一款模块化、可扩展、跨平台的机器人运动学优化工具包 论文:https://arxiv.org/pdf/2505.03728 git: https://pyroki-toolkit.github.io/ PyRoki 支持: 任务:逆运动学(IK)、轨迹优化、动 阅读全文
posted @ 2025-07-09 10:15 ffl 阅读(55) 评论(0) 推荐(0)
摘要: 074d75a (HEAD -> master, origin/master, origin/HEAD) fix number format and delete some redundancy text ca5db93 fix quote style ad28d53 remove links pd 阅读全文
posted @ 2025-07-08 13:21 ffl 阅读(9) 评论(0) 推荐(0)
摘要: 我们来从源码设计和模型抽象两个层面详细拆解: 🎯 llama.cpp 是针对 Transformer 的专用推理引擎,而非通用神经网络框架 ✅ 它不是 PyTorch 或 TensorFlow: 不支持任意 DAG(计算图)结构; 不支持自定义层(如 RNN、CNN、Capsule Net); 不 阅读全文
posted @ 2025-07-07 22:31 ffl 阅读(37) 评论(0) 推荐(0)
摘要: Ollama 能让你“一键启动”不同的大语言模型(LLaMA、Mistral、Command-R、Gemma…),听起来像魔法,其实背后靠的是一套标准化的模型封装与调度机制。 🧠 为什么这可行?核心机制解析 Ollama 能统一管理不同 LLM,关键靠以下三点: 1. 通用权重格式(.gguf) 阅读全文
posted @ 2025-07-07 22:24 ffl 阅读(39) 评论(0) 推荐(0)
摘要: 除了 .gguf 和 .modelfile,一个完整的 Ollama 模型构建环境可能还会涉及以下几种文件类型或资源结构: 📁 常见文件 / 资源类型一览 1. 模型权重类 .gguf:主权重文件(包含量化后的模型张量与结构信息) .bin(旧格式,如 ggml):老版本的权重文件,不推荐新项目使 阅读全文
posted @ 2025-07-07 22:19 ffl 阅读(64) 评论(0) 推荐(0)
摘要: 上一篇:https://www.cnblogs.com/math/p/18971656/physics-deep-learning-01 原文:http://physicsbaseddeeplearning.org/intro-teaser.html 以下是《A Teaser Example — P 阅读全文
posted @ 2025-07-07 21:48 ffl 阅读(10) 评论(0) 推荐(0)
摘要: 一步步推导为什么监督学习在多值输出问题中会出现“平均化”现象,以平方根反解问题为例: 🧪 问题设定(平方根反解) 我们要学一个函数 f:[0,1]R,满足: P(f(x))=f(x)2=x这意味着每个 \(x \in [0 阅读全文
posted @ 2025-07-07 21:39 ffl 阅读(6) 评论(0) 推荐(0)
摘要: 原文: https://docs.google.com/document/d/1JU8w-E4LlseFZm-ag22GSBU5A2rp2nb7iFGBNAbFL7k/mobilebasic 上下文工程指南 由 DAIR.AI 学院提供 目录 什么是上下文工程? 上下文工程实践 系统提示 指令 用户 阅读全文
posted @ 2025-07-06 06:10 ffl 阅读(722) 评论(0) 推荐(0)
摘要: 🎯 本文将带你一步步构建一个兼容 PEP 标准、快如闪电、结构清晰、测试完善的 Python 工程体系,替代 pip、setuptools、conda、setup.py 等传统方式。整合 uv + pyproject.toml + ruff + pytest + coverage 一体化开发体验。 阅读全文
posted @ 2025-07-03 21:16 ffl 阅读(354) 评论(0) 推荐(0)
摘要: 论文:Hilbert’s Sixth Problem: derivation of fluid equations via Boltzmann’s kinetic theory 原文:https://arxiv.org/html/2503.01800v1 这篇论文《Hilbert’s Sixth P 阅读全文
posted @ 2025-07-02 23:47 ffl 阅读(58) 评论(0) 推荐(0)
摘要: Q:这样的一个组合,看上去一点都不难,左侧论文的价值在哪? A: 这是一个非常尖锐而深刻的问题,Feilong。你已经用实战demo快速搭出一个看似完整的多Agent+工具调用系统,这正体现出你洞察本质的能力。而这也恰恰凸显了《Towards AI Search Paradigm》这篇论文的真正价值 阅读全文
posted @ 2025-07-02 23:06 ffl 阅读(49) 评论(0) 推荐(0)
摘要: 打造一个基于论文《Towards AI Search Paradigm》的结构化搜索系统原型,结合你提到的 PocketFlow 框架理念:轻量、模块化、可扩展。我们将用 Python + Prompt Routing + DAG 任务规划复现一个小型版本,包括 Master、Planner、Exe 阅读全文
posted @ 2025-07-02 23:05 ffl 阅读(39) 评论(0) 推荐(0)
摘要: 原文:https://arxiv.org/html/2506.17188v1 深入这篇论文《Towards AI Search Paradigm》的核心思想,从系统能力和关键创新的角度做进一步提炼和总结: 🧭 总体愿景:从关键词搜索到类人“认知搜索” 该论文提出:传统搜索(Web Search → 阅读全文
posted @ 2025-07-02 23:04 ffl 阅读(99) 评论(0) 推荐(0)
摘要: https://github.com/Netflix-Skunkworks/uda/tree/main/uda-intro-blog Netflix 的 UDA GitHub 仓库(Netflix-Skunkworks/uda)目前更像是一个用于配合博客的静态示例集,而不是一个真正可落地的工具库。我 阅读全文
posted @ 2025-07-02 17:00 ffl 阅读(17) 评论(0) 推荐(0)
摘要: 建一个完整的、从建模定义到多系统映射使用的 UDA 全流程例子,以 Netflix 的经典业务概念 “演员(Actor)” 为主线,让你看到 UDA 是如何“建模一次,处处使用”的。 🎬 场景背景:跨系统表达 “演员” 的信息 Netflix 内部系统中,关于演员的信息存在多个碎片: 企业 Gra 阅读全文
posted @ 2025-07-02 16:57 ffl 阅读(8) 评论(0) 推荐(0)
摘要: 原文:https://netflixtechblog.com/uda-unified-data-architecture-6a6aee261d8d 下面是 Netflix 的 UDA(Unified Data Architecture)从定义到实际投影与使用的完整流程,提炼为一条贯通的“语义驱动架构 阅读全文
posted @ 2025-07-02 16:54 ffl 阅读(18) 评论(0) 推荐(0)
摘要: PocketFlow 是一个 100 行的极简 LLM 框架,用于构建智能体、任务分解、RAG 等应用。本指南将通过循序渐进的方式,带你深度理解其核心设计并学会构建各种 AI 应用。 pip install pocketflow 目录 核心概念 基础应用 进阶模式 实战项目 核心概念 1. 核心抽象 阅读全文
posted @ 2025-07-02 14:21 ffl 阅读(102) 评论(0) 推荐(0)
摘要: 5分钟快速上手 1. 安装和设置 # 克隆项目 git clone https://github.com/the-pocket/PocketFlow.git cd PocketFlow # 安装依赖 pip install -r requirements.txt # 设置环境变量 export OP 阅读全文
posted @ 2025-07-02 14:19 ffl 阅读(70) 评论(0) 推荐(0)
摘要: Stevey's Google Platforms Rant I was at Amazon for about six and a half years, and now I've been at Google for that long. One thing that struck me imm 阅读全文
posted @ 2025-07-01 19:41 ffl 阅读(11) 评论(0) 推荐(0)
摘要: 原文:x.com/s6juncheng/status/1937873856212996257 作者:Jun Cheng Excited to share #AlphaGenome, a start of our AlphaGenome named journey to decipher the re 阅读全文
posted @ 2025-06-27 22:01 ffl 阅读(70) 评论(0) 推荐(0)
摘要: 原文:https://read.engineerscodex.com/p/how-cursor-indexes-codebases-fast 当然,以下是对你提供的文章《How Cursor Indexes Codebases Fast》的中文翻译摘要,尽量保留技术细节并适配开发者语境: 🧠 Cu 阅读全文
posted @ 2025-06-27 12:02 ffl 阅读(143) 评论(0) 推荐(0)
摘要: URL 来源: http://agentic-coding.github.io/ 概述 本仓库分享"智能体编程6原则28实践",旨在帮助使用AI编程助手的开发者从"直觉编程迈向智能体编程"。目标是为开发者提供具体指导方针,以充分发挥生成式AI和编程助手的强大能力,在最大化开发效率的同时,有效管控潜在 阅读全文
posted @ 2025-06-19 21:32 ffl 阅读(98) 评论(0) 推荐(0)
摘要: Q(Me): 其实我想尝试的是,使用 markdown 给 LLM 写提示词的时候,整个提示词,无论多长,LLM能从头读到尾巴,就累积得到了它想要知道的信息,然后就开始回答用户。这样符合 llm 的 next token的线性逻辑。如果 llm 需要在前面的时候阅读后面才出现的信息,这个感觉是可以的 阅读全文
posted @ 2025-06-13 17:04 ffl 阅读(28) 评论(0) 推荐(0)
摘要: 本文由人类与AI讨论并合成 在构建现代 Python 应用时,数据结构的定义和 JSON 交互能力是核心基础。本文将系统讲解 Python 原生的 @dataclass 与增强工具库 @dataclass_json 的使用方法、功能对比、典型陷阱和高级技巧,助你写出更健壮、可维护、易调试的数据驱动代 阅读全文
posted @ 2025-06-13 10:25 ffl 阅读(155) 评论(0) 推荐(0)
摘要: 在AI的加持下,可擦除的类型有优势,例如 Python 的 dataclass/dataclass_json, 以及TypeScript 对于 JS 的外置类型。这是因为: 编程语言的类型写给人/AI/编译器三种角色看的。人用来理解结构,AI用来理解上下文,编译器用来卡通过。 编译器检查太严格,会失 阅读全文
posted @ 2025-06-12 22:28 ffl 阅读(16) 评论(0) 推荐(0)
摘要: 本文由AI翻译 原文链接:https://blog.robertelder.org/interfaces-most-important-software-engineering-concept/ 发布时间:2016-02-01 (最后更新:2016-09-29) 作者:Robert Elder 摘要 阅读全文
posted @ 2025-06-11 12:04 ffl 阅读(294) 评论(0) 推荐(0)
摘要: 本文由AI翻译 URL来源:https://www.joanwestenberg.com/smart-people-dont-chase-goals-they-create-limits/ 发布时间:2025-06-09T23:45:42.000Z Markdown内容: 几年前,我和一个朋友在深夜 阅读全文
posted @ 2025-06-10 16:40 ffl 阅读(53) 评论(0) 推荐(0)
摘要: 注释:本文用AI阅读3篇相关的博客,摘要归纳。 摘要 随着大语言模型(LLMs)在各个领域的广泛应用,如何优化内容格式以提升AI性能成为关键议题。本文基于多项研究和实践案例,系统分析了Markdown作为LLM友好格式的核心优势,并提供了具体的应用指导。研究表明,相比传统的JSON、XML或HTML 阅读全文
posted @ 2025-06-10 15:29 ffl 阅读(135) 评论(0) 推荐(0)
摘要: 本文由AI翻译 来源网址: https://maxime.ly/articles/ai-native-product-os-principles/ Markdown 内容: 想象一下:AI 代理坐在你的组织结构图中,不是作为助手,而是作为实际的开发者。听起来很疯狂?这正是我们在 MadKudu 所做 阅读全文
posted @ 2025-06-05 21:53 ffl 阅读(29) 评论(0) 推荐(0)
摘要: 本文由博主编写 Cursor Remote-SSH 安装之前的重置/清理 问题:原来安装的是 VSCode 的 Remote-SSH,安装 Cursor 后不可用。或者 Cursor 升级到新版本后 Remote-SSH 不可用。 解决:彻底清理不可用版本的残留信息: 在远程主机上,查找到 vsco 阅读全文
posted @ 2025-06-05 17:14 ffl 阅读(3686) 评论(0) 推荐(0)
点击右上角即可分享
微信分享提示