ffl - 博客园

2025年8月11日

DLM(Diffusion Language Model) vs AR(Autoregressive)

摘要：我们可以从数学建模的角度，对比自回归语言模型（AR）与扩散语言模型（DLM）在文本生成任务中的核心机制和损失函数设计。 📐 数学模型对比：AR vs DLM 模型类型数学建模方式损失函数生成方式上下文建模 AR 模型条件概率链式分解：\(P(x_1, x_2, ..., x_T) = \ 阅读全文

posted @ 2025-08-11 14:47 ffl 阅读(3) 评论(0) 推荐(0)

2025年8月8日

标注的原理：少而完备，监督模型训练的根本

摘要：原文：https://research.google/blog/achieving-10000x-training-data-reduction-with-high-fidelity-labels/ 这篇文章来自 Google Research，标题为《Achieving 10,000x train 阅读全文

posted @ 2025-08-08 22:17 ffl 阅读(13) 评论(0) 推荐(0)

2025年8月6日

几何平均比算术平均对极值不敏感。

摘要：背景：Deepseek里用算术平均来作为价值函数的替代，后面有人用几何平均改进了训练的稳定性。微博 @马少平 THU 转评：“几何平均对极值不敏感”，我们找AI给个实际的对比：我们来用实际例子对比一下算术平均和几何平均在面对极值时的表现差异。 ⚖️ 定义回顾类型计算方式对极值敏感性算术平均阅读全文

posted @ 2025-08-06 18:42 ffl 阅读(3) 评论(0) 推荐(0)

对比理解：什么是AI味浓厚的文章？

摘要： AI味浓厚的文章： “代码不是资产”这句话在技术圈里常被引用，背后其实是对**价值创造**和**长期可持续性**的反思。 ### 🧱 为什么有人说“代码不是资产”？这句话的核心观点是：**代码本身并不具备长期价值，只有它所承载的知识、结构和能力才是资产。** #### 🔍 原因包括： - ** 阅读全文

posted @ 2025-08-06 18:03 ffl 阅读(4) 评论(0) 推荐(0)

2025年7月22日

重要文章：Asymmetry of verification and verifier’s law

摘要：单向门：易于验证非常重要 https://www.jasonwei.net/blog/asymmetry-of-verification-and-verifiers-law 阅读全文

posted @ 2025-07-22 23:03 ffl 阅读(15) 评论(0) 推荐(0)

AI关键摘要：A Survey of Context Engineering for Large Language Models

摘要：原文：https://arxiv.org/html/2507.13334v2 Context Engineering 的优化目标公式 \[\mathcal{F}^* = \arg\max_{\mathcal{F}} \mathbb{E}_{\tau \sim \mathcal{T}} \left[ 阅读全文

posted @ 2025-07-22 23:00 ffl 阅读(61) 评论(0) 推荐(0)

AI理解阅读技术文章：《Machine Learning. Literally》

摘要：原文：https://www.trivialorwrong.com//2016/06/08/machine-learning-literally.html AI改写的介绍如下： 🧠 Machine Learning in Hardware: 分支预测器的 MDP 学习过程详解在机器学习的世界里，阅读全文

posted @ 2025-07-22 17:45 ffl 阅读(15) 评论(0) 推荐(0)

AI摘要：Context Engineering for AI Agents: Lessons from Building Manus

摘要：《Context Engineering for AI Agents: Lessons from Building Manus》深入探讨了如何通过上下文设计优化 AI Agent 的性能。以下是左侧内容的摘要：原文：https://manus.im/blog/Context-Engineering 阅读全文

posted @ 2025-07-22 16:11 ffl 阅读(89) 评论(0) 推荐(0)

2025年7月17日

机械臂：AmazingHand

摘要： https://github.com/pollen-robotics/AmazingHand 阅读全文

posted @ 2025-07-17 23:41 ffl 阅读(42) 评论(0) 推荐(0)

2025年7月16日

最优化:从未来优化到过去

摘要：你的表述涉及到数学中的递推关系，特别是神经网络中的反向传播（Backpropagation, BP）和强化学习中的贝尔曼（Bellman）递推。让我来整理并澄清一下你的问题，并提供一个简洁且准确的解答。 1. 数学中的递推关系在数学中，递推关系（recurrence relation）通常描述一个阅读全文

posted @ 2025-07-16 01:29 ffl 阅读(11) 评论(0) 推荐(0)

2025年7月9日

机器人开发:PyRoki

摘要： PyRoki 是加州大学伯克利分校发布的一款模块化、可扩展、跨平台的机器人运动学优化工具包论文：https://arxiv.org/pdf/2505.03728 git: https://pyroki-toolkit.github.io/ PyRoki 支持：任务：逆运动学（IK）、轨迹优化、动阅读全文

posted @ 2025-07-09 10:15 ffl 阅读(55) 评论(0) 推荐(0)

2025年7月8日

存档：8年前编辑《物理之美》的git记录

摘要： 074d75a (HEAD -> master, origin/master, origin/HEAD) fix number format and delete some redundancy text ca5db93 fix quote style ad28d53 remove links pd 阅读全文

posted @ 2025-07-08 13:21 ffl 阅读(9) 评论(0) 推荐(0)

2025年7月7日

ollama如何运行(3): llama.cpp是通用神经网络推理还是transformer解码器专用结构？

摘要：我们来从源码设计和模型抽象两个层面详细拆解： 🎯 llama.cpp 是针对 Transformer 的专用推理引擎，而非通用神经网络框架 ✅ 它不是 PyTorch 或 TensorFlow：不支持任意 DAG（计算图）结构；不支持自定义层（如 RNN、CNN、Capsule Net）；不阅读全文

posted @ 2025-07-07 22:31 ffl 阅读(37) 评论(0) 推荐(0)

ollama如何运行(2):模型中立的运行时（内核是llama.cpp)

摘要： Ollama 能让你“一键启动”不同的大语言模型（LLaMA、Mistral、Command-R、Gemma…），听起来像魔法，其实背后靠的是一套标准化的模型封装与调度机制。 🧠 为什么这可行？核心机制解析 Ollama 能统一管理不同 LLM，关键靠以下三点： 1. 通用权重格式（.gguf）阅读全文

posted @ 2025-07-07 22:24 ffl 阅读(39) 评论(0) 推荐(0)

ollama如何运行(1): gguf+.modelfile+tokenizer.json+vocab.txt

摘要：除了 .gguf 和 .modelfile，一个完整的 Ollama 模型构建环境可能还会涉及以下几种文件类型或资源结构： 📁 常见文件 / 资源类型一览 1. 模型权重类 .gguf：主权重文件（包含量化后的模型张量与结构信息） .bin（旧格式，如 ggml）：老版本的权重文件，不推荐新项目使阅读全文

posted @ 2025-07-07 22:19 ffl 阅读(64) 评论(0) 推荐(0)

物理深度学习（2）通过`生成建模`解决监督学习平均化问题

摘要：上一篇：https://www.cnblogs.com/math/p/18971656/physics-deep-learning-01 原文：http://physicsbaseddeeplearning.org/intro-teaser.html 以下是《A Teaser Example — P 阅读全文

posted @ 2025-07-07 21:48 ffl 阅读(10) 评论(0) 推荐(0)

物理深度学习（1）监督学习平均化问题

摘要：一步步推导为什么监督学习在多值输出问题中会出现“平均化”现象，以平方根反解问题为例： 🧪 问题设定（平方根反解）我们要学一个函数

f : [0, 1] \to R

，满足：

P (f (x)) = f (x)^{2} = x

这意味着每个 \(x \in [0 阅读全文

posted @ 2025-07-07 21:39 ffl 阅读(6) 评论(0) 推荐(0)

2025年7月6日

【AI翻译】上下文工程指南(Context Engineering Guide )

摘要：原文: https://docs.google.com/document/d/1JU8w-E4LlseFZm-ag22GSBU5A2rp2nb7iFGBNAbFL7k/mobilebasic 上下文工程指南由 DAIR.AI 学院提供目录什么是上下文工程？上下文工程实践系统提示指令用户阅读全文

posted @ 2025-07-06 06:10 ffl 阅读(722) 评论(0) 推荐(0)

2025年7月3日

【5分钟教程】用 `uv` 构建现代 Python 项目：从目录结构到打包测试一条龙

摘要： 🎯 本文将带你一步步构建一个兼容 PEP 标准、快如闪电、结构清晰、测试完善的 Python 工程体系，替代 pip、setuptools、conda、setup.py 等传统方式。整合 uv + pyproject.toml + ruff + pytest + coverage 一体化开发体验。阅读全文

posted @ 2025-07-03 21:16 ffl 阅读(354) 评论(0) 推荐(0)

2025年7月2日

【论文阅读】Hilbert 第六问题：从牛顿力学严格导出流体力学的偏微分方程（PDEs）

摘要：论文：Hilbert’s Sixth Problem: derivation of fluid equations via Boltzmann’s kinetic theory 原文：https://arxiv.org/html/2503.01800v1 这篇论文《Hilbert’s Sixth P 阅读全文

posted @ 2025-07-02 23:47 ffl 阅读(58) 评论(0) 推荐(0)

【论文阅读】Towards AI Search Paradigm - 论文的价值点？

摘要： Q：这样的一个组合，看上去一点都不难，左侧论文的价值在哪？ A：这是一个非常尖锐而深刻的问题，Feilong。你已经用实战demo快速搭出一个看似完整的多Agent+工具调用系统，这正体现出你洞察本质的能力。而这也恰恰凸显了《Towards AI Search Paradigm》这篇论文的真正价值阅读全文

posted @ 2025-07-02 23:06 ffl 阅读(49) 评论(0) 推荐(0)

【论文阅读】Towards AI Search Paradigm - mock 例子

摘要：打造一个基于论文《Towards AI Search Paradigm》的结构化搜索系统原型，结合你提到的 PocketFlow 框架理念：轻量、模块化、可扩展。我们将用 Python + Prompt Routing + DAG 任务规划复现一个小型版本，包括 Master、Planner、Exe 阅读全文

posted @ 2025-07-02 23:05 ffl 阅读(39) 评论(0) 推荐(0)

【论文阅读】Towards AI Search Paradigm - 摘要

摘要：原文：https://arxiv.org/html/2506.17188v1 深入这篇论文《Towards AI Search Paradigm》的核心思想，从系统能力和关键创新的角度做进一步提炼和总结： 🧭 总体愿景：从关键词搜索到类人“认知搜索” 该论文提出：传统搜索（Web Search → 阅读全文

posted @ 2025-07-02 23:04 ffl 阅读(99) 评论(0) 推荐(0)

Netflix: UDA 公开仓库

摘要： https://github.com/Netflix-Skunkworks/uda/tree/main/uda-intro-blog Netflix 的 UDA GitHub 仓库（Netflix-Skunkworks/uda）目前更像是一个用于配合博客的静态示例集，而不是一个真正可落地的工具库。我阅读全文

posted @ 2025-07-02 17:00 ffl 阅读(17) 评论(0) 推荐(0)

Netflix: UDA 完整例子

摘要：建一个完整的、从建模定义到多系统映射使用的 UDA 全流程例子，以 Netflix 的经典业务概念 “演员（Actor）” 为主线，让你看到 UDA 是如何“建模一次，处处使用”的。 🎬 场景背景：跨系统表达 “演员” 的信息 Netflix 内部系统中，关于演员的信息存在多个碎片：企业 Gra 阅读全文

posted @ 2025-07-02 16:57 ffl 阅读(8) 评论(0) 推荐(0)

Netflix: UDA（Unified Data Architecture）介绍

摘要：原文：https://netflixtechblog.com/uda-unified-data-architecture-6a6aee261d8d 下面是 Netflix 的 UDA（Unified Data Architecture）从定义到实际投影与使用的完整流程，提炼为一条贯通的“语义驱动架构阅读全文

posted @ 2025-07-02 16:54 ffl 阅读(18) 评论(0) 推荐(0)

PocketFlow 循序渐进指南

摘要： PocketFlow 是一个 100 行的极简 LLM 框架，用于构建智能体、任务分解、RAG 等应用。本指南将通过循序渐进的方式，带你深度理解其核心设计并学会构建各种 AI 应用。 pip install pocketflow 目录核心概念基础应用进阶模式实战项目核心概念 1. 核心抽象阅读全文

posted @ 2025-07-02 14:21 ffl 阅读(102) 评论(0) 推荐(0)

PocketFlow 快速开始指南

摘要： 5分钟快速上手 1. 安装和设置 # 克隆项目 git clone https://github.com/the-pocket/PocketFlow.git cd PocketFlow # 安装依赖 pip install -r requirements.txt # 设置环境变量 export OP 阅读全文

posted @ 2025-07-02 14:19 ffl 阅读(70) 评论(0) 推荐(0)

2025年7月1日

【转载】Stevey's Google Platforms Rant

摘要： Stevey's Google Platforms Rant I was at Amazon for about six and a half years, and now I've been at Google for that long. One thing that struck me imm 阅读全文

posted @ 2025-07-01 19:41 ffl 阅读(11) 评论(0) 推荐(0)

2025年6月27日

【AI生物技术前沿】AlphaGenome

摘要：原文：x.com/s6juncheng/status/1937873856212996257 作者：Jun Cheng Excited to share #AlphaGenome, a start of our AlphaGenome named journey to decipher the re 阅读全文

posted @ 2025-06-27 22:01 ffl 阅读(70) 评论(0) 推荐(0)

【AI翻译】Cursor 如何高效索引代码库（Merkle 树 + 向量嵌入）

摘要：原文：https://read.engineerscodex.com/p/how-cursor-indexes-codebases-fast 当然，以下是对你提供的文章《How Cursor Indexes Codebases Fast》的中文翻译摘要，尽量保留技术细节并适配开发者语境： 🧠 Cu 阅读全文

posted @ 2025-06-27 12:02 ffl 阅读(143) 评论(0) 推荐(0)

2025年6月19日

【AI翻译】智能体编程原则与实践(Agentic Coding Principles & Practices)

摘要： URL 来源: http://agentic-coding.github.io/ 概述本仓库分享"智能体编程6原则28实践"，旨在帮助使用AI编程助手的开发者从"直觉编程迈向智能体编程"。目标是为开发者提供具体指导方针，以充分发挥生成式AI和编程助手的强大能力，在最大化开发效率的同时，有效管控潜在阅读全文

posted @ 2025-06-19 21:32 ffl 阅读(98) 评论(0) 推荐(0)

2025年6月13日

【思考】编写线性提示词？

摘要： Q(Me)：其实我想尝试的是，使用 markdown 给 LLM 写提示词的时候，整个提示词，无论多长，LLM能从头读到尾巴，就累积得到了它想要知道的信息，然后就开始回答用户。这样符合 llm 的 next token的线性逻辑。如果 llm 需要在前面的时候阅读后面才出现的信息，这个感觉是可以的阅读全文

posted @ 2025-06-13 17:04 ffl 阅读(28) 评论(0) 推荐(0)

Clean Code(4): 玩转 Python 的 @dataclass 与 @dataclass_json：从结构建模到 JSON 魔法

摘要：本文由人类与AI讨论并合成在构建现代 Python 应用时，数据结构的定义和 JSON 交互能力是核心基础。本文将系统讲解 Python 原生的 @dataclass 与增强工具库 @dataclass_json 的使用方法、功能对比、典型陷阱和高级技巧，助你写出更健壮、可维护、易调试的数据驱动代阅读全文

posted @ 2025-06-13 10:25 ffl 阅读(155) 评论(0) 推荐(0)

2025年6月12日

Clean Code(3): 在Python中使用dataclass/pydantic，而不是Dict/JSON做类型

摘要：在AI的加持下，可擦除的类型有优势，例如 Python 的 dataclass/dataclass_json, 以及TypeScript 对于 JS 的外置类型。这是因为：编程语言的类型写给人/AI/编译器三种角色看的。人用来理解结构，AI用来理解上下文，编译器用来卡通过。编译器检查太严格，会失阅读全文

posted @ 2025-06-12 22:28 ffl 阅读(16) 评论(0) 推荐(0)

2025年6月11日

【AI翻译】接口——软件工程中最重要的概念

摘要：本文由AI翻译原文链接：https://blog.robertelder.org/interfaces-most-important-software-engineering-concept/ 发布时间：2016-02-01 (最后更新：2016-09-29) 作者：Robert Elder 摘要阅读全文

posted @ 2025-06-11 12:04 ffl 阅读(294) 评论(0) 推荐(0)

2025年6月10日

【AI翻译】聪明人不追逐目标；他们创造限制(Smart People Don't Chase Goals; They Create Limits)

摘要：本文由AI翻译 URL来源：https://www.joanwestenberg.com/smart-people-dont-chase-goals-they-create-limits/ 发布时间：2025-06-09T23:45:42.000Z Markdown内容：几年前，我和一个朋友在深夜阅读全文

posted @ 2025-06-10 16:40 ffl 阅读(53) 评论(0) 推荐(0)

【AI阅读】Markdown：大语言模型的理想交互语言

摘要：注释：本文用AI阅读3篇相关的博客，摘要归纳。摘要随着大语言模型（LLMs）在各个领域的广泛应用，如何优化内容格式以提升AI性能成为关键议题。本文基于多项研究和实践案例，系统分析了Markdown作为LLM友好格式的核心优势，并提供了具体的应用指导。研究表明，相比传统的JSON、XML或HTML 阅读全文

posted @ 2025-06-10 15:29 ffl 阅读(135) 评论(0) 推荐(0)

2025年6月5日

【AI翻译】AI-Native 操作系统 (1/3): 原则 - Maxime.ly

摘要：本文由AI翻译来源网址: https://maxime.ly/articles/ai-native-product-os-principles/ Markdown 内容: 想象一下：AI 代理坐在你的组织结构图中，不是作为助手，而是作为实际的开发者。听起来很疯狂？这正是我们在 MadKudu 所做阅读全文

posted @ 2025-06-05 21:53 ffl 阅读(29) 评论(0) 推荐(0)

【人类】重新安装 cursor 的 Remote-SSH，以及 Remote-SSH 的脚本做了什么

摘要：本文由博主编写 Cursor Remote-SSH 安装之前的重置/清理问题：原来安装的是 VSCode 的 Remote-SSH，安装 Cursor 后不可用。或者 Cursor 升级到新版本后 Remote-SSH 不可用。解决：彻底清理不可用版本的残留信息：在远程主机上，查找到 vsco 阅读全文

posted @ 2025-06-05 17:14 ffl 阅读(3686) 评论(0) 推荐(0)

Feilong's Blog

捕捉极限技术，关注微博 @幻灰龙保持改变的能力，探索无尽的前沿

公告

搜索

我的标签

积分与排名

随笔档案 (270)

阅读排行榜

评论排行榜

最新评论