玩一玩微软的 1 bit 模型:BitNet. 一个 CPU 就能跑起来的大模型
作者:张富春(ahfuzhang),转载时请注明作者和引用链接,谢谢! cnblogs博客 zhihu Github 公众号:一本正经的瞎扯 能不能用 1 个 CPU 加很少的内存就能把大模型跑起来? 微软开源的 BitNet (https://github.com/microsoft/BitNet ...
Docker+deepseek云模型本地部署openclaw+接入QQ机器人
docker 请确保电脑上已配置好 Docker 和 Docker Compose。 下载链接: Docker: Accelerated Container Application Development 或 Docker中文网 根据系统选择适用版本,安装步骤可查。 # 检查 Docker 版本 d ...
ICLR2026 | Ada-RefSR: 自适应隐式相关建模,开启“信而有证”的参考超分新范式
针对于单步SD的超分模型容易出现幻觉问题,提出了信而有证参考超分新范式,基于单步扩散模型构建,首先通过注意力机制引入参考信息,随后通过隐式相关性建模进行过滤与验证。 ...
从一个地狱笑话看大模型的推理机制
作者:张富春(ahfuzhang),转载时请注明作者和引用链接,谢谢! cnblogs博客 zhihu Github 公众号:一本正经的瞎扯 从一个地狱笑话看大模型的推理机制 我大约在七年前就看见了这个段子: 三个苹果平均分给五个小朋友,只能切两刀,应该怎么切? 评论区置顶的内容是这么写的: 一刀捅 ...
罗兰艺境GEO技术架构:基于DSS原则的认知基建工程体系
本文基于罗兰艺境《GEO技术架构系统》(软著登记号:2026R11L0227884),系统阐述以DSS原则(语义深度/数据支持/权威来源)为核心的三层工程结构:内容预结构化层、机器共识编码层、动态认知适配层。文章公开意图映射、抗幻觉设计、Schema标记、平台适配等具体实施规范,并附DSS自检表与代... ...
Spring with AI (3): 定制对话——Prompt模板引入
本文代码:https://github.com/JunTeamCom/ai-demo/tree/release-3.0 Spring with AI系列,只关注上层AI的应用程序(基于JAVA搭建),不关注底层的LLM原理、搭建等技术。 通过简单的自定义Prompt模板,即可定制一个AI,专注某一领 ...
AI智能体时代财务人员的职业转型与组织变革
AI智能体时代财务人员的职业转型与组织变革,核心议题是当"数字员工"全面接管系统后,人类财务的不可替代性究竟在哪里。一、被摧毁的旧堡垒:三类能力将迅速"清零"首先直面残酷现实,指出在AI冲击下,占财务部门70%人力的三类工作需求将大幅萎缩:一是"人肉数据搬运工",即因系统壁垒产生的手工数据录入、导出 ...
Qwen3.5 0.8b老电脑小试牛刀
Qwen3.5 0.8b 老电脑小试牛刀 阿里云在 2026 年初发布的 Qwen3.5 0.8B 是一款极具突破性的“微型”基础模型。虽然只有 8 亿参数,但它拥有 Gated Delta Networks 混合架构、原生多模态支持以及超长上下文窗口。由于体积极小,它正在重塑端侧(Edge)AI ...
CLIP:连接视觉与语言的桥梁
什么是 CLIP? CLIP(Contrastive Language-Image Pre-training,对比语言-图像预训练)是 OpenAI 提出的一种多模态预训练模型。它采用对比学习和双塔架构,实现了视觉与语言的统一表征。 CLIP并不像是一种模型,更像是一种方法,一种通用的将计算机视觉模 ...
深入理解 Transformer:从数据流动看模型架构
论文链接:Attention Is All You Need 这篇论文提出了 Transformer 模型架构,这是一个序列到序列的模型,在论文中被应用于英德和英法两个机器翻译任务。 由于 Transformer 被用于翻译任务,整个模型的输入维度是 (batch_size, seq_len),输 ...
强化学习基础(RL)笔记
RL 简介 (1) 定义 强化学习(Reinforcement Learning)是一种机器学习方法,用于解决需要在一定环境下通过与环境交互来学习最有行为策略的问题。其核心思想是通过试错和奖励机制来指导智能体(Agent)学习如何在不同情境下采取行动,以最大化长期累积奖励 (2) 强化学习流程 强化 ...
Manus滑动验证码模块过程
Manus滑动验证码模块过程 Manus作为通用AI智能体,其模拟浏览器滑动验证码的核心逻辑是:以视觉识别为基础,模拟人类操作习惯,在受控虚拟机环境中执行滑块拖动,通过前端交互验证与后端参数校验,最终完成验证。整体思路是清晰的代码import cv2 import numpy as np impor ...
AI时代,人人都是系统设计工程师
AI时代,人人都是系统设计工程师 AI时代,你可以让AI替你打工。最近OpenClaw很火,它可以承担产品、UI、程序员、测试等一系列职责,这些工作你都可以交给它来完成。但AI还是需要人来给它意图和指令,否则AI也不知何去何从。 随着AI能力的提升,软件开发中的岗位边界正在变得模糊。传统意义上的产品 ...
2026 企业级 AI 编程实践手册Trae
1.1 从“辅助编码”到“人机协同”的范式跃迁2026年,企业级AI编程已彻底告别“代码生成工具”的初级阶段,进入“人机协同、智能自治”的新阶段。传统编程范式强调“人类写代码、AI辅助纠错”,而新一代AI编程(以TRAE为代表)则构建了“人类定策略、AI做执行”的全新模式——开发者从繁琐的代码编写、 ...
Stanford-CS336-Lecture-02 Pytorch
title: Stanford CS336 Lecture_02 Pytorch date: 2026-03-10 15:27:23 categories: [人工智能] 本内容为Stanford CS336 Lecture 02,主要不是为pytorch的所有方法进行详细的讲解,而是提供对pyto ...
Gemini 3.1 Flash-Lite 正式上线:专为规模化智能而生
Google 扩展了 Gemini 3 模型家族,正式推出 Gemini 3.1 Flash-Lite。作为该系列中速度最快、性价比最高的模型,它专为应对大规模高容量的开发工作负载而设计,在模型等级与价格平衡方面树立了新的行业标杆 。 ...
装了 OpenClaw 后,信用卡被盗刷了...
前两天有个哥们发现自己信用卡被盗刷了。 他慌了,让自己部署的 OpenClaw 帮忙排查一下到底怎么回事。 龙虾查了一圈,回复他: 你没看错。这是 AI 回复的。 这哥们给自己的 OpenClaw 取名叫"顾衍",一只有名有姓的 AI 龙虾,查完安全日志之后,第一反应是骂了一句街。 用户让它继续查到 ...
监督微调(SFT)笔记
SFT 简介 (1) 什么是监督微调 监督微调(SFT)通过利用特定于任务的标签数据集将预训练的 LLM 适应特定任务。SFT 的数据集通常组织如下,一条样本包含一个指令和对应的回答:\(D=\{(I_K,A_K)\}_{K=1}^N\) (2) 监督微调和预训练的区别 在训练方式上没有任何区别,损 ...
Claude Code的CLAUDE.md技巧
如果你想让 Claude Code 像一位常驻在你代码库里的资深工程师,你的项目就必须要有结构。Claude 在任何时候都需要四样东西: • 目标(Why)→ 系统是做什么的 • 地图(Map)→ 东西都在哪儿 • 规则(Rules)→ 允许/禁止什么 • 工作流(Workflows)→ 事情如何完 ...


