随笔分类 - DeepSeek
摘要:DeepSeek-Reasonix:一个为缓存而生的终端编程 Agent,99.8% 缓存命中率的秘密 435M input tokens,账单 12 美元——同样的工作量在 DeepSeek v4-flash 无缓存模式下要花 61 美元。这个数字来自 Reasonix 一位真实用户 2026 年
阅读全文
摘要:DeepSeek 刚做了一个让整个 LLM API 市场震动的决定:V4 Pro 的 75% 折扣永久化。 这不是限时促销。从 2026 年 5 月 31 日促销期结束后,V4 Pro 的定价将正式调整为原价的 1/4。一个支持 1M 上下文、具备推理能力、开源权重的旗舰模型,输入 $0.435/百
阅读全文
摘要:Deep:DeepSeek 版的 Aider / Claude Code,开源 CLI 编程工具新选择 AI 编程工具的战场又多了一个选手。这次不是闭源大厂的新品,而是基于开源模型的 CLI 工具:Deep。 它是什么 Deep 是一个开源的命令行工具,让开发者通过 CLI/REPL 界面使用 De
阅读全文
摘要:DeepSeek 悄悄挂出 Agent Harness 岗位:Model + Harness = Agent,要做智能体产品了? 5 月 15 日和 18 日,DeepSeek 官网招聘页面连续挂出两个新岗位——Agent Harness 研发工程师和Agent Harness 产品经理。这不是常规
阅读全文
摘要:中国 AI 六小虎估值大盘点:谁在泡沫上跳舞,谁在价值里扎根 2025 年 1 月,DeepSeek-R1 一声炮响,NVIDIA 单日蒸发 5890 亿美元市值。一个中国量化私募孵化的 AI 实验室,用 557 万美元训练成本打穿了硅谷「烧钱换智能」的叙事。 这不是一个孤例。过去两年,中国涌现出一
阅读全文
摘要:AI 技术日报 - 2026-04-26 Top 10 AI 技术要闻 DeepSeek V4 正式发布:万亿参数 MoE 架构,1M 超长上下文 DeepSeek V4 在 Hacker News 引爆热议,这是继 V3 引发"斯普特尼克时刻"后的又一重大版本。V4 采用 MoE(混合专家)架构,
阅读全文
摘要:如果你关注大模型的发展,一定注意到一个趋势:排名靠前的开源模型越来越多采用 MoE(Mixture of Experts)架构。DeepSeek-V4 有 1.6T 总参数但只激活 49B,Qwen3 也有 MoE 版本,Mixtral 更是靠 MoE 架构一战成名。 与此同时,Llama 4、Qw
阅读全文
摘要:今天 DeepSeek 发布了 V4 预览版,朋友圈和 Twitter 一下子炸了。百万 token 上下文、双模型架构、推理性能比肩顶级闭源模型——这些确实够劲爆。 但我翻完 4927 行的技术报告后,发现了一个很多人可能忽略的细节。 本文提纲 先说重点:华为昇腾 NPU 出现在技术报告里 Dee
阅读全文
摘要:一觉醒来,大模型又变天了 2026年4月24日,DeepSeek 官方公众号深夜推送了一篇文章——DeepSeek-V4 预览版正式上线。 没有提前预热,没有发布会,没有大佬站台。就一个公众号推文,一个 API 文档更新。但就这么一个"低调"的发布,信息量直接炸裂。 让我们先把硬数据列出来,再聊它到
阅读全文
摘要:DeepSeek内蒙草原高薪招聘:AI时代的数字牧民梦,还是营销噱头? 最近,一条招聘信息在科技圈炸开了锅:DeepSeek在内蒙古草原招聘技术人员,月薪最高3万元。一时间,"数字牧民"、"AI时代的农场主"这样的词汇在社交媒体上疯传。 但这究竟是一个真实的技术岗位机会,还是一场精心策划的营销噱头?
阅读全文
摘要:AI 技术日报 - 2026-04-11 Top 10 AI 技术要闻 DeepSeek V4 将于 4 月下旬正式发布 DeepSeek 创始人梁文锋近日在内部沟通中透露,新一代旗舰大模型 DeepSeek V4 将于 4 月下旬正式发布。这是继 DeepSeek R1 之后最受关注的国产大模型更
阅读全文

浙公网安备 33010602011771号