摘要:
企业 Agent 不缺 Demo。 缺的是敢进生产的人。 这两年,大家看 Agent 的方式有点像看小区门口新开的咖啡店。第一天排队,第二天拍照,第三天朋友圈说“味道不错”。可真到了要每天早上八点准时供咖啡、不能断电、不能收错钱、不能把隔壁奶茶店的账算进来,事情就不一样了。 Agent 也是这样。
阅读全文
posted @ 2026-05-05 17:12
拾穗数据
阅读(2)
推荐(0)
摘要:
我五年前每周刷 LeetCode 和 SQL 题。 那时候有个习惯——上下班路上听播客,到了公司打开 LeetCode,挑两道中等难度的题,闭着眼睛刷。pandas 的语法烂熟于心,Spark 的 join 优化我能在白板上画三种实现方式。那一年我觉得自己最值钱的就是这种"熟练度"——简历上一摆,比
阅读全文
posted @ 2026-05-05 14:52
拾穗数据
阅读(3)
推荐(0)
摘要:
本期三件事:开源项目 wuphf 用 Markdown + Git 给多 Agent 搭了一个"共享办公室",发布几周拿了 769 颗 star;Aparna Dhinakaran 拆开了 5 个主流 Agent 框架的上下文管理设计,给出"内存层级"的演进图谱;Apache Fluss 配 Roa
阅读全文
posted @ 2026-05-04 22:49
拾穗数据
阅读(7)
推荐(0)
摘要:
我有个朋友上个月去面试一家公司的"AI 工程师"岗位。 JD 上写得很高大上——"参与 LLM 应用开发""RAG 系统设计""Agent 编排""模型 fine-tuning"。薪资也漂亮,比他现在做数据工程的包要高 40%。 面试到第三轮,他终于忍不住问技术负责人:"咱们公司目前的 AI 业务大
阅读全文
posted @ 2026-05-03 18:27
拾穗数据
阅读(7)
推荐(0)
摘要:
我之前写过一篇 《2026 数据岗位金字塔变形》,里面讲到一个反直觉的事——4-6 年经验段的市场需求突然走高。文末留了一个我自己也想了很久的问题: 从 2-4 年走到 4-6 年那个段位,中间那个"跃迁"的具体动作到底是什么? 这个问题不是技术问题,是观察题。我这些年观察过身边几十个数据人的成长轨
阅读全文
posted @ 2026-05-01 23:03
拾穗数据
阅读(8)
推荐(0)
摘要:
我前几天写过一篇关于 DeepSeek V4 切换决策的文章,里面留了一个没回答的问题——如果模型本身越来越便宜,那么"会用模型"这件事的具体能力清单到底是什么? 这一篇就是想把这个问题拆开。 模型层在变商品是事实。今年 DeepSeek V4 把价格打到 Claude 的 1/7,明年大概率还有人
阅读全文
posted @ 2026-05-01 23:03
拾穗数据
阅读(5)
推荐(0)
摘要:
我前几年有过一段焦虑期。 每年都在学新东西。2019 年学 Hadoop 全家桶,2021 年学 Spark 调优,2023 年开始学 dbt 和 lakehouse,去年开始学 LangChain,今年 LangChain 又落伍了,正在学 MCP 和 Agent 编排。 每学一个,我都觉得自己进
阅读全文
posted @ 2026-04-30 06:00
拾穗数据
阅读(3)
推荐(0)
摘要:
有一个同行,在一家中型互联网公司做了六年数据工程师。 他最熟悉的事情,是一个人扛着一套数仓从无到有建起来——选型、建模、写 DDL、配调度、搭监控。他把每一张表的注释都写得清清楚楚,把每一个分区的逻辑都记在脑子里。公司里没有任何一个人,比他更懂那套系统。 前几天我们聊起 Databricks 的一组
阅读全文
posted @ 2026-04-27 23:25
拾穗数据
阅读(6)
推荐(0)
摘要:
本文来源于数据从业者全栈知识库,更多体系化内容请访问知识库。 使用指南 题目来源 本题库收集自2023-2024年字节跳动、阿里巴巴、腾讯、美团、百度、拼多多、京东等一线互联网公司的真实面试题目。 练习建议 面试前1-3天:重点练习高频题目() 每道题限时回答:2-5分钟完成口述回答 录音练习:录下
阅读全文
posted @ 2026-04-27 23:25
拾穗数据
阅读(21)
推荐(0)
摘要:
本文来源于数据从业者全栈知识库,更多体系化内容请访问知识库。 用 Google Doc 管 Prompt,就像用 Word 文档管代码——改了什么、谁改的、改完效果怎样,全靠记忆和缘分。 Prompt 是 LLM 应用最核心的资产,也是最混乱的工程问题。很多团队在 Prompt 上踩过同一个坑:改了
阅读全文
posted @ 2026-04-27 23:25
拾穗数据
阅读(17)
推荐(0)