TDS-通讯-关于数据科学中-LLMs-的必备知识

TDS 通讯:关于数据科学中 LLMs 的必备知识

原文:towardsdatascience.com/tds-newsletter-what-you-need-to-know-about-llms-for-data-science/

不要错过《变量》的最新版本,我们的每周通讯精选了编辑精选、深度分析、社区新闻等内容。

立即订阅

越来越多的数据专业人士现在将大型语言模型视为核心数据科学工作流程的组成部分。从基本数据分析到复杂的提取过程,LLMs 在它们曾经只有最小影响(如果有的话)的领域发挥着越来越明显的角色。

如何应对这种快速变化?数据科学家可以做什么来避免人类-LLM 领土战,并利用他们的力量产生更好、更流畅的结果?本周,我们聚焦于数据特定的用例,通过文章展示代理、提示和其他 LLM 工具如何增强而不是损害您工作的价值。

在我们深入探讨之前:如果您错过了,我们最近发布了最新的作者聚焦,这是一篇充满洞察力的问答,与长期 TDS 贡献者 Egor Howell 讨论他的职业历程,并为有志于成为 ML 工程师的人提供建议。towardsdatascience.com/writing-is-thinking/


LangChain for EDA: 使用 Python 构建 CSV 健壮性检查代理

对于反复进行相同的数据探索分析任务感到厌倦?Sarah Schürch将带我们了解一个自动化项目——由 Python 和 LangChain 驱动——该项目能够生成具有显示列、检测缺失值和检索描述性统计等功能,以及其他节省时间的优势。

LangChain for EDA: 使用 Python 构建 CSV 健壮性检查代理

端到端数据科学家的提示剧本

如果你对 LLMs 在数据科学家工具箱中的位置持怀疑态度,Sara Nobrega 对提示技术的最新探索——特别是在利益相关者沟通领域——可能会改变你的看法。

端到端数据科学家的提示剧本

使用 LangExtract 提取结构化数据:深入了解 LLM 编排的工作流程

Subha Ganapathi 提供了一份构建结构化智能模块化工作流程的实用指南,确保模式对齐和事实完整性。

使用 LangExtract 提取结构化数据:深入了解 LLM 编排的工作流程


本周最受欢迎的文章

近期社区热议的文章涵盖了 MCP、数据通才的未来以及更多内容:

使用 LangGraph 和 MCP 服务器创建我的个人语音助手,作者:本杰明·李

使用 LangGraph 和 MCP 服务器创建我的个人语音助手

通才:新的全能型数据专业人士?,作者:洛伊佐斯·洛约兹

通才:新的全能型数据专业人士?

这个月我学到的机器学习课程,作者:帕斯卡尔·扬内茨基

这个月我学到的机器学习课程


其他推荐阅读

从气候数据到 Python 基础知识,以下是一些我们想要强调的近期必读文章:

  • AI FOMO,影子 AI 和其他商业问题,作者:斯蒂芬妮·基尔默

AI FOMO,影子 AI 和其他商业问题

  • 随机微分方程和温度——NASA 气候数据第二部分,作者:马科·亨宁·塔拉里科

随机微分方程和温度——NASA 气候数据第二部分

  • 在初创公司担任数据科学家真正是什么样子,作者:于东

在初创公司担任数据科学家真正是什么样子

  • MobileNetV1 论文解读:小型巨人,作者:穆罕默德·阿尔迪

MobileNetV1 论文解读:小型巨人

  • 在 Python 中实现咖啡机,作者:马诺尔·贾韦德

在 Python 中实现咖啡机


认识我们的新作者

探索我们最近添加的一些贡献者的优秀作品:

  • 詹姆斯·吉本斯是一位具有跨学科背景的数据科学家,并一直在发表关于超参数调整的流行系列文章。

随机森林超参数调优的视觉指南

  • Erika G. Gonçalves凭借其在应用数学和统计学方面的专业知识以及深厚的行业经验加入我们;她的第一篇文章深入探讨了人工智能应用的内幕。

AI 运维内幕:挑战和最佳实践

  • 肖恩·莫兰 在大型企业中领导了多个 AI/ML 项目。他的 TDS 首篇文章探讨了科学创新可能被 AI 大量辅助的潜在未来。

从标记到定理:构建一个神经符号 AI 数学家

我们喜欢发布新作者的文章,所以如果你最近撰写了一个有趣的项目教程、教程或对我们核心主题的任何理论反思,为什么不与我们分享?


订阅我们的通讯

posted @ 2026-03-27 10:07  布客飞龙II  阅读(2)  评论(0)    收藏  举报