LLM-评估-并行计算-需求预测以及其他动手数据科学方法
LLM 评估、并行计算、需求预测以及其他动手数据科学方法
感受到撰写你的第一篇 TDS 文章的灵感了吗?我们始终欢迎新作者的贡献。
当我们所有人逐渐适应新年的有时繁忙的节奏时,我们希望你在享受启动项目、学习新主题和探索你的下一步职业发展的兴奋中。我们确实看到了作者们(包括长期贡献者和新加入的成员)的活跃,我们很高兴与他们分享他们在假期期间准备的所有优秀作品。
本周我们精选的顶级阅读内容具有明显的实用性和动手操作风格——毕竟,还有什么比动手摆弄一些数据集、模型和代码更能利用这些能量呢?无论你对了解前沿评估方法还是构建代理人工智能工具感兴趣,我们都为你提供了一系列多样化的教程和实用概述。准备好深入探索了吗?
-
LLM 时代评估的范式转变 是否是时候重新评估我们对待评估的方式了?李莉·江认为这是时候了:“我逐渐认识到,LLM 需要我们在评估思考方式上做出一些微妙、概念上简单但重要的改变。”她的最新文章提供了对可能的新范式的高层次见解。
-
LLM 准确性的下一个前沿 与 LLM 优化主题保持一致,玛丽亚·曼苏罗娃的新深入分析详细介绍了我们可以用来提高模型准确性的几种方法,并聚焦于高级微调技术。

由Vishal Banik在Unsplash上的照片
-
如何构建一个图 RAG 应用 准备好卷起袖子深入代码了吗?史蒂夫·赫登关于创建你的第一个图 RAG 应用的全面教程是任何对这一热门话题感兴趣但需要指导和背景以确保正确起步的人的好选择。
-
使用 Hugging Face Code Agents 的多智能体 RAG 基于代理的系统去年获得了巨大的势头(和关注),看起来在 2025 年这种情况不会改变。好奇想了解更多关于它们的信息?Gabriele Sgroi, PhD 的耐心、逐步指南可能很长,但它仍然易于理解且清晰,概述了利用一个“小型”LLM 来驱动多智能体系统并产生良好结果的过程——即使在消费级硬件上也能做到。
-
使用 Darts 进行需求预测:教程 尽管这些天大型语言模型(LLMs)吸引了我们集体的注意力,但以业务为中心的工作流程仍然是行业数据科学家的工作重点。Sandra E.G. 的首篇 TDS 文章提供了一次稳健的、实用的介绍,介绍了一个这样的基本任务:在零售销售背景下进行需求预测。
-
使用 Ray 简化分布式并行计算 对于数据和机器学习从业者来说,尝试新的工具和框架至关重要,因为看似微小的改进可以积累成重大的成本和效率效益。Betty LD 带我们了解她最近对专注于人工智能的 Ray 库进行分布式数据处理的研究,并通过可扩展的离线批量推理用例展示了其功能。
如果你本周准备拓展到其他主题,我们在这里帮助你——无论你的兴趣在于音乐和人工智能、量子计算、线性代数(以及其他),我们都希望你能探索一些这些优秀的文章:
-
Tula Masterman 呈现她团队的前沿研究,解释了我们可以如何利用中间 Transformer 层的隐藏状态来实现高效和健壮的内容安全性和提示注入分类。
-
以音乐为中心的人工智能工具持续取得进展;Max Hilsdorf 将他对这一主题的最新探索献给了单声道到立体声提升,一种丰富或改善我们音乐聆听体验的技术。
-
拥有七篇第一作者出版物,Malak Sadek 在为那些希望扩大其出版足迹的研究者提供具体见解方面处于有利位置。
-
继续他关于关键线性代数概念的系列文章,Rohit Pandey 最近分享了一个新的、全面的解释,探讨了正交矩阵的内部工作原理。
-
量子计算已经是一个热门话题一段时间了,尽管对其前景的讨论有时几乎感觉像是科幻小说的邻近。以下是 Sara A. Metwalli,她的入门指南正好在联合国宣布 2025 年为国际量子科学和技术年之际发布,帮助我们理解这个领域以及目前的情况。
-
当我们谈论这个话题时,让我们用 Benjamin Assel 对IBM 量子处理器中的错误率测量的细致讨论来结束本周的选择,其中还包括使用 Qiskit 的代码示例。
感谢您对我们作者工作的支持!正如我们上面提到的,我们喜欢发表新作者的文章,所以如果您最近撰写了一篇有趣的项目演练、教程或对我们核心主题的任何理论反思,请不要犹豫,与我们分享。
直到下一个变量,
TDS 团队

浙公网安备 33010602011771号