2025 年 2月随笔档案 - 久曲健

动手学大模型应用开发，第5天：大模型评估

摘要：第一章、验证迭代的一般思路根据前文所讲解的大模型开发流程，我们可以发现，以调用、发挥大模型为核心的大模型开发相较传统的 AI 开发更注重验证迭代。由于你可以快速构建出基于 LLM 的应用程序，在几分钟内定义一个 Prompt，并在几小时内得到反馈结果，那么停下来收集一千个测试样本就会显得极为繁琐。阅读全文

posted @ 2025-02-23 15:55 久曲健阅读(474) 评论(0) 推荐(0)

动手学大模型应用开发，第4天：Prompt设计

摘要：第一章、Prompt 设计的原则和技巧 LLM 时代 prompt 这个词对于每个使用者和开发者来说已经听得滚瓜烂熟，那么到底什么是 prompt 呢？简单来说，prompt（提示）就是用户与大模型交互输入的代称。即我们给大模型的输入称为 Prompt，而大模型返回的输出一般称为 Completi 阅读全文

posted @ 2025-02-22 19:14 久曲健阅读(1248) 评论(1) 推荐(0)

别再为文本提取抓狂！一站式文本提取神器Kreuzberg 助你解决PDF、图片、文档等多格式文件的文本提取难题

摘要：大家好，我是六哥，相信很多朋友肯定都有过从各种文档里提取文本的经历，那过程可太让人头疼了！今天就给大家分享一款超实用的现代Python库——Kreuzberg，帮你轻松解决文本提取的难题。一、Kreuzberg解决了什么问题现在很多文本提取工具，要么依赖外部API调用，要么配置特别复杂，使用起来阅读全文

posted @ 2025-02-21 05:51 久曲健阅读(511) 评论(0) 推荐(1)

同事PPT又拿奖了？偷偷用这AI工具，3步做出老板狂赞的年度报告

摘要：大家好，我是六哥，今天为大家分享一款PPT辅助神器，年底汇报必备神器！就是Napkin AI ！这是一款超级酷的工具，它能把你写的文字一秒钟转化为各种炫酷的视觉效果，比如图表、流程图、信息图啥的。如果你想做一个引人注目的演示，或者想让你的博客文章更有吸引力，Napkin简直是你的好帮手。怎么用N 阅读全文

posted @ 2025-02-19 20:22 久曲健阅读(208) 评论(0) 推荐(0)

动手学大模型应用开发，第4天：向量数据库的使用

摘要：第一章、知识库文档处理本项目是一个个人知识库助手项目，旨在帮助用户根据个人知识库内容，回答用户问题。个人知识库应当能够支持各种类型的数据，支持用户便捷地导入导出、进行管理。在我们的项目中，我们以 Datawhale 的一些经典开源课程作为示例，设计了多种文件类型，介绍每一种文件类型的处理方式，从而阅读全文

posted @ 2025-02-16 18:06 久曲健阅读(873) 评论(0) 推荐(0)

清华博士后的DeepSeek使用手册，104页，真的是太厉害了！（免费领取源文件）

摘要：《DeepSeek从入门到精通2025》是由清华大学元宇宙文化实验室的余梦珑博士后及其团队撰写。文档的核心内容围绕DeepSeek的技术特点、应用场景、使用方法以及如何通过提示语设计提升AI使用效率等方面展开，帮助用户从入门到精通DeepSeek的使用。以前我看了很多教程，都感觉特别花哨，没啥干货阅读全文

posted @ 2025-02-12 08:55 久曲健阅读(1393) 评论(4) 推荐(0)

DeepSeek 不再卡顿，从此告别服务器繁忙，请稍后再试（建议收藏！）

摘要：大家好，我是六哥。由于DeepSeek真的太火了，也许你也跟我一样，常会遇到这样的情况：真的让人抓狂，10条回复里常常有9条是“服务器blabla，请稍后重试”，看到这话，就问你，谁能不崩溃？其实仔细想想，DeepSeek的目标是AGI，算力资源更多用在探索模型上，很难兼顾几亿用户的推理需求。阅读全文

posted @ 2025-02-08 21:07 久曲健阅读(14624) 评论(2) 推荐(5)

VSCODE接入DeepSeek R1实现AI完成自动化脚本实战开发

摘要：大家好，我是六哥，今天还是我们喜爱的DeepSeek的玩法，今天来个实战案例，和大家分享一下如何将DeepSeek接入VS Code，结合AI Toolkit插件完成自动化脚本的实战开发。一、准备微软官方为我们提供了一个针对AI辅助的插件——AI Toolkit for Visual Studi 阅读全文

posted @ 2025-02-06 23:51 久曲健阅读(10850) 评论(1) 推荐(1)

Docker 镜像加速

摘要：theme: channing-cyan 概述使用容器时一般需要首先下载一个容器镜像，例如Docker Hub官方提供的MySQL、WordPress等容器镜像。然而由于 Docker 服务器在国外，基于网速与“和谐墙”的问题，所以我们在后续拉取 Docker官方镜像可能会需要很长的时间，甚至下载阅读全文

posted @ 2025-02-06 10:46 久曲健阅读(1493) 评论(0) 推荐(1)

PyCharm接入本地DeepSeek R1实现AI编程

摘要：大家好，我是六哥，欢迎来到今天的技术分享！今天我要给大家带来一个超实用的教程，教你如何使用PyCharm接入DeepSeek R1实现AI编程。就算你是编程小白，也能轻松搞定，话不多说，让我们开始吧！一、为什么要在本地搭建DeepSeek R1模型？在开始搭建之前，先和大家聊聊这样做的好处，让你阅读全文

posted @ 2025-02-03 20:15 久曲健阅读(7970) 评论(3) 推荐(0)

动手学大模型应用开发，第3天：大模型开发流程及架构

摘要：一、大模型开发整体流程 1. 何为大模型开发我们将开发以大语言模型为功能核心、通过大语言模型的强大理解能力和生成能力、结合特殊的数据或业务逻辑来提供独特功能的应用称为大模型开发。开发大模型相关应用，其技术核心点虽然在大语言模型上，但一般通过调用 API 或开源模型来实现核心的理解与生成，通过 Pr 阅读全文

posted @ 2025-02-02 16:25 久曲健阅读(1946) 评论(0) 推荐(1)

动手学大模型应用开发，第2天：调用大模型（下）

摘要：highlight: a11y-dark theme: channing-cyan 五、调用智谱 AI 1. ChatGLM 大模型智谱 AI 是由清华大学计算机系技术成果转化而来的公司，致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B，并构建了高精度阅读全文

posted @ 2025-02-01 17:35 久曲健阅读(742) 评论(0) 推荐(1)

久曲健

02 2025 档案

公告