随笔分类 -  AI大模型

摘要:写在前面 无论博客还是公号,我都很久不写东西了,去年、今年两年发生了太多的事,我没法梳理,也不想梳理了,本能的想着用时间来冲淡一切的一切,但是现实就是无法如愿。 自然文章、博客也就停滞了,相应的阅读量和粉丝也严重下滑了,也在学着接受了现实的一切,更多的是和自己和解的过程吧。 为什么写这篇文章 可能是 阅读全文
posted @ 2025-10-12 19:06 久曲健 阅读(549) 评论(4) 推荐(0)
摘要:只需一行命令,Win11秒变Linux开发主机!大家好,我是六哥,今天为大家分享,只需一行命令,就能拥有原生的Linux系统体验! 本文以真实操作为例,带你一步步解决常见问题,轻松搞定WSL+Docker环境。 一、只需一行命令,开启WSL 在PowerShell(管理员)中输入: wsl --install 等待系统自动安装WSL(Window 阅读全文
posted @ 2025-07-14 22:40 久曲健 阅读(3062) 评论(5) 推荐(4)
摘要:一、什么是向量数据库? 向量数据库(Vector Database)是专门用来存储和检索向量数据的数据库。它广泛应用于图像搜索、推荐系统、自然语言处理等领域。 简单理解: 你给数据库一堆「特征向量」(比如图片、文本的数字表达) 你问数据库「最像这个向量的有哪些?」 数据库快速返回「最相似」的结果 二 阅读全文
posted @ 2025-07-13 11:22 久曲健 阅读(492) 评论(2) 推荐(0)
摘要:在企业核心系统升级时,传统测试方法需要数百台设备并行验证;工业软件每次迭代都面临复杂环境适配挑战。这些场景揭示出软件测试领域的关键矛盾:日益增长的质效需求与有限测试资源之间的鸿沟。Testin云测提供的智能化解决方案,正在改变这一局面。 一、技术架构的革新突破 Testin云测构建了分层递进的技术体 阅读全文
posted @ 2025-07-11 07:51 久曲健 阅读(87) 评论(0) 推荐(0)
摘要:分辨大模型的好坏是一个多维度的问题,需要从技术能力、实际效果、安全性、成本和应用适配性等多个角度综合考量。以下是一些关键的评估维度和方法: 一、核心能力维度 1、基础能力: 语言理解与生成: 流畅度、语法准确性、上下文连贯性、能否理解复杂指令和隐含信息? 知识覆盖与准确性: 知识广度(涵盖多少领域? 阅读全文
posted @ 2025-06-16 20:43 久曲健 阅读(499) 评论(0) 推荐(0)
摘要:近年来,人工智能(AI)技术以前所未有的速度渗透到各行各业,软件工程领域也不例外。AI与软件工程(SE)的深度融合,正在引发一场前所未有的行业变革,重塑软件的开发、测试和运维模式。日前,在中国人工智能产业发展联盟第十四次全会上,Testin云测携手中国信息通信研究院人工智能研究所,联合中信银行、阿里 阅读全文
posted @ 2025-04-24 20:21 久曲健 阅读(331) 评论(0) 推荐(0)
摘要:大家好,我是六哥!今天必须给大伙唠唠DeepSeek全新v3。就在昨晚,DeepSeek悄没声儿地在Huggingface上发布了DeepSeek-V3-0324。虽说不是全新模型,可能力提升那叫一个大! 在Aider评测里,它是排名第二的非推理模型,仅次于Claude-3.7-Sonnet(no 阅读全文
posted @ 2025-03-25 22:16 久曲健 阅读(575) 评论(0) 推荐(0)
摘要:第一章 项目代码简析 根据前面讲解的内容,我们逐步学习了如何调用不同的 LLM API,如何处理知识库文档搭建向量数据库,再如何设计 Prompt 搭建基于数据库的检索问答链。现在,我们可以回顾前面学过的所有内容,结合项目设计思路,将上述学习内容实现成代码,并按项目层次封装,来支持后续部署的调用。在 阅读全文
posted @ 2025-03-23 10:28 久曲健 阅读(652) 评论(0) 推荐(0)
摘要:一、前言 大家好,我是六哥! 今天咱们聊聊编程里两个听起来有点复杂的概念——MCP协议和函数调用(function call),其实用大白话来讲,它们就是两种不同的“沟通方式”,就像咱们人与人之间交流也有不同的方式一样。下面我就用生活中的例子和Python代码,给大家好好讲讲它们的区别。 二、Fun 阅读全文
posted @ 2025-03-23 09:04 久曲健 阅读(4919) 评论(1) 推荐(2)
摘要:第一章、验证迭代的一般思路 根据前文所讲解的大模型开发流程,我们可以发现,以调用、发挥大模型为核心的大模型开发相较传统的 AI 开发更注重验证迭代。由于你可以快速构建出基于 LLM 的应用程序,在几分钟内定义一个 Prompt,并在几小时内得到反馈结果,那么停下来收集一千个测试样本就会显得极为繁琐。 阅读全文
posted @ 2025-02-23 15:55 久曲健 阅读(473) 评论(0) 推荐(0)
摘要:第一章、知识库文档处理 本项目是一个个人知识库助手项目,旨在帮助用户根据个人知识库内容,回答用户问题。个人知识库应当能够支持各种类型的数据,支持用户便捷地导入导出、进行管理。在我们的项目中,我们以 Datawhale 的一些经典开源课程作为示例,设计了多种文件类型,介绍每一种文件类型的处理方式,从而 阅读全文
posted @ 2025-02-16 18:06 久曲健 阅读(870) 评论(0) 推荐(0)
摘要:《DeepSeek从入门到精通2025》是由清华大学元宇宙文化实验室的余梦珑博士后及其团队撰写。文档的核心内容围绕DeepSeek的技术特点、应用场景、使用方法以及如何通过提示语设计提升AI使用效率等方面展开,帮助用户从入门到精通DeepSeek的使用。 以前我看了很多教程,都感觉特别花哨,没啥干货 阅读全文
posted @ 2025-02-12 08:55 久曲健 阅读(1393) 评论(4) 推荐(0)
摘要:大家好,我是六哥。 由于DeepSeek真的太火了,也许你也跟我一样,常会遇到这样的情况: 真的让人抓狂,10条回复里常常有9条是“服务器blabla,请稍后重试”,看到这话,就问你,谁能不崩溃? 其实仔细想想,DeepSeek的目标是AGI,算力资源更多用在探索模型上,很难兼顾几亿用户的推理需求。 阅读全文
posted @ 2025-02-08 21:07 久曲健 阅读(14621) 评论(2) 推荐(5)
摘要:大家好,我是六哥,今天还是我们喜爱的DeepSeek的玩法,今天来个实战案例,和大家分享一下如何将DeepSeek接入VS Code,结合AI Toolkit插件完成自动化脚本的实战开发。 一、准备 微软官方为我们提供了一个针对AI辅助的插件——AI Toolkit for Visual Studi 阅读全文
posted @ 2025-02-06 23:51 久曲健 阅读(10844) 评论(1) 推荐(1)
摘要:大家好,我是六哥,欢迎来到今天的技术分享!今天我要给大家带来一个超实用的教程,教你如何使用PyCharm接入DeepSeek R1实现AI编程。就算你是编程小白,也能轻松搞定,话不多说,让我们开始吧! 一、为什么要在本地搭建DeepSeek R1模型? 在开始搭建之前,先和大家聊聊这样做的好处,让你 阅读全文
posted @ 2025-02-03 20:15 久曲健 阅读(7966) 评论(3) 推荐(0)
摘要:highlight: a11y-dark theme: channing-cyan 五、调用智谱 AI 1. ChatGLM 大模型 智谱 AI 是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度 阅读全文
posted @ 2025-02-01 17:35 久曲健 阅读(739) 评论(0) 推荐(1)
摘要:一、基本概念 1. Prompt Prompt 最初是 NLP(自然语言处理)研究者为下游任务设计出来的一种任务专属的输入模板,类似于一种任务(例如:分类,聚类等)会对应一种 Prompt。在 ChatGPT 推出并获得大量应用之后,Prompt 开始被推广为给大模型的所有输入。即,我们每一次访问大 阅读全文
posted @ 2025-01-31 21:46 久曲健 阅读(1054) 评论(0) 推荐(0)
摘要:一. 什么是LLM(大语言模型)? 1. 发展历程 语言建模的研究始于20世纪90年代,最初采用了统计学习方法,通过前面的词汇来预测下一个词汇。然而,这种方法在理解复杂语言规则方面存在一定局限性。 随后,研究人员不断尝试改进,其中在2003年,深度学习先驱Bengio在他的经典论文《A Neural 阅读全文
posted @ 2025-01-30 21:54 久曲健 阅读(614) 评论(3) 推荐(0)
摘要:写在前面 最近,DeepSeek 发布的推理大模型 DeepSeek - R1 ,可以说是AI大模型领域杀出的一匹黑马。它在国外大模型排名 Arena 上成绩惊人,基准测试位列全类别大模型第三,在风格控制类模型中更是与 OpenAI o1 并列第一。不仅如此,1 月 27 日,其应用登顶中美应用商店 阅读全文
posted @ 2025-01-28 17:44 久曲健 阅读(28628) 评论(2) 推荐(7)