随笔分类 -  AI

AI - MCP - MCP的服务开发及测试
摘要:原文链接 https://blog.csdn.net/m0_37879087/article/details/147306857 文章目录前言一、MCM是什么?二、MCP Server1.安装库2.编写服务端代码3.运行服务4.调测浏览器打开配置mcp服务:配置 mcp服务:查看工具5 Client 阅读全文

posted @ 2025-07-16 16:43 frank_cui 阅读(206) 评论(0) 推荐(0)

AI - nvidia-smi 参数说明
摘要:输出字段说明 默认输出的字段包括: GPU:GPU 设备编号。 Name:GPU 设备名称。 Persistence-M:持久模式是否开启。 Bus-Id:GPU 的 PCI 总线 ID。 Disp.A:是否作为显示设备使用。 Vol. Uncorr. ECC:ECC(错误纠正码)状态。 Fan:风 阅读全文

posted @ 2025-03-06 23:11 frank_cui 阅读(401) 评论(0) 推荐(0)

AI - 如何检查GPU设置好了
摘要:如果答案为False, 则需要: pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126 如果答案为True, 代表GPU配置成功。 阅读全文

posted @ 2025-03-06 23:07 frank_cui 阅读(19) 评论(0) 推荐(0)

AI - ReAct 技术与 Function Call 技术介绍
摘要:ReAct 技术与 Function Call 技术介绍 1. ReAct 技术 ReAct 是一种用于增强语言模型推理能力的技术,通过在模型的推理过程中引入“思考”(thought)步骤,帮助模型更好地理解和规划下一步行动。 核心思想: ReAct 在传统的“行动-观察”(action-obser 阅读全文

posted @ 2025-01-20 13:28 frank_cui 阅读(1685) 评论(0) 推荐(0)

AI - 大模型的类别对比:LLM,Text Embedding,Rerank,Speech to text,TTS
摘要:以下是大模型的几种类别对比:LLM、Text Embedding、Rerank、Speech to Text、TTS。 LLM(大语言模型) 定义:通过在大规模文本数据上进行预训练,学习语言的规律和模式,获得通用语言理解能力和生成能力的模型。 特点: 参数量大,计算资源需求高。 具有强大的语言理解能 阅读全文

posted @ 2025-01-20 13:26 frank_cui 阅读(1848) 评论(0) 推荐(0)

AI - 大模型核心参数解析(Top-k、Top-p、Temperature、frequency penalty、presence penalty)
摘要:原文链接 https://blog.csdn.net/u012856866/article/details/140308083 文章目录 0. 前言1. top-k采样2. top-p采样3. Temperature采样4. 联合采样(top-k & top-p & Temperature)4. f 阅读全文

posted @ 2025-01-14 16:49 frank_cui 阅读(3798) 评论(0) 推荐(0)

AI - 大模型返回的prompt_tokens、prompt_unit_price等信息,是什么意思
摘要:在使用大语言模型(LLM)时,`prompt_tokens`、`completion_tokens`和`prompt_unit_price`等信息是非常重要的概念,它们帮助用户理解和管理模型的使用情况和成本。以下是对这些术语的详细解释: ### 1. `prompt_tokens`- **定义**: 阅读全文

posted @ 2025-01-14 15:58 frank_cui 阅读(1618) 评论(0) 推荐(0)

AI - 大模型里的token,具体指什么?
摘要:在大语言模型中,**token** 是一个比单个字母或单个汉字更复杂的概念。它通常是指输入文本被模型处理时的一个基本单位,这个单位可以是一个单词、一个子词(subword)、一个字符,甚至是一个特殊的标记(如换行符、标点符号等)。具体来说,token的划分方式取决于模型使用的分词器(tokenize 阅读全文

posted @ 2025-01-14 15:56 frank_cui 阅读(1118) 评论(0) 推荐(0)

AI - RAG(Retrieval-Augmented Generation,检索增强生成)
摘要:RAG(Retrieval-Augmented Generation,检索增强生成)技术是一种结合了检索和生成功能的自然语言处理(NLP)技术。它通过从大型外部数据库中检索与输入问题相关的信息,来辅助生成模型回答问题。以下是对RAG技术的详细解析: 一、技术原理 RAG技术的核心思想是将传统的检索技 阅读全文

posted @ 2024-12-03 10:32 frank_cui 阅读(380) 评论(0) 推荐(0)

AI - 数据处理 - fit、transform、fit_transform 区别
摘要:总结 fit_transform = fit + transform 的组合,整个过程既包括了训练又包含了转换。fit_transform 对数据先拟合 fit,找到数据的整体指标,如均值、方差、最大值最小值等,然后对数据集进行转换transform,从而实现数据的标准化、归一化操作。 如果要想在 阅读全文

posted @ 2024-07-21 23:22 frank_cui 阅读(353) 评论(0) 推荐(0)

AI - 数据类型:定类、定序、定距、定比
摘要:总结 1. 定类数据、定序数据,无法进行距离间的比较,和加减法的运算 定距数据,虽然能进行加减法的运算,但不能进行乘除法的运算。因为没有零点(作者注:todo) 定比数据,可以进行加减乘除 2. 将定类数据、定序数据进行数值化 定距数据,进行归一化后 均可进行四则运算 一、定类数据 在数据处理和分析 阅读全文

posted @ 2024-07-21 22:39 frank_cui 阅读(598) 评论(0) 推荐(0)

AI - 假设检验
摘要:假设检验的步骤 实例讲解 第三步:由于一般的显著性水平定为0.05,因此在正态分布图中,对应的接受域是0.95,对应着-1.96~1.96的红色阴影区域 第四步: 4.1——计算出样本统计值 根据第二步骤的公式,将样本所有的值代入该公式,计算出样本统计值 = 2.23,落在了拒绝域 4.2——计算p 阅读全文

posted @ 2024-07-10 23:17 frank_cui 阅读(47) 评论(0) 推荐(0)

导航

levels of contents