刷新
克服 AI 时代的恐惧、不确定性和疑虑

博主头像 1 学习咋通过培养 AI 技能,提高职场对 AI 的积极性 职场中抵触 AI 的现象确实存在。很多人并非不愿意接受变化,而是因为对 AI 存在“FUD”——即恐惧(Fear)、不确定性(Uncertainty)和疑虑(Doubt)。 要在 AI 转型时代取得成功,必须积极应对这些 FUD,并营造一种 ...

90%的开发者都忽略的文本向量化技巧!

博主头像 1 啥是文本张量表示? 将一段文本使用张量表示,一般将词汇表示成向量,称作词向量,再由各个词向量按序组成矩阵形成文本表示,如: ["人生", "该", "如何", "起头"] ==> # 每个词对应矩阵中的一个向量 [[1.32, 4,32, 0,32, 5.2], [3.1, 5.43, 0.34 ...

【VMware vSphere】VMware 环境本地部署运行 DeepSeek-R1 大模型(纯 CPU)。

博主头像 DeepSeek 是由中国杭州深度求索公司开发的智能 AI 助手,一个基于人工智能技术构建的虚拟助手,旨在通过自然语言处理和机器学习算法来理解并回应用户的问题与请求。它可以提供多种服务,包括但不限于信息检索、数据分析、语言翻译、知识问答以及日常生活的辅助建议等。 其实,早在春节期间就了解和学习过 D ...

Code commit diff file文件LLM代码审查

博主头像 Code Commit(代码提交)代码提交是软件开发过程中的一个重要环节,它标志着开发者将编写的代码更改正式提交到版本控制系统中。代码提交通常伴随着提交信息(commit message),该信息用于描述此次更改的目的、内容以及可能的影响。在代码审查过程中,审查者会仔细查看这些提交信息以及对应的代码 ...

Transformer 笔记 (CS224N-7)

博主头像 模型回顾 问题:RNN需要经过k步才能对远距离的单词进行交互,例如 这里的was是chef的谓语,二者的关系十分紧密,但是使用线性顺序分析句子会导致如果was和chef的距离较远,它们会难以交互(因为梯度问题) Self Attention 键值对注意力 (1)我们可以将注意力视为在键值存储中执行模 ...

通义灵码-实现开源项目分析

博主头像 开始以下是我们使用VSCODE+TONGYI LINGMA插件实现开源项目分析,灰色字是我们提示词。我们用开源项目ThingsBorad测试。Qwen 2.5-Max 是阿里巴巴推出的一款超大规模的混合专家模型(Mixture of Experts, MoE)数据规模:Qwen 2.5-Max 基于 ...

MM-LLM 数据侧论文速读

博主头像 LAION-5B 提出 CLIP 得分来计算文本图像 embedding 之间的余弦相似度的筛选方法 使用 CLIP 筛选图像文本对,过滤相似度得分低于0.28的数据 DataComp 多模态数据集作为 MM-LLM 发展的关键组成部分,没有得到充分的研究关注。为了弥补这一不足,我们引入了 Data ...

LLM 数据侧论文速读

博主头像 MAYBE ONLY 0.5% DATA IS NEEDED 更少的数据可以省掉训练时间和训练的成本,并且很容易保证数据的高质量,很简单很直觉的想法 Coreset Selection 目标是使用尽可能少的样本找到一个接近完整数据集分布的小集合 先通过 Bert 获取 Embedding,然后在高维 ...

AI科研到底能做什么?看完你就懂了!

博主头像 0 前言 本专栏目标: 能做什么? 要怎么做? 效果如何? 本质: 多Agent实现从数据采集到可视化全流程 AIGC数据应用: 数据采集 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采集社交媒体数据、数据库内容、文本数据、接口数据等。 数据处理 通过数据清洗、数据集成、数据变换、特征 ...

原生态方式部署及运行deepseek-7b-chat

博主头像 前言 先投放一波引流,公众号太久没更新了,以后保持更新,至少一周一更新。注意这个是旧版本,并不是流行的R1版本。 最近网上很多私有化部署deepseek的文章,但都是使用工具,对想理解怎么原生态部署、运行的朋友不是很友好,现在开始解析下怎么使用命令行部署deepseek,后续文章会持续更新。 对于私 ...

解密注意力机制:为什么Flash Attention这么屌?

博主头像 揭开注意力机制的神秘面纱,深入探讨它们在大语言模型中的应用和重要性。从加性注意力到Flash Attention,每一种注意力机制都有独特的魅力和作用。让我们一同探索这些令人着迷的技术细节,了解它们如何帮助模型更聪明地理解和生成文本。 ...

基于RAG的MaxKB知识库问答系统如何选择向量模型

博主头像 在MaxKB中替换向量模型前,我们需要先了解向量相关的原理和技术,此处不做赘述,大家可以自行学习。可以了解下Embedding、Embedding核心,向量库等内容。 一、MaxKB 默认向量模型 MaxKB一款基于大语言模型和RAG技术的知识库问答系统,具体可以参见其官网:https://maxk ...

万字调研——AI生成内容检测

博主头像 数据集 TweepFake 地址 摘要:深度伪造(deepfakes)、合成或篡改媒体的威胁正变得越来越令人担忧,尤其是对于那些已经被指控操纵公众舆论的社交媒体平台而言。即使是最简单的文本生成技术(例如查找和替换方法)也能欺骗人类,正如2017年的“网络中立性”丑闻所证明的那样。与此同时,从基于RN ...

使用 DeepSeek R1 和 Ollama 开发 RAG 系统

博主头像 1.概述 掌握如何借助 DeepSeek R1 与 Ollama 搭建检索增强生成(RAG)系统。本文将通过代码示例,为你提供详尽的分步指南、设置说明,分享打造智能 AI 应用的最佳实践。 2.内容 2.1 为什么选择DeepSeek R1? 在这篇文章中,我们将探究性能上可与 OpenAI 的 o ...

还在手动整理知识?云端满血版DeepSeek助你快速搭建个人专属知识库!

博主头像 0 前言 最新刚结束上一次技术年终总结创作的领奖环节,最近也在公司内部推行基于 DeepSeek 的内部知识库,上了腾讯云,发现点进去我才发现,腾讯云最近就上新了这个带有阳光普照奖的活动! 点进来一看,原来不差钱的腾讯云部署了满血版DeepSeekV3+R1: 并且推出了自研的大模型知识引擎,再加持 ...

<1···171819···29>