刷新
【调研】Vision Language Model Safety

博主头像 Adversarial Attacks White-box Attacks Task-specific Attacks 的目标是针对某个具体的任务(如图像描述生成、指代表达理解等),通过精心设计的对抗样本,使得模型在该任务上产生错误的输出。例如,攻击者可能希望模型生成错误的图像描述,或者在对图像进行 ...

知识蒸馏实战

博主头像 蒸馏实战小实验 本实验相关代码已开源至github 失败经历 爱爱医数据蒸馏Qwen2.5-7B 1.用爬虫在爱爱医网站爬取1k条数据。(刚学一点爬虫,不会越过验证码,还是自己一次一次验证) 2.数据格式预处理,例如: { "instruction": "你需要基于我提供的患者病历,推理并生成完 ...

Windows系统上使用Ollama本地部署DeepSeek

博主头像 前排提醒: 1. 操作系统为Windows11 2. 受限于硬件资源,本地部署的DeepSeek为DeepSeek-R1 14B Ollama安装 第一步: 打开浏览器,在地址栏输入网址:https://ollama.com/ ,进入Ollama官网 第二步: 点击上图中的“Download”按钮, ...

大模型推理能力的局限性

博主头像 0 前言 LLM凭借其生成连贯文本、翻译语言甚至进行对话的能力,彻底改变人工智能领域。然而,尽管这些模型表现出色,它们在推理和理解复杂上下文方面仍然面临重大挑战。 这些模型擅长识别并模仿训练数据中的模式,但当任务需要真正的理解和逻辑推理时,它们往往遇困。可能导致: 长对话中的不一致 难以关联分散的信 ...

MCP:AI 时代的工具接口标准?

博主头像 0 前言 自从 OpenAI 在 2023 年推出函数调用(Function Calling),我一直思考,咋能真正解锁 AI Agent与工具的生态系统。随基础模型越来越智能,AI Agent与外部工具、数据和 API 的交互方式却变得越来越碎片化——开发者需针对每一个系统单独编写业务逻辑,让Ag ...

基于LLM的业务流程图评审

博主头像 背景 产品经理绘制业务流程图,是梳理业务需求、明确业务逻辑、推动跨部门协作的核心工作之一。其核心是通过可视化方式,将复杂的业务场景拆解为清晰、有序的步骤,确保产品设计与实际业务目标对齐。以下是关键点解析:业务流程图的核心目的需求具象化:将抽象的业务需求转化为可落地的步骤(如“用户下单”需拆解为浏览商 ...

注意力机制:GPT等大模型的基石

博主头像 1 啥是注意力? 人类观察事物,能快速判断一种事物,是因为大脑能很快把注意力放在事物最具辨识度的部分从而作出判断,而非从头到尾一览无遗观察一遍才能有判断。基于这样的观察实践,产生了注意力机制(Attention Mechanism)。 想象你在人群中找一个穿红衣服的人。你不会一一检查每个人的鞋子、裤 ...

AI辅助招聘面试STAR法则生成面试题

博主头像 背景STAR法则的应用 STAR法则常被用作面试官评估应聘者过去工作经历和能力的一种工具,能够帮助面试官系统地了解应聘者过去的工作经历,揭示他们面临挑战时的应对策略,以及所取得的工作成果。通过这一法则,面试官能够更全面地评估应聘者的专业能力和工作态度。应聘者也可以通过STAR法则来准备面试,提前梳理 ...

你的AI客服为何总抓不住客户核心诉求?(附特征优化方案)

博主头像 1 特征工程的意义 nlp任务中,原始文本经数值映射后形成的词向量序列,难充分表达语言深层语义特征。就需引入文本特征增强技术: 语义信息补全:突破单词语义局限,捕获词序关联特征 模型适配优化:构建符合算法输入规范的矩阵结构 评估指标提升:通过特征增强直接影响模型准确率、召回率等核心KPI 如电商评论 ...

克服 AI 时代的恐惧、不确定性和疑虑

博主头像 1 学习咋通过培养 AI 技能,提高职场对 AI 的积极性 职场中抵触 AI 的现象确实存在。很多人并非不愿意接受变化,而是因为对 AI 存在“FUD”——即恐惧(Fear)、不确定性(Uncertainty)和疑虑(Doubt)。 要在 AI 转型时代取得成功,必须积极应对这些 FUD,并营造一种 ...

90%的开发者都忽略的文本向量化技巧!

博主头像 1 啥是文本张量表示? 将一段文本使用张量表示,一般将词汇表示成向量,称作词向量,再由各个词向量按序组成矩阵形成文本表示,如: ["人生", "该", "如何", "起头"] ==> # 每个词对应矩阵中的一个向量 [[1.32, 4,32, 0,32, 5.2], [3.1, 5.43, 0.34 ...

【VMware vSphere】VMware 环境本地部署运行 DeepSeek-R1 大模型(纯 CPU)。

博主头像 DeepSeek 是由中国杭州深度求索公司开发的智能 AI 助手,一个基于人工智能技术构建的虚拟助手,旨在通过自然语言处理和机器学习算法来理解并回应用户的问题与请求。它可以提供多种服务,包括但不限于信息检索、数据分析、语言翻译、知识问答以及日常生活的辅助建议等。 其实,早在春节期间就了解和学习过 D ...