文章分类 - AI-7生成式人工智能导论
摘要:To Learn More …… https://www.youtube.com/watch?v=KKT2VkTdFyc&list=PLJV_el3uVTsOh1F5eo9txATa4iww0Kp8K 模型自己会抽象出一种“语言”,不同语言表示同一个意思的时候,在模型种的“记录”是一样的: http
阅读全文
摘要:GPT-4o https://www.youtube.com/watch?v=DQacCB9tDaw Project Astra https://www.youtube.com/watch?v=nXVvvRhiGjI GPT-4o 语音模式 (Voice Mode) https://openai.c
阅读全文
摘要:一、影像的构成 图片由像素构成,而视频则是由一帧帧连续的图片组成。 那么,AI 是如何 “看懂” 这些影像的呢? 图片 如今的 AI 处理图片时,会通过编码器(Encoder)将像素信息转化为一系列特征数据,再由解码器(Decoder)还原出我们能理解的图像; https://arxiv.org/a
阅读全文
摘要:LLaMA 2 13B + Speculative Decoding Source: https://pytorch.org/blog/hitchhikers-guide-speculative-decoding/ Speculative Decoding Speculative :投机,猜测 ht
阅读全文
摘要:生成式人工智能的概念 文字由 Token 构成: https://platform.openai.com/tokenizer 影像由像素(Pixel)所构成: https://zh.wikipedia.org/zh-tw/%E5%83%8F%E7%B4%A0#/media/File:Pixel-ex
阅读全文
摘要:大语言模型胡乱讲错话(幻觉) 大语言模型(LLM)的 “幻觉”(Hallucination)是当前人工智能领域的重要研究课题,指模型生成的内容看似流畅合理、逻辑自洽,但实际上与客观事实不符,或缺乏真实依据的现象。这种 “幻觉” 并非模型 “故意撒谎”,而是其底层工作机制导致的非预期结果。 Facts
阅读全文
摘要:根据标准答案评估 https://arxiv.org/abs/2009.03300 https://huggingface.co/blog/evaluating-mmlu-leaderboard 把正确答案都移动到A的话,测试结果又不一样: BLEU,ROUGE是两款不同的工具 人类评估语言模型 大
阅读全文
摘要:任务概述 我们希望一个AI模型能够写唐诗,给AI前两行,我们希望它能继续写完其余部分:微调之前,AI模型可能不擅长写唐诗: 在这个任务中,我们将教AI模型写唐诗。 我们收集诗歌数据,并教人工智能模型根据给定的前两句续写唐诗。 当给定相同的前两句时,模型可能会生成不同的诗歌吗? 你将在本任务中学到什么
阅读全文
摘要:准备工作 Google Gemini API密钥获取 https://ai.google.dev/ 点击上面的报错链接会跳转到: https://console.cloud.google.com/projectcreate 创建完项目之后,重新回到创建秘钥的界面(刷新): ChatGPT API密钥
阅读全文
摘要:一、Prompt Engineering(提示词工程) 不调参的模型强化术 核心目标:在不训练模型的前提下,通过优化给语言模型的提示(Prompt)来提升其表现。 关键特点: 不针对特定任务设计固定格式的提示,重点是清晰描述任务需求; 可将大型语言模型视为 “在线新人助理”—— 具备基本常识和理解能
阅读全文
摘要:https://wiktenauer.com/wiki/Michael_Hundt 一、生成式人工智能的定义 生成式人工智能(Generative AI)的核心目标是让机器生成复杂且有结构的物件,这些物件的构成具有特定方式: 文章由文字构成 影像由像素组成 语音由取样点构成 其 “复杂性” 体现在生
阅读全文
摘要:ChatGPT G: Generative 生成式 P: Pre-trained 预训练 T: Transformer 模型 一、ChatGPT 的真正核心:文字接龙 核心原理 本质:基于概率的Token预测器(非真正理解语义) 工作流程: 输入:"台湾最高的山是哪座?" → 输出概率分布 → 采样
阅读全文