AI
刷新
CS231N Assignment3 入门笔记(Q3 Transformer)

博主头像 斯坦福2023年春季CS231N课程第三次作业(最后一次)解析、笔记与代码,作为初学者入门学习。 在这项作业中,将实现语言网络,并将其应用于 COCO 数据集上的图像标题。然后将训练生成对抗网络,生成与训练数据集相似的图像。最后,将学习自我监督学习,自动学习无标签数据集的视觉表示。 本作业的目标如下 ...

随机 Transformer

博主头像 在这篇博客中,我们将通过一个端到端的示例来讲解 Transformer 模型中的数学原理。我们的目标是对模型的工作原理有一个良好的理解。为了使内容易于理解,我们会进行大量简化。我们将减少模型的维度,以便我们可以手动推理模型的计算过程。例如,我们将使用 4 维的嵌入向量代替原始的 512 维嵌入向量。 ...

脑科学与人工神经网络ANN的发展历程与最新研究

博主头像 本文深入研究了ANN的基本概念、发展背景、应用场景以及与人脑神经网络的关系。 关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人 一、引 ...

相机标定中的四种坐标系

世界坐标系:代表物体在三维世界里的真实坐标,坐标用(Xw,Yw,Zw)表示,其中的w可以认为是world的缩写。 相机坐标系:代表以相机光学中心为原点的坐标,Z轴与光轴重合,坐标用(Xc,Yc,Zc)表示,其中c可以认为是camera的缩写 图像坐标系:代表相机拍摄时,在成像平面上使用的坐标系,成像 ...

Pytorch分布式训练,其他GPU进程占用GPU0的原因

博主头像 问题 最近跑师兄21年的论文代码,代码里使用了Pytorch分布式训练,在单机8卡的情况下,运行代码,出现如下问题。 也就是说GPU(1..7)上的进程占用了GPU0,这导致GPU0占的显存太多,以至于我的batchsize不能和原论文保持一致。 解决方法 我一点一点进行debug。 首先,在数据加 ...

离线生成双语字幕,一键生成中英双语字幕,基于AI大模型,ModelScope

博主头像 制作双语字幕的方案网上有很多,林林总总,不一而足。制作双语字幕的原理也极其简单,无非就是人声背景音分离、语音转文字、文字翻译,最后就是字幕文件的合并,但美中不足之处这些环节中需要接口api的参与,比如翻译字幕,那么有没有一种彻底离线的解决方案?让普通人也能一键制作双语字幕,成就一个人的字幕组? 人声 ...

华为Atlas 200DK环境搭建&推理测试

博主头像 引子 前文已经有一篇,华为服务器Atlas芯片的文章(https://www.cnblogs.com/nick-algorithmer/p/17943216)。熟悉AI的同学们一定知道,除了服务器端端训练推理。AI推理还有一部分是边端推理,各大芯片厂商都有推出边端推理芯片,凑巧,拿到一个一块很老的华 ...

读AI3.0笔记08_自然语言

博主头像 1. 人工智能研究的惯用的套路 1.1. 定义一个在细分领域中比较有用的任务 1.2. 收集一个大型数据集来测试机器在该任务上的性能 1.3. 对人类在该数据集上完成任务的能力进行一个有限的度量 1.4. 建立一场竞赛使得人工智能系统可以在该数据集上互相竞争 1.5. 直到最终达到或超过人类的表现 ...

【scikit-learn基础】--『回归模型评估』之准确率分析

博主头像 分类模型的评估和回归模型的评估侧重点不一样,回归模型一般针对连续型的数据,而分类模型一般针对的是离散的数据。 所以,评估分类模型时,评估指标与回归模型也很不一样,比如,分类模型的评估指标通常包括准确率、精确率、召回率和F1分数等等。而回归模型的评估指标通常包括均方误差(MSE)、均方根误差(RMSE ...

提效神器 | 12个高效AI工具,你用过几个?

博主头像 ⛳ 前言 内容涵盖AI聊天、AI绘画、AI写作、AI视频、AI办公不同领域,工具不在多,搭配适合自己的,建议大家收藏使用~ AI工具|提效神器 1.ChatGPT ChatGPT 地表最强AI工具、美国OpenAI公司、用户规模超17亿;它能够通过理解和学习人类的语言来进行对话,还能根据 ...

布隆过滤器和寻找嫌疑人

博主头像 布隆过滤器,听过也学过,实际中没怎么用到,时间长了再接触这个概念就陌生了,说到底还是没有彻底掌握。为了真正理解一项技术或一个概念,最好还是从问题出发,所以布隆过滤器到底解决了什么问题呢? 布隆过滤器可以用来检测一个元素是否属于某个集合。 上面的定义比较抽象,下面有些具体的例子(参考这篇文章的内容:h ...

探索图像检索:从理论到实战的应用

博主头像 本文深入探讨了图像检索技术及其在主流APP中的应用,涵盖了特征提取、相似度计算、索引技术,以及在电商、社交媒体和云服务中的实际应用案例。 关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深 ...

大模型应用开发:为产品创建一个AI客服/智能助手

博主头像 本文将继续展示AI助手的开发方式,在OpenAPI中它的名字是Assistants。Assistants的主要作用是强化大模型在某方面的应用能力,比如目前已经大范围使用的AI客服和知识库助手,它们可以准确的理解用户的问题,并在限定的知识范围内进行精准回答。另外借助Assistants的能力,我们还可... ...

【scikit-learn基础】--『回归模型评估』之可视化评估

博主头像 在scikit-learn中,回归模型的可视化评估是一个重要环节。它帮助我们理解模型的性能,分析模型的预测能力,以及检查模型是否存在潜在的问题。通过可视化评估,我们可以更直观地了解回归模型的效果,而不仅仅依赖于传统的评估指标。 1. 残差图 所谓残差,就是实际观测值与预测值之间的差值。 残差图是指以 ...

机器学习从入门到放弃:卷积神经网络CNN(一)

博主头像 一、前言 在上一篇中我们使用全连接网络,来构建我们的手写数字图片识别应用,取得了很好的效果。但是值得注意的是,在实验的最后,最后我们无论把 LOSS 优化到如何低,似乎都无法在测试数据集 test data 中提高我们的识别准确度,你可以回头尝试全连接的网络连接,新增多几层 layer ,来尝试是否 ...

读AI3.0笔记07_游戏与推理

博主头像 1. 始于游戏,不止于游戏 1.1. 开发超人类的游戏程序并不是人工智能的最终目的 1.2. AlphaGo所有的版本除了下围棋,其他什么也不会 1.2.1. 其最通用的版本AlphaGo Zero也一样 1.3. 这些游戏程序中没有一个能够将其在一款游戏中学到的知识迁移到其他游戏中,来帮助其学习不 ...

三个方面浅析数据对大语言模型的影响

博主头像 本文分享自华为云社区《浅谈如何处理大语言模型训练数据之二数据影响分析》,作者:码上开花_Lancer。 由于大语言模型的训练需要巨大的计算资源,通常不可能多次迭代大语言模型预训练。千亿级参数量的大语言模型每次预训练的计算需要花费数百万元人民币。因此,在训练大语言模型之前,构建一个准备充分的预训练语料 ...

<1···161718···50>