AI
刷新
umich cv-1

博主头像 UMICH CV Image Classification KNN 在本节课中,首先justin老师为我们介绍了图像分类了基础概念以及其用途,这里就不多涉及了 接着我们思考图像分类问题,如果我们想要直接通过某种算法来实现图像分类,显然是比较棘手的,于是引入了机器学习的思想,即用数据驱动,用数据去训练 ...

VAE 学习笔记

博主头像 VAE 是 AE的变体。主要目的是让模型学习数据的分布,最后让解码器(decoder)部分具有生成样本的能力。 VAE可看做高斯混合模型(GMM)的扩展。 GMM中,数据由多个高斯分布来描述: \[p(x) = \sum_{k=1}^{K}P(z_{k})P(x|z_{k}) \]其中 $z \si ...

cs50ai3

博主头像 cs50ai3 Optimization cs50ai3 Optimization 基础知识 课后题目 代码实践 学习链接 总结 基础知识 这节课主要讲了一些优化问题对应的算法求解,其实具体使用时还是需要具体分析,看哪些问题能够转化为我们学习的算法能够求解的形式 local search与hill ...

三步实现BERT模型迁移部署到昇腾

博主头像 本文分享自华为云社区 《bert模型昇腾迁移部署案例》,作者:AI印象。 镜像构建 1. 基础镜像(由工具链小组统一给出D310P的基础镜像) From xxx 2. 安装mindspore 2.1.0,假定whl包和tar包已经下载到本地,下载地址:https://www.mindspore.cn ...

迁移学习:互信息的变分上下界

博主头像 在机器学习,尤其是涉及异构数据的迁移学习/联邦学习中,我们常常会涉及互信息相关的优化项,我上半年的第一份工作也是致力于此。其思想虽然简单,但其具体的估计与优化手段而言却大有门道,我们今天来好好总结一下,也算是对我研一下学期一个收尾。为了解决互信息估计的的难解性,我们的方法是不直接对互信息进行估计,而... ...

大模型时代,如何快速开发AI应用

博主头像 本文分享自华为云社区 《【云享问答】第3期:大模型时代,如何快速开发AI应用》,作者:华为云社区精选。 大模型快速普及应用的当下,AI浪潮汹涌而至,对于开发者来说,开发一款属于自己的AI应用并不是遥不可及。华为云AI生态技术专家、中科院计算所博士坐阵,从数据处理、算法开发、模型训练到部署,全方位拆解 ...

FastGPT 接入飞书(不用写一行代码)

博主头像 FastGPT V4 版本已经发布,可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景,例如联网谷歌搜索,操作数据库等等,功能非常强大,还没用过的同学赶紧去试试吧。 飞书相比同类产品算是体验非常好的办公工具了,我司也是废了很大的劲才迁到飞书,所以我们先来接入飞书的教程。 原文链接:ht ...

anaconda navigator,启动!

博主头像 今天重新安装了一下anaconda,本想着应该不会再出什么问题,先打开anaconda navigator试试水,没想到还是一直卡在loading applications的地方,过了半天好不容易消失了,但是什么都没有显示。再次尝试打开navigator,就提示“There is an instan ...

模型参数以及内存的计算方法

博主头像 前言 本篇笔记是分析transformer模型的参数量、计算量、中间激活、KV cache - 知乎 (zhihu.com)的学习记录。大部分内容都是来自那篇文字。 符号表 本文的示例模型是decoder-only模型,即若干个相同的层,有的人称之为block,每个block包含:self-atte ...

Transformer详解

博主头像 前言 在17年,自然语言处理领域还在被RNN统治,当时的seq2seq任务还是用带encoder-decoder结构的RNN。然而RNN天然具有一个缺点:计算效率低。 随后的transformer也是encoder-decoder结构,但是其中信息关联采用了attention机制,而不是RNN的循环 ...

Natural Language Processing自然语言处理(NLP)

博主头像 机器学习/深度学习的相关笔记 前言: 欢迎来到此处,这里是我边学习边整理的有关机械学习/深度学习的相关笔记。先前我对这方面的知识不是很了解,笔记整理必然有不妥之处,请见谅并斧正。 目录: 深度自然语言处理 1.Word Vectors(词向量) 2.Neural Classifiers(神经分类器) ...

基于间隔密度的概念漂移检测算法mdm-DDM

博主头像 概念漂移 ​ 概念漂移是数据流挖掘领域中一个重要的研究点。传统的机器学习算法在操作时通常假设数据是静态的,其数据分布不会随着时间发生变化。然而对于真实的数据流来说,由于数据流天生的时间性,到达的数据的分布可能会随着时间的推移不断改变。这使得传统的批处理模型不适合对数据流的进行挖掘分析,模型更是需要有 ...

用强化学习构建个性化的二维码

博主头像 技术概述 AIGC 在图像生成领域如火如荼,StableDiffusion 加各种 LORA,ControlNet,大家玩得不亦乐乎。但是基于扩散模型的方式,仍然存在很多问题,比如抽卡成功率过低,生成图像的细节仍需优化。具体到二维码生成,目前 hugging face 上的几个 ControlNet ...

<1···373839···50>