上一页 1 ··· 85 86 87 88 89 90 91 92 93 ··· 139 下一页
摘要: Unit Scaling 是一种新的低精度机器学习方法,能够在没有损失缩放的情况下训练 FP16 和 FP8 中的语言模型。 使用FP16和BFLOAT16替代FP32可以将内存、带宽和计算需求的大幅减少,这也是目前越来越大的模型所需要的。 背景介绍 随着支持fp8的硬件的发展,在不影响效率的前提下 阅读全文
posted @ 2023-03-31 10:51 deephub 阅读(143) 评论(0) 推荐(0)
摘要: 使用Pandas和Python从时间序列数据中提取有意义的特征,包括移动平均,自相关和傅里叶变换。 前言 时间序列分析是理解和预测各个行业(如金融、经济、医疗保健等)趋势的强大工具。特征提取是这一过程中的关键步骤,它涉及将原始数据转换为有意义的特征,可用于训练模型进行预测和分析。在本文中,我们将探索 阅读全文
posted @ 2023-03-30 11:07 deephub 阅读(229) 评论(0) 推荐(0)
摘要: Prompt(提示)是扩散模型生成图像的内容来源,构建好的提示是每一个Stable Diffusion用户需要解决的第一步。本文总结所有关于提示的内容,这样可以让你生成更准确,更好的图像 一个好的提示 首先我们看看什么是好的提示,好的提示必须是详细和具体的。最好的办法是查看关键字类别和列表,关键字类 阅读全文
posted @ 2023-03-29 11:33 deephub 阅读(99) 评论(0) 推荐(0)
摘要: SimCLR(Simple Framework for Contrastive Learning of Representations)是一种学习图像表示的自监督技术。 与传统的监督学习方法不同,SimCLR 不依赖标记数据来学习有用的表示。 它利用对比学习框架来学习一组有用的特征,这些特征可以从未 阅读全文
posted @ 2023-03-28 10:15 deephub 阅读(344) 评论(0) 推荐(0)
摘要: 高斯混合模型(后面本文中将使用他的缩写 GMM)听起来很复杂,其实他的工作原理和 KMeans 非常相似,你甚至可以认为它是 KMeans 的概率版本。 这种概率特征使 GMM 可以应用于 KMeans 无法解决的许多复杂问题。 因为KMeans的限制很多,比如: 它假设簇是球形的并且大小相同,这在 阅读全文
posted @ 2023-03-27 11:41 deephub 阅读(312) 评论(0) 推荐(0)
摘要: 一般情况下,我们都是使用散点图进行聚类可视化,但是某些的聚类算法可视化时散点图并不理想,所以在这篇文章中,我们介绍如何使用树状图(Dendrograms)对我们的聚类结果进行可视化。 树状图 树状图是显示对象、组或变量之间的层次关系的图表。树状图由在节点或簇处连接的分支组成,它们代表具有相似特征的观 阅读全文
posted @ 2023-03-26 11:10 deephub 阅读(110) 评论(0) 推荐(0)
摘要: Half-UNet简化了编码器和解码器,还使用了Ghost模块(GhostNet)。并重新设计的体系结构,把通道数进行统一。 论文动机 编码器的不同类型的架构图,编码器(A-C)的结构分别来源于U-Net的编码器、解码器和全的Unet结构。 下面是上图的一些结果指标 将U-Net 的编码器和解码器都 阅读全文
posted @ 2023-03-25 10:04 deephub 阅读(109) 评论(0) 推荐(0)
摘要: 本文所整理的技巧与以前整理过10个Pandas的常用技巧不同,你可能并不会经常的使用它,但是有时候当你遇到一些非常棘手的问题时,这些技巧可以帮你快速解决一些不常见的问题。 https://avoid.overfit.cn/post/bf6e2fa626494a3789aa6b4d49657448 阅读全文
posted @ 2023-03-24 11:19 deephub 阅读(10) 评论(0) 推荐(0)
摘要: BART模型是用来预训练seq-to-seq模型的降噪自动编码器(autoencoder)。它是一个序列到序列的模型,具有对损坏文本的双向编码器和一个从左到右的自回归解码器,所以它可以完美的执行翻译任务。 如果你想在翻译任务上测试一个新的体系结构,比如在自定义数据集上训练一个新的标记,那么处理起来会 阅读全文
posted @ 2023-03-23 10:44 deephub 阅读(57) 评论(0) 推荐(0)
摘要: 深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)是受Deep Q-Network启发的无模型、非策略深度强化算法,是基于使用策略梯度的Actor-Critic,本文将使用pytorch对其进行完整的实现和讲解 DDPG的关键组成部分是 Repla 阅读全文
posted @ 2023-03-22 10:51 deephub 阅读(632) 评论(0) 推荐(0)
上一页 1 ··· 85 86 87 88 89 90 91 92 93 ··· 139 下一页