read - 随笔分类(第5页) - NoNoe

Master笔记 22-7-18 @Pix2Seq@大卷积核CNN

摘要：Pix2Seq：谷歌大脑提出 CV 任务统一接口！以自然语言为输出的任务，比如image captioning、visual question answering这类任务，天然可以转化为生成text token sequence。但模型的输出形式还存在很多其他的形式，例如bounding box、阅读全文

posted @ 2022-08-11 18:35 NoNoe 阅读(201) 评论(0) 推荐(0)

Master笔记 22-7-11 @GANs N' Roses@GAN指标

摘要：GANs N' Roses: Stable, Controllable, Diverse Image to Image Translation (works for videos too!) 知乎分析：论文阅读：GANs N’ Roses: Stable, Controllable, Diverse 阅读全文

posted @ 2022-08-11 18:30 NoNoe 阅读(423) 评论(0) 推荐(0)

Master笔记 22-6-27 @GAN@汉字生成

摘要：2022-6-28 11:47:49 Paddle 生成对抗网络七日打卡营 GAN发展介绍 DCGAN 顾名思义，DCGAN主要讨论 CNN 与 GAN 如何结合使用并给出了一系列建议。由于卷积神经网络(Convolutional neural network, CNN)比MLP有更强的拟合与表达能阅读全文

posted @ 2022-08-11 18:29 NoNoe 阅读(831) 评论(0) 推荐(0)

Master笔记 22-7-4 @StyleGAN@U-GAT-IT@汉字风格内容解耦@2022图像翻译

摘要：从零带你入门stylegan~stylegan3的技术细节 https://blog.csdn.net/xjm850552586/article/details/122027019 Mapping network: 用于将latent code z 转换成为 w Synthesis network: 阅读全文

posted @ 2022-08-11 18:29 NoNoe 阅读(717) 评论(0) 推荐(0)

[论文阅读] XMP-Font: Self-Supervised Cross-Modality Pre-training for Few-Shot Font Generation

摘要：0. 原作论文：XMP-Font: Self-Supervised Cross-Modality Pre-training for Few-Shot Font Generation 代码：https://github.com/lfy523/XMP-Font （截止发文时还未公开代码，仅有仓库） 1 阅读全文

posted @ 2022-08-11 18:28 NoNoe 阅读(1273) 评论(1) 推荐(0)

Master笔记 22-6-20 @图像翻译@Kaggle技巧@自编码器@扩散模型

摘要：2022-6-20 14:28:01 近年图像翻译先进模型小结 https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/106484848 图像翻译学习笔记（ Image-to-Image Translation）定义图像翻译技旨在通过设计端阅读全文

posted @ 2022-06-28 11:47 NoNoe 阅读(257) 评论(0) 推荐(0)

Master笔记 22-6-13 @英文论文书写@DETR@ViT@CLIP@汉字手写数据集@SwinT@StarGAN

摘要：2022-6-13 13:18:16 Brittman读了200多篇中国人的SCI论文，总结出了这些高频错误，你中枪了吗？ https://www.10kn.com/most-common-habits-from-english-papers-written-by-chinese-engineeri 阅读全文

posted @ 2022-06-13 15:25 NoNoe 阅读(1173) 评论(0) 推荐(0)

Master笔记 22-5-27 @多模态@GAN@Prompt

摘要：2022-5-27 14:24:54 谷歌提出 RNN 版 Transformer，或为长文本建模的当前最优解 https://mp.weixin.qq.com/s?__biz=MzIwNzc2NTk0NQ==&mid=2247525301&idx=1&sn=eefd50e294422bed98ea 阅读全文

posted @ 2022-06-13 13:22 NoNoe 阅读(434) 评论(0) 推荐(0)

Master笔记 22-6-6 @多模态数据集

摘要：2022-6-6 10:49:34 该死，我又心动了，这都能行 https://mp.weixin.qq.com/s/kLEvmDPLiW0BWSZS4eSvdw 谷歌的Imagen：文本到图像的生成首先，算法会采用 frozen T5-XXL 编码器对接收到的文本进行编码。输出送给文本转图像的扩阅读全文

posted @ 2022-06-13 13:22 NoNoe 阅读(1121) 评论(0) 推荐(0)

[论文阅读] MIR音乐信息检索3

摘要：1. SEQUENCE-TO-SEQUENCE PIANO TRANSCRIPTION WITH TRANSFORMERS 1.1. 摘要利用大数据集训练的定制深度神经网络模型近年在AMT上取得了进展，但这些模型需要特别设计的网络架构、输入输出表达和复杂的解码体系。这项工作中作者展示了使用标准解码阅读全文

posted @ 2022-04-22 14:07 NoNoe 阅读(664) 评论(3) 推荐(0)

[论文阅读] MIR音乐信息检索2

摘要：1. High-resolution Piano Transcription with Pedals by Regressing Onset and Offset Times 1.1. 引言字节跳动所开源的高精度钢琴转谱系统对应的论文，明明是中国人写的却没有中文版本。当前使用神经网络做AMT的缺阅读全文

posted @ 2022-03-03 15:24 NoNoe 阅读(818) 评论(0) 推荐(0)

[论文阅读] MIR音乐信息检索1

摘要：1. 前言想要使用深度学习方法将乐曲转换为对应乐谱，即 music transcription 方面的研究，奈何这方面在国内似乎研究不多，网上资料零散稀少。找了些相关的论文阅读，在此记录自己的一些收获感悟。一开始甚至连 MIR, AMT 这些关键词都不知道，摸索了很久。 2. Automati 阅读全文

posted @ 2022-03-02 14:49 NoNoe 阅读(1034) 评论(0) 推荐(0)

心有所向，日复一日，必有精进

羽ばたき方を忘れたって、飛んでる夢を見る

随笔分类 - read

公告