随笔分类 -  read

以摘录为主,记录一些有可能会用到的方法或灵感
摘要:Pix2Seq:谷歌大脑提出 CV 任务统一接口! 以自然语言为输出的任务,比如image captioning、visual question answering这类任务,天然可以转化为生成text token sequence。但模型的输出形式还存在很多其他的形式,例如bounding box、 阅读全文
posted @ 2022-08-11 18:35 NoNoe 阅读(201) 评论(0) 推荐(0)
摘要:GANs N' Roses: Stable, Controllable, Diverse Image to Image Translation (works for videos too!) 知乎分析:论文阅读:GANs N’ Roses: Stable, Controllable, Diverse 阅读全文
posted @ 2022-08-11 18:30 NoNoe 阅读(423) 评论(0) 推荐(0)
摘要:2022-6-28 11:47:49 Paddle 生成对抗网络七日打卡营 GAN发展介绍 DCGAN 顾名思义,DCGAN主要讨论 CNN 与 GAN 如何结合使用并给出了一系列建议。由于卷积神经网络(Convolutional neural network, CNN)比MLP有更强的拟合与表达能 阅读全文
posted @ 2022-08-11 18:29 NoNoe 阅读(831) 评论(0) 推荐(0)
摘要:从零带你入门stylegan~stylegan3的技术细节 https://blog.csdn.net/xjm850552586/article/details/122027019 Mapping network: 用于将latent code z 转换成为 w Synthesis network: 阅读全文
posted @ 2022-08-11 18:29 NoNoe 阅读(717) 评论(0) 推荐(0)
摘要:0. 原作 论文:XMP-Font: Self-Supervised Cross-Modality Pre-training for Few-Shot Font Generation 代码:https://github.com/lfy523/XMP-Font (截止发文时还未公开代码,仅有仓库) 1 阅读全文
posted @ 2022-08-11 18:28 NoNoe 阅读(1273) 评论(1) 推荐(0)
摘要:2022-6-20 14:28:01 近年图像翻译先进模型小结 https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/106484848 图像翻译学习笔记( Image-to-Image Translation) 定义 图像翻译技旨在通过设计端 阅读全文
posted @ 2022-06-28 11:47 NoNoe 阅读(257) 评论(0) 推荐(0)
摘要:2022-6-13 13:18:16 Brittman读了200多篇中国人的SCI论文,总结出了这些高频错误,你中枪了吗? https://www.10kn.com/most-common-habits-from-english-papers-written-by-chinese-engineeri 阅读全文
posted @ 2022-06-13 15:25 NoNoe 阅读(1173) 评论(0) 推荐(0)
摘要:2022-5-27 14:24:54 谷歌提出 RNN 版 Transformer,或为长文本建模的当前最优解 https://mp.weixin.qq.com/s?__biz=MzIwNzc2NTk0NQ==&mid=2247525301&idx=1&sn=eefd50e294422bed98ea 阅读全文
posted @ 2022-06-13 13:22 NoNoe 阅读(434) 评论(0) 推荐(0)
摘要:2022-6-6 10:49:34 该死,我又心动了,这都能行 https://mp.weixin.qq.com/s/kLEvmDPLiW0BWSZS4eSvdw 谷歌的Imagen:文本到图像的生成 首先,算法会采用 frozen T5-XXL 编码器对接收到的文本进行编码。输出送给文本转图像的扩 阅读全文
posted @ 2022-06-13 13:22 NoNoe 阅读(1121) 评论(0) 推荐(0)
摘要:1. SEQUENCE-TO-SEQUENCE PIANO TRANSCRIPTION WITH TRANSFORMERS 1.1. 摘要 利用大数据集训练的定制深度神经网络模型近年在AMT上取得了进展,但这些模型需要特别设计的网络架构、输入输出表达和复杂的解码体系。这项工作中作者展示了使用标准解码 阅读全文
posted @ 2022-04-22 14:07 NoNoe 阅读(664) 评论(3) 推荐(0)
摘要:1. High-resolution Piano Transcription with Pedals by Regressing Onset and Offset Times 1.1. 引言 字节跳动所开源的高精度钢琴转谱系统对应的论文,明明是中国人写的却没有中文版本。 当前使用神经网络做AMT的缺 阅读全文
posted @ 2022-03-03 15:24 NoNoe 阅读(818) 评论(0) 推荐(0)
摘要:1. 前言 想要使用深度学习方法将乐曲转换为对应乐谱,即 music transcription 方面的研究,奈何这方面在国内似乎研究不多,网上资料零散稀少。 找了些相关的论文阅读,在此记录自己的一些收获感悟。 一开始甚至连 MIR, AMT 这些关键词都不知道,摸索了很久。 2. Automati 阅读全文
posted @ 2022-03-02 14:49 NoNoe 阅读(1034) 评论(0) 推荐(0)