随笔分类 - read
以摘录为主,记录一些有可能会用到的方法或灵感
摘要:Pix2Seq:谷歌大脑提出 CV 任务统一接口! 以自然语言为输出的任务,比如image captioning、visual question answering这类任务,天然可以转化为生成text token sequence。但模型的输出形式还存在很多其他的形式,例如bounding box、
阅读全文
摘要:GANs N' Roses: Stable, Controllable, Diverse Image to Image Translation (works for videos too!) 知乎分析:论文阅读:GANs N’ Roses: Stable, Controllable, Diverse
阅读全文
摘要:2022-6-28 11:47:49 Paddle 生成对抗网络七日打卡营 GAN发展介绍 DCGAN 顾名思义,DCGAN主要讨论 CNN 与 GAN 如何结合使用并给出了一系列建议。由于卷积神经网络(Convolutional neural network, CNN)比MLP有更强的拟合与表达能
阅读全文
摘要:从零带你入门stylegan~stylegan3的技术细节 https://blog.csdn.net/xjm850552586/article/details/122027019 Mapping network: 用于将latent code z 转换成为 w Synthesis network:
阅读全文
摘要:0. 原作 论文:XMP-Font: Self-Supervised Cross-Modality Pre-training for Few-Shot Font Generation 代码:https://github.com/lfy523/XMP-Font (截止发文时还未公开代码,仅有仓库) 1
阅读全文
摘要:2022-6-20 14:28:01 近年图像翻译先进模型小结 https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/106484848 图像翻译学习笔记( Image-to-Image Translation) 定义 图像翻译技旨在通过设计端
阅读全文
摘要:2022-6-13 13:18:16 Brittman读了200多篇中国人的SCI论文,总结出了这些高频错误,你中枪了吗? https://www.10kn.com/most-common-habits-from-english-papers-written-by-chinese-engineeri
阅读全文
摘要:2022-5-27 14:24:54 谷歌提出 RNN 版 Transformer,或为长文本建模的当前最优解 https://mp.weixin.qq.com/s?__biz=MzIwNzc2NTk0NQ==&mid=2247525301&idx=1&sn=eefd50e294422bed98ea
阅读全文
摘要:2022-6-6 10:49:34 该死,我又心动了,这都能行 https://mp.weixin.qq.com/s/kLEvmDPLiW0BWSZS4eSvdw 谷歌的Imagen:文本到图像的生成 首先,算法会采用 frozen T5-XXL 编码器对接收到的文本进行编码。输出送给文本转图像的扩
阅读全文
摘要:1. SEQUENCE-TO-SEQUENCE PIANO TRANSCRIPTION WITH TRANSFORMERS 1.1. 摘要 利用大数据集训练的定制深度神经网络模型近年在AMT上取得了进展,但这些模型需要特别设计的网络架构、输入输出表达和复杂的解码体系。这项工作中作者展示了使用标准解码
阅读全文
摘要:1. High-resolution Piano Transcription with Pedals by Regressing Onset and Offset Times 1.1. 引言 字节跳动所开源的高精度钢琴转谱系统对应的论文,明明是中国人写的却没有中文版本。 当前使用神经网络做AMT的缺
阅读全文
摘要:1. 前言 想要使用深度学习方法将乐曲转换为对应乐谱,即 music transcription 方面的研究,奈何这方面在国内似乎研究不多,网上资料零散稀少。 找了些相关的论文阅读,在此记录自己的一些收获感悟。 一开始甚至连 MIR, AMT 这些关键词都不知道,摸索了很久。 2. Automati
阅读全文

浙公网安备 33010602011771号