摘要:noise generalization: 提高降噪模型对噪声的泛化性,主要还是通过增加噪声数据的多样性(可以收集不同噪声数据/或对噪声数据做perturbation) 噪声数据集: sound-ideas 包含各种噪声类型,但是要收费 https://www.sound-ideas.com/ fr 阅读全文
posted @ 2020-04-14 11:23 hahahaf 阅读(502) 评论(0) 推荐(0) 编辑
摘要:要用到无标签的数据就要给无标签的数据造一个监督训练的目标,常用的造目标的方法: Pseudo-labeling 可以用现有的数据训练模型,在用模型跑无标签的数据得到一个假的label,用无标签数据和假的label 帮助训练模型,最后再用有label数据finetune data augmentati 阅读全文
posted @ 2020-03-04 18:53 hahahaf 阅读(279) 评论(0) 推荐(0) 编辑
摘要:当前基于深度学习的语音降噪方法主要分为两个类: 基于TF时频域的方法 (有两大类:基于mask和非基于mask的方法) 基于时域的方法,就我自己的实验结果来说,基于时域的方法比基于TFmask的方法要差一些,可能这样方法的trick更多一些吧。 基于时频域方法中的基于mask的方法更常见一些,主要的 阅读全文
posted @ 2020-03-03 17:48 hahahaf 阅读(642) 评论(0) 推荐(0) 编辑
摘要:kaldi : wav-to-duration scp:aishell_test_wav.scp ark,t:length.txt sox: for A in `cat aishell_test.file` do sox $A -n stat >> length.txt done cat lengt 阅读全文
posted @ 2020-02-24 18:48 hahahaf 阅读(121) 评论(0) 推荐(0) 编辑
摘要:使用git做开发管理: 1. Git clone 将远程代码克隆到本地; 2. Git branch 查看本地branch (git clone 时会创建 master) 3. git branch -a 查看本地和远程分支;(远程分支包括 remotes/origin/master 远程maste 阅读全文
posted @ 2020-02-24 18:12 hahahaf 阅读(750) 评论(0) 推荐(0) 编辑
摘要:tensorflow计算图 计算图是对有向图的表示,主要包含点和边;tensorflow使用计算图计算,计算图的点对应于ops,variables,constant,placeholder等,边对应于Tensors。因此tensorflow主要包含两个部分:构建计算图和runtime运行计算图。 为 阅读全文
posted @ 2020-02-21 15:33 hahahaf 阅读(202) 评论(0) 推荐(0) 编辑
摘要:接着上篇tensorflow compute graph的理解,其中operation node 需要给运算定义forward 和backward函数。这篇中我们实现一个简单的fully_connected layer的forward 和backward 函数: class fullyconnect 阅读全文
posted @ 2020-02-21 15:31 hahahaf 阅读(431) 评论(0) 推荐(0) 编辑
摘要:为了做模型压缩,常见方法将正常卷积换成seperable 卷积(正常卷积和可分离卷积具体见下图) ​​​ (1)正常卷积 (2)depthwise 卷积 (3)pointwise 卷积 正常卷积卷积的大小: kernel_size_w * kernel_size_h * input_channel 阅读全文
posted @ 2020-02-21 15:29 hahahaf 阅读(268) 评论(0) 推荐(0) 编辑
摘要:主要的视频分割算法分为两类: OSVOS(one shot video object segmentation)每一帧单独处理 MaskTrack考虑时序信息 在MaskTrack中,首先使用图像语义分割网络(deeplabv2)得到instance segmentation。但问题是:怎么让网络知 阅读全文
posted @ 2018-01-09 16:36 hahahaf 阅读(1267) 评论(0) 推荐(0) 编辑
摘要:1. 提供主流的model,和常用数据集 2. 对 torch.utils.data.Dataset进行扩充,针对不同类别图像放入不同文件夹的数据进行读取, torchvision.datasets.ImageFolder是torch.utils.data.Dataset 的子类。 3.提供tran 阅读全文
posted @ 2017-12-16 11:34 hahahaf 阅读(2065) 评论(0) 推荐(0) 编辑