hahahaf - 博客园

2020年4月14日

摘要： noise generalization：提高降噪模型对噪声的泛化性，主要还是通过增加噪声数据的多样性（可以收集不同噪声数据/或对噪声数据做perturbation）噪声数据集： sound-ideas 包含各种噪声类型，但是要收费 https://www.sound-ideas.com/ fr 阅读全文

posted @ 2020-04-14 11:23 hahahaf 阅读(856) 评论(0) 推荐(0)

2020年3月4日

如何使用没有标签的数据？或者如何用没有标签的数据提升模型效果？

摘要：要用到无标签的数据就要给无标签的数据造一个监督训练的目标，常用的造目标的方法： Pseudo-labeling 可以用现有的数据训练模型，在用模型跑无标签的数据得到一个假的label，用无标签数据和假的label 帮助训练模型，最后再用有label数据finetune data augmentati 阅读全文

posted @ 2020-03-04 18:53 hahahaf 阅读(936) 评论(0) 推荐(0)

2020年3月3日

训练语音降噪模型的一些感想

摘要：当前基于深度学习的语音降噪方法主要分为两个类：基于TF时频域的方法（有两大类：基于mask和非基于mask的方法）基于时域的方法，就我自己的实验结果来说，基于时域的方法比基于TFmask的方法要差一些，可能这样方法的trick更多一些吧。基于时频域方法中的基于mask的方法更常见一些，主要的阅读全文

posted @ 2020-03-03 17:48 hahahaf 阅读(1156) 评论(0) 推荐(0)

2020年2月24日

遍历所有wav得到长度

摘要： kaldi : wav-to-duration scp:aishell_test_wav.scp ark,t:length.txt sox: for A in `cat aishell_test.file` do sox $A -n stat >> length.txt done cat lengt 阅读全文

posted @ 2020-02-24 18:48 hahahaf 阅读(237) 评论(0) 推荐(0)

git 学习（git fetch/ git pull/ git rebase/ git cherry-pick的区别）

摘要：使用git做开发管理： 1. Git clone 将远程代码克隆到本地； 2. Git branch 查看本地branch (git clone 时会创建 master) 3. git branch -a 查看本地和远程分支；（远程分支包括 remotes/origin/master 远程maste 阅读全文

posted @ 2020-02-24 18:12 hahahaf 阅读(2152) 评论(0) 推荐(0)

2020年2月21日

tensorflow计算图

摘要： tensorflow计算图计算图是对有向图的表示，主要包含点和边；tensorflow使用计算图计算，计算图的点对应于ops，variables，constant，placeholder等，边对应于Tensors。因此tensorflow主要包含两个部分：构建计算图和runtime运行计算图。为阅读全文

posted @ 2020-02-21 15:33 hahahaf 阅读(494) 评论(0) 推荐(0)

神经网络fully_connected层的forward 和backward实现

摘要：接着上篇tensorflow compute graph的理解，其中operation node 需要给运算定义forward 和backward函数。这篇中我们实现一个简单的fully_connected layer的forward 和backward 函数： class fullyconnect 阅读全文

posted @ 2020-02-21 15:31 hahahaf 阅读(929) 评论(0) 推荐(0)

depthwise模型训练不容易收敛

摘要：为了做模型压缩，常见方法将正常卷积换成seperable 卷积（正常卷积和可分离卷积具体见下图）（1）正常卷积（2）depthwise 卷积（3）pointwise 卷积正常卷积卷积的大小： kernel_size_w * kernel_size_h * input_channel 阅读全文

posted @ 2020-02-21 15:29 hahahaf 阅读(428) 评论(0) 推荐(0)

2018年1月9日

视频分割

摘要：主要的视频分割算法分为两类： OSVOS（one shot video object segmentation）每一帧单独处理 MaskTrack考虑时序信息在MaskTrack中，首先使用图像语义分割网络（deeplabv2）得到instance segmentation。但问题是：怎么让网络知阅读全文

posted @ 2018-01-09 16:36 hahahaf 阅读(1551) 评论(0) 推荐(0)

2017年12月16日

torchvision 作用

摘要： 1. 提供主流的model，和常用数据集 2. 对 torch.utils.data.Dataset进行扩充，针对不同类别图像放入不同文件夹的数据进行读取， torchvision.datasets.ImageFolder是torch.utils.data.Dataset 的子类。 3.提供tran 阅读全文

posted @ 2017-12-16 11:34 hahahaf 阅读(2510) 评论(0) 推荐(0)

哈哈哈

公告