会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
哈哈哈
博客园
首页
新随笔
联系
订阅
管理
1
2
3
4
5
···
16
下一页
2020年4月14日
提高降噪模型的泛化能力(包含一些噪声数据链接)
摘要: noise generalization: 提高降噪模型对噪声的泛化性,主要还是通过增加噪声数据的多样性(可以收集不同噪声数据/或对噪声数据做perturbation) 噪声数据集: sound-ideas 包含各种噪声类型,但是要收费 https://www.sound-ideas.com/ fr
阅读全文
posted @ 2020-04-14 11:23 hahahaf
阅读(847)
评论(0)
推荐(0)
2020年3月4日
如何使用没有标签的数据?或者如何用没有标签的数据提升模型效果?
摘要: 要用到无标签的数据就要给无标签的数据造一个监督训练的目标,常用的造目标的方法: Pseudo-labeling 可以用现有的数据训练模型,在用模型跑无标签的数据得到一个假的label,用无标签数据和假的label 帮助训练模型,最后再用有label数据finetune data augmentati
阅读全文
posted @ 2020-03-04 18:53 hahahaf
阅读(928)
评论(0)
推荐(0)
2020年3月3日
训练语音降噪模型的一些感想
摘要: 当前基于深度学习的语音降噪方法主要分为两个类: 基于TF时频域的方法 (有两大类:基于mask和非基于mask的方法) 基于时域的方法,就我自己的实验结果来说,基于时域的方法比基于TFmask的方法要差一些,可能这样方法的trick更多一些吧。 基于时频域方法中的基于mask的方法更常见一些,主要的
阅读全文
posted @ 2020-03-03 17:48 hahahaf
阅读(1148)
评论(0)
推荐(0)
2020年2月24日
遍历所有wav得到长度
摘要: kaldi : wav-to-duration scp:aishell_test_wav.scp ark,t:length.txt sox: for A in `cat aishell_test.file` do sox $A -n stat >> length.txt done cat lengt
阅读全文
posted @ 2020-02-24 18:48 hahahaf
阅读(235)
评论(0)
推荐(0)
git 学习(git fetch/ git pull/ git rebase/ git cherry-pick的区别)
摘要: 使用git做开发管理: 1. Git clone 将远程代码克隆到本地; 2. Git branch 查看本地branch (git clone 时会创建 master) 3. git branch -a 查看本地和远程分支;(远程分支包括 remotes/origin/master 远程maste
阅读全文
posted @ 2020-02-24 18:12 hahahaf
阅读(2096)
评论(0)
推荐(0)
2020年2月21日
tensorflow计算图
摘要: tensorflow计算图 计算图是对有向图的表示,主要包含点和边;tensorflow使用计算图计算,计算图的点对应于ops,variables,constant,placeholder等,边对应于Tensors。因此tensorflow主要包含两个部分:构建计算图和runtime运行计算图。 为
阅读全文
posted @ 2020-02-21 15:33 hahahaf
阅读(492)
评论(0)
推荐(0)
神经网络fully_connected层的forward 和backward实现
摘要: 接着上篇tensorflow compute graph的理解,其中operation node 需要给运算定义forward 和backward函数。这篇中我们实现一个简单的fully_connected layer的forward 和backward 函数: class fullyconnect
阅读全文
posted @ 2020-02-21 15:31 hahahaf
阅读(924)
评论(0)
推荐(0)
depthwise模型训练不容易收敛
摘要: 为了做模型压缩,常见方法将正常卷积换成seperable 卷积(正常卷积和可分离卷积具体见下图) (1)正常卷积 (2)depthwise 卷积 (3)pointwise 卷积 正常卷积卷积的大小: kernel_size_w * kernel_size_h * input_channel
阅读全文
posted @ 2020-02-21 15:29 hahahaf
阅读(424)
评论(0)
推荐(0)
2018年1月9日
视频分割
摘要: 主要的视频分割算法分为两类: OSVOS(one shot video object segmentation)每一帧单独处理 MaskTrack考虑时序信息 在MaskTrack中,首先使用图像语义分割网络(deeplabv2)得到instance segmentation。但问题是:怎么让网络知
阅读全文
posted @ 2018-01-09 16:36 hahahaf
阅读(1548)
评论(0)
推荐(0)
2017年12月16日
torchvision 作用
摘要: 1. 提供主流的model,和常用数据集 2. 对 torch.utils.data.Dataset进行扩充,针对不同类别图像放入不同文件夹的数据进行读取, torchvision.datasets.ImageFolder是torch.utils.data.Dataset 的子类。 3.提供tran
阅读全文
posted @ 2017-12-16 11:34 hahahaf
阅读(2503)
评论(0)
推荐(0)
1
2
3
4
5
···
16
下一页
公告