01 2018 档案
摘要:前年学习opengl做的一个小东西。 原本计划将gpuimage 的算法一个一个转写成cpu版本 c,c++ 版本。 gpuimage 项目参考: https://github.com/BradLarson/GPUImage https://github.com/BradLarson/GPUImag
阅读全文
摘要:ncnn刚发布不久,博主在ios下尝试编译。 遇上了openmp的编译问题。 寻找各种解决方案无果,亲自操刀。 采用std::thread 替换 openmp。 ncnn项目地址: https://github.com/Tencent/ncnn 后来询问ncnn的作者才知道在ios下的编译方法。 至
阅读全文
摘要:前年年前做一个手机移动端图像识别项目的时候, 先后尝试了mxnet,thnets,caffe,tensorflow. 当时的情况是,mxnet内存管理奇差,内存经常由于模型运算分配不足,app挂掉。 后来调研了下caffe发现也很不友好。 最后发现thnets相对比较轻巧, 经过算法调优之后,性能还
阅读全文
摘要:上周看到一个变调算法,挺有意思的,原本计划尝试用来润色TTS合成效果的。 实测感觉还需要进一步改进,待有空再思考改进方案。 算法细节原文,移步链接: http://blogs.zynaptiq.com/bernsee/pitch-shifting-using-the-ft/ C++开源的项目,比较老
阅读全文
摘要:在特定的应用场景下,有时候我们只是想获取图片的宽高, 但不想通过解码图片才取得这个信息。 预先知道图片的宽高信息,进而提速图片加载,预处理等相关操作以提升体验。 在stackoverflow有一篇相关讨论。 Get Image size WITHOUT loading image into memo
阅读全文
摘要:近期偶然间看到一个开源项目minimp3 Minimalistic MP3 decoder single header library 项目地址: https://github.com/lieff/minimp3 单文件头的最小mp3解码器。 一直很想抽时间好好看上一看。 最好的学习方式就是写个实用
阅读全文
摘要:bokeh百度百科的解释 摄影镜头光圈大小和拍摄距离决定了拍摄时的景深,相对于焦点位置,焦点前与焦点后的被拍摄物体会显得模糊,这个模糊区域被称为焦外。焦外具体的模糊程度还受到镜头中镜片单体和组合的物理特性影响,形成了由镜头不同而得到的不同的焦点外的图像。于是焦外成像这个技术名词出现了。优秀的焦外成像
阅读全文
摘要:抽空,实现了一份云知声 语音转写的python版本。 使用python通过调用动态库实现。 云知声官网: http://dev.hivoice.cn/sdk_download/schema_sdk.jsp 调用方法: python3 unisound_asr.py 音频文件 例: python3 u
阅读全文
摘要:与《分享用于学习C++图像处理的代码示例》为姊妹篇。 为了便于学习C++音频处理并研究音频算法, 俺写了一个适合初学者学习的小小框架。 麻雀虽小五脏俱全,仅仅考虑单通道处理。 采用Decoder and Encoder:dr_wav https://github.com/mackron/dr_lib
阅读全文

浙公网安备 33010602011771号