1 2 3 4 5 ··· 7 下一页
摘要: 语音识别(下) 北京大学的饶毅教授是非常令人尊敬的科学家。他的一篇最短致辞,轰动全网,是一个学者、有良知的人对学生的期待与祝福。为了方便比对,先将饶毅的原文列举如下。 在祝福裹着告诫呼啸而来的毕业季,请原谅我不敢祝愿每一位毕业生都成功、都幸福;因为历史不幸地记载着:有人的成功代价是丧失良知;有人的幸 阅读全文
posted @ 2025-08-15 16:36 西安衍舆航天 阅读(12) 评论(0) 推荐(0)
摘要: 语音识别(中) 上文介绍了SpeechRecognition第三方语音识别库,本文选择使用开源的paddlepaddle中的paddlespeech来进行语音识别。PaddleSpeech是all-in-one的语音算法工具箱,包含多种领先国际水平的语音算法与预训练模型。可以从中选择各种语音处理工具 阅读全文
posted @ 2025-08-15 16:35 西安衍舆航天 阅读(16) 评论(0) 推荐(0)
摘要: 语音识别(上) 经常看国外电视剧的读者,要不自身英语水平非常高,要不就依赖字幕。以前有好事者给大家翻译制作字幕,现在人人字幕倒了,只好自己找字幕或者自行制作了。此时,语音识别就大显神通了。语音识别源于20世纪50年代早期在贝尔实验室所做的研究。早期语音识别系统仅能识别单个讲话者以及只有约十几个单词的 阅读全文
posted @ 2025-08-15 16:33 西安衍舆航天 阅读(4) 评论(0) 推荐(0)
摘要: 对录音文件进行操作 在参加会议、论坛时经常会有录音的需求。但限于条件,经常会出现录音的声音小需要增强,无关内容需要剪切等需求。此时,就需要对音频文件进行变换。以下代码演示了部分变换功能。 from pydub import AudioSegment from pydub.silence import 阅读全文
posted @ 2025-08-15 16:30 西安衍舆航天 阅读(14) 评论(0) 推荐(0)
摘要: 从视频中提取音频 有时只有MTV文件,但是很想做为MP3收藏,就需要将音频从视频中提取出来。pydub库仍然是当仁不让的选择。 import glob from pathlib import Path import eyed3 import mutagen from pychorus import 阅读全文
posted @ 2025-08-15 16:27 西安衍舆航天 阅读(6) 评论(0) 推荐(0)
摘要: 从视频中提取音频 有时只有MTV文件,但是很想做为MP3收藏,就需要将音频从视频中提取出来。pydub库仍然是当仁不让的选择。 import glob from pathlib import Path import eyed3 import mutagen from pychorus import 阅读全文
posted @ 2025-08-15 16:22 西安衍舆航天 阅读(5) 评论(0) 推荐(0)
摘要: 播放音频文件 无数的音乐播放器可以对音频文件进行播放,这些播放器如何操作不在本文讨论之列。本文只是从python工具箱的角度来看,如何在python代码中播放音频文件,主要是mp3文件。特别神奇的一点是在python的世界里,真的是没有特别好的播放器!笔者试验了多个第三方库,发现能用的底层基本是都是 阅读全文
posted @ 2025-08-15 16:21 西安衍舆航天 阅读(7) 评论(0) 推荐(0)
摘要: 音频的操作 音乐是人类的通用语言,不分国界不分种族。而从数学角度看,音乐就是时间和频率的关系。声音的本质是波,人类听觉的原理就是波引起了耳朵鼓膜的振动。人们用不同乐器、不同力度,在一段连续时间里敲击,就组合出了时间和频率的关系。一切物体都有自己的频率,所以整个世界也可以理解为声音的盛宴。对于计算机而 阅读全文
posted @ 2024-12-23 14:55 西安衍舆航天 阅读(60) 评论(0) 推荐(0)
摘要: 图像分割与人脸识别 众所周知图像是由若干有意义的像素组成的,图像分割作为计算机视觉的基础,对具有现有目标和较精确边界的图像进行分割,实现在图像像素级别上的分类任务。图像分割可分为语义分割和实例分割两类,区别如下: 语义分割:将图像中每个像素赋予一个类别标签,用不同的颜色来表示。例如能够区分人脸与头发 阅读全文
posted @ 2024-10-30 15:27 西安衍舆航天 阅读(39) 评论(0) 推荐(0)
摘要: 抠图 抠图是基本需求,最常见的应用场景就是证件照,每次去拍照,都要用个纯色的幕布,而且要求衣服不能太浅。其实背后是有原因的:为了管理部门更准确识别出人像。许多科幻电影也是要求演员在绿幕前表演,后期抠图合成逼真的电影。抠图工具非常多,例如PhotoShop就是抠图利器,可以很神奇地把图片里的元素单独提 阅读全文
posted @ 2024-10-30 15:27 西安衍舆航天 阅读(41) 评论(0) 推荐(0)
1 2 3 4 5 ··· 7 下一页