摘要: #### YouTube视频下载 - 安装`pytube`库 ```bash $ python -m pip install pytube ``` - 终端运行下载脚本,示例为1080p的 ```python >>> from pytube import YouTube >>> video_url 阅读全文
posted @ 2023-06-17 18:41 Danno 阅读(95) 评论(0) 推荐(0) 编辑
摘要: ## 引言 - 最近有空写了一下这个库,用来提取Office文件中的文本和图像内容,用作后续整理训练语料使用。 - 最新更新请移步:[Github](https://github.com/SWHL/ExtractOfficeContent) ## [Extract Office Content](h 阅读全文
posted @ 2023-06-10 16:03 Danno 阅读(39) 评论(0) 推荐(0) 编辑
摘要: #### 引言 - 说明:桌面版指的是可以直接解压,双击即可运行的版本。 - 通俗来说,对`rapidocr_web`做了打包,将相关依赖全部放到一个zip包中,不需要本地有额外的环境,降低使用门槛。 - 下面会以Windows版为例,作简要说明。 - 详情参见:[RapidOCR Web](htt 阅读全文
posted @ 2023-05-20 11:31 Danno 阅读(101) 评论(0) 推荐(0) 编辑
摘要: 引言 考虑到提取视频字幕的小伙伴大多不是程序员行当,为了降低使用门槛,特此推出界面版的RapidVideOCR Desktop. RapidVideOCR Desktop需要搭配VideoSubFinder使用。它们两个关系如下图所示: flowchart LR A(VideoSubFinder) 阅读全文
posted @ 2023-05-17 22:14 Danno 阅读(433) 评论(0) 推荐(0) 编辑
摘要: 引言 Github Github是一个托管网站,目前主要用来托管代码,当然托管其他的也可。但是网不好的小伙伴可以考虑使用Gitee作为平替。 Sphinx Sphinx是什么? Sphinx是一个自动生成文档的工具,可以用简洁的语法快速生成优雅的文档。 哪些场景要用Sphinx? 如果想要写书,不想 阅读全文
posted @ 2023-04-02 15:35 Danno 阅读(147) 评论(0) 推荐(1) 编辑
摘要: 引言 接着上两篇文章 Github + Sphinx+Read the docs 实战入门指南(一) Github + Sphinx+Read the docs 实战入门指南(二) 我们已经成功地将Sphinx文档部署到了Read the docs网站,但是这个文档,我们不想每次都要手动更新内容,想 阅读全文
posted @ 2023-04-02 15:34 Danno 阅读(54) 评论(0) 推荐(0) 编辑
摘要: 引言 接上一篇Github + Sphinx+Read the docs 实战入门指南(一),这一篇主要讲解如何自动将指定文档内容部署到Read the docs中。 对于文档,一般有以下基本要求: 只维护一份,其他地方自动同步更新 可以根据代码注释,动态更新维护相应的API文档 支持检索 多版本之 阅读全文
posted @ 2023-04-02 15:33 Danno 阅读(75) 评论(0) 推荐(0) 编辑
摘要: 引言 本篇文章旨在帮助不会python编程的小伙伴,快速使用RapidVideOCR视频硬字幕提取工具。 可以运行的操作系统: Windows | Mac | Linux 配置环境 1. 安装VideoSubFinder软件(用于提取字幕关键帧) [RapidVideOCR周边] VideoSubF 阅读全文
posted @ 2023-03-28 08:28 Danno 阅读(91) 评论(0) 推荐(0) 编辑
摘要: 什么是语义化版本号? 语义化版本号,这个词说明首先是一个版本号,再者才是语义化的版本号。 说起版本号,我们日常应该有看到,例如微信的每次更新都有版本号。 版本号是用来区分每次发布的版本的。这样方便软件开发人员迭代优化。而本篇文章所说的语义化版本号,是在版本号基础上添加语义信息。 换句话说,语义化版本 阅读全文
posted @ 2023-03-22 18:34 Danno 阅读(62) 评论(0) 推荐(0) 编辑
摘要: RapidAI/paddleocr_convert =3.7, 仓库地址:Github 本仓库主要是针对性地将PaddleOCR中推理模型转换为ONNX格式。 注意: 输入:推理模型的url或者本地tar路径 输出:转换后的ONNX模型 如果是识别模型,需要提供对应字典的原始txt路径(打开gith 阅读全文
posted @ 2023-03-21 14:43 Danno 阅读(260) 评论(0) 推荐(0) 编辑