沉默的背影 X-Pacific

keep learning

摘要: 阿里达摩院开源大型端到端语音识别工具包FunASR: FunASR提供了在大规模工业语料库上训练的模型,并能够将其部署到应用程序中。工具包的核心模型是Paraformer,这是一个非自回归的端到端语音识别模型,经过手动注释的普通话语音识别数据集进行了训练,该数据集包含60,000小时的语音数据。为了 阅读全文
posted @ 2025-06-29 15:02 乂墨EMO 阅读(367) 评论(0) 推荐(0)
摘要: 官方文档 https://github.com/unclecode/crawl4ai 安装环境 python3.9+ (原因:https://github.com/unclecode/crawl4ai/issues/826) pip install -U crawl4ai crawl4ai-setu 阅读全文
posted @ 2025-06-24 13:50 乂墨EMO 阅读(241) 评论(0) 推荐(0)
摘要: https://github.com/duixcom/Duix.Heygem 安装docker https://www.docker.com/ 调整镜像的位置 调整下载镜像的地址(加快镜像下载速度) 开启docker中遇到的错误 WSL 安装失败解决方案 wsl --update wsl更新时安全频 阅读全文
posted @ 2025-06-22 16:04 乂墨EMO 阅读(405) 评论(0) 推荐(0)
摘要: 我本地是5080 16G 把安装过程和坑记录一下(坑基本上都在github上找到解决方案) 下载源码(必须用git的方式) https://github.com/FunAudioLLM/CosyVoice git clone --recursive https://github.com/FunAud 阅读全文
posted @ 2025-06-15 15:43 乂墨EMO 阅读(287) 评论(2) 推荐(1)
摘要: 下载模型至本地 下载bge的rerank模型https://huggingface.co/BAAI/bge-reranker-base 注意需要FQ 上代码 class SingletonFlagReranker: def __init__(self, model_path, use_fp16): 阅读全文
posted @ 2025-05-27 14:17 乂墨EMO 阅读(730) 评论(0) 推荐(0)
摘要: qdrant是一个开源向量数据库,安装方法有多种,具体参考: https://github.com/qdrant/qdrant-client?tab=readme-ov-file#connect-to-qdrant-server https://qdrant.tech/documentation/i 阅读全文
posted @ 2024-08-01 14:59 乂墨EMO 阅读(3436) 评论(0) 推荐(0)
摘要: Transformer注意力架构原理 输入层 embedding词嵌入向量 将文本中词汇的数字表示转变为向量表示,在这样的高维空间捕捉词汇间的关系 语义相近的词语对应的向量位置也更相近 每个词先通过词典转换成tokenId,在把tokenId转化为一个512纬的向量 位置编码 将每个词的位置向量(通 阅读全文
posted @ 2024-06-21 09:46 乂墨EMO 阅读(199) 评论(0) 推荐(1)
摘要: 本案例通过Deep3DFaceRecon_pytorch实现 前置文档: https://github.com/sicxu/Deep3DFaceRecon_pytorch https://blog.csdn.net/flyfish1986/article/details/121861086 本文是在 阅读全文
posted @ 2024-01-31 17:10 乂墨EMO 阅读(695) 评论(0) 推荐(0)
摘要: redis分布式锁的实现方式是: lock(){ sync(this){ //无法获取自旋 setnx(key,UUID) setex(60s) return UUID } } unlock(key,value){ sync(this){ if(get(key) == UUID){ del(key) 阅读全文
posted @ 2022-10-29 23:01 乂墨EMO 阅读(81) 评论(0) 推荐(0)
摘要: maven依赖 spring-boot-starter-webmybatis-spring-boot-startermysql-connector-javalombok application.yml server: port: 8080 # 启动端口 spring: datasource: db1 阅读全文
posted @ 2022-09-29 20:38 乂墨EMO 阅读(618) 评论(1) 推荐(0)
摘要: 阅读全文
posted @ 2022-07-12 11:13 乂墨EMO 阅读(88) 评论(0) 推荐(0)
摘要: 一些必须提前知道的概念 patition kafka日志文件是以patition在物理存储上分割的 是topic物理上的分组,一个topic可以分为多个partition,每个partition是一个有序的队列 是以文件夹的形式存储在具体Broker本机上 LEO 表示每个partition的log 阅读全文
posted @ 2022-05-20 11:54 乂墨EMO 阅读(2015) 评论(0) 推荐(0)
摘要: DCT全称为Discrete Cosine Transform,即离散余弦变换。DCT变换属于傅里叶变换的一种,常用于对信号和图像(包括图片和视频)进行数据压缩的基础。 在视频压缩历史上重要的发明之一就是DCT。没有DCT,后面的H.26X, JPEG等一系列压缩标准将无从谈起。 DCT有比较复杂的 阅读全文
posted @ 2022-03-29 16:35 乂墨EMO 阅读(6017) 评论(0) 推荐(1)
摘要: HDFS由namenode以及datanode两个角色组成 NameNode 作用 1、NameNode 负责整个分布式文件系统的元数据(MetaData)管理,也就是文件路径名、数据块的 ID 以及存储位置等信息2、接受DD上报的信息3、给DD分配任务(维护副本数) 元数据的存储文件方式:edit 阅读全文
posted @ 2022-03-21 20:41 乂墨EMO 阅读(420) 评论(0) 推荐(0)
摘要: spark调度的几个概念 集群 一个spark集群可以同时运行多个spark应用 应用 1、main方法、spark-shell、spark-submit能够运行的spark程序 2、可以理解为创建SparkContext的driver运行的程序 3、一个spark应用可以运行多个job job j 阅读全文
posted @ 2022-03-21 17:32 乂墨EMO 阅读(103) 评论(0) 推荐(0)