摘要: 按照教程安装完成后运行出现下列错误: 解决方法: 将破解工具MATLAB_R2018b_Linux64_Crack目录下的/home/username/mnt/LINUX/MATLAB/R2018b/bin/glnxa64/matlab_startup_plugins/lmgrimpl/libmwl 阅读全文
posted @ 2022-01-04 11:58 彭源 阅读(1037) 评论(0) 推荐(0) 编辑
摘要: kenlm安装 依赖安装 sudo apt-get install build-essential libboost-all-dev cmake zlib1g-dev libbz2-dev liblzma-dev kenlm安装 wget -O - https://kheafield.com/cod 阅读全文
posted @ 2021-12-02 14:33 彭源 阅读(1376) 评论(0) 推荐(0) 编辑
摘要: faiss是Facebook开源的相似性搜索库,为稠密向量提供高效相似度搜索和聚类,支持十亿级别向量的搜索,是目前最为成熟的近似近邻搜索库 faiss不直接提供余弦距离计算,而是提供了欧式距离和点积,利用余弦距离公式,经过L2正则后的向量点积结果即为余弦距离,所以利用faiss计算余弦距离需要先对输 阅读全文
posted @ 2021-10-28 17:53 彭源 阅读(3411) 评论(0) 推荐(0) 编辑
摘要: 《Spelling Error Correction with Soft-Masked BERT》 最近在研究中文校对相关的东西,自然免不了先阅读前人大作,今天读的是2020ACL的soft-Masked。该文是做中文拼写纠错(CSC),换言之是实现映射函数F: X —> Y,其中len(X)=le 阅读全文
posted @ 2021-10-15 19:09 彭源 阅读(828) 评论(0) 推荐(0) 编辑
摘要: spacy依存句法分析的标签一直不清楚,官方文档也没明确指出,这里整理了常见的依存标签 计算机语言学家罗宾森总结了依存语法的四条定理: 1、一个句子中存在一个成分称之为根(root),这个成分不依赖于其它成分。 2、其它成分直接依存于某一成分; 3、任何一个成分都不能依存与两个或两个以上的成分; 4 阅读全文
posted @ 2021-09-08 10:28 彭源 阅读(2750) 评论(0) 推荐(0) 编辑
摘要: 先写个标题,有空来补坑 阅读全文
posted @ 2021-09-01 14:35 彭源 阅读(15) 评论(0) 推荐(0) 编辑
摘要: 多进程和多线程总是傻傻分不清,查阅资料得知主要区别有两点 一个进程可能包含多个线程,也就是线程概念小于进程 多线程共享进程数据,共享简单,但同步复杂,相反,多线程数据是分开,但同步简单 多进程 多进程我一遍会使用multiprocessing包 from multiprocessing import 阅读全文
posted @ 2021-08-24 21:12 彭源 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 最近有一个单元测试的任务,要对tornado实现的服务进行测试,初始考虑Test_Main类继承unittest.TestCase,然后使用多进程起服务,再在服务里面测试 import unittest from multiprocessing import Process def func(): 阅读全文
posted @ 2021-08-24 20:09 彭源 阅读(211) 评论(0) 推荐(0) 编辑
摘要: test.py import argparse parser = argparse.ArgumentParser() parser.add_argument('-p', type=int, required=False, default=80, help='port') args = parser. 阅读全文
posted @ 2021-08-04 10:55 彭源 阅读(122) 评论(0) 推荐(0) 编辑
摘要: ##C++新手菜鸟学习记录 一般情况下gcc是C的编译器,g是C的编译器 后缀为.c的,gcc会把其当作是C程序,g会把其当作是C程序。 后缀是.cpp的,二者都会把其当作是C++程序 编译阶段,g会调用gcc,但是gcc不会自动调用g。所以大多数情况下,都会使用g++ 在C代码中,如果想让某些函数 阅读全文
posted @ 2021-07-22 12:03 彭源 阅读(343) 评论(0) 推荐(0) 编辑