2022年1月14日

关于量化【转载以学习、回忆】

摘要: 关于量化 还不明白 转载一篇以学习、回忆 来源链接:https://zhuanlan.zhihu.com/p/86900556 何谓量化,打个比方,看 1080p 太慢,于是降到 720p 看。 同样的,如果用完整 32 位训练和保存的模型看作 1080p 的话,那么量化完后模型就可以当作是 720 阅读全文

posted @ 2022-01-14 14:00 nlp如此迷人 阅读(387) 评论(0) 推荐(0)

2021年12月18日

关于宏平均、微平均、加权平均

摘要: 最近用学了下pytorch ,简单写了一个文本分类的小实验。 指标使用了sklearn,为了加深印象。搜索了一下宏平均、微平均、加权平均的定义。 来源:https://blog.csdn.net/weixin_43090631/article/details/107208216 对于 精准率(pre 阅读全文

posted @ 2021-12-18 17:45 nlp如此迷人 阅读(1138) 评论(0) 推荐(0)

2021年12月1日

Sentence-BERT

摘要: 来源https://www.cnblogs.com/gczr/p/12874409.html 记录 用以回忆 来源于上述网址 (1)pooling策略 SBERT在BERT/RoBERTa的输出结果上增加了一个pooling操作,从而生成一个固定大小的句子embedding向量。实验中采取了三种po 阅读全文

posted @ 2021-12-01 15:23 nlp如此迷人 阅读(1092) 评论(0) 推荐(0)

2021年11月19日

关于Tokenizer总结

摘要: 来源huggingface文档https://huggingface.co/transformers/tokenizer_summary.html 文本进行标记是将其拆分为词或子词,然后通过查找表将其转换为 id。Transformer包中使用三种主要类型的分词器: 字节对编码 (BPE)、Word 阅读全文

posted @ 2021-11-19 11:32 nlp如此迷人 阅读(923) 评论(0) 推荐(0)

2021年6月27日

有关KKT条件

摘要: 来源:https://zhuanlan.zhihu.com/p/26514613 0.什么是KKT条件 本文从本科高数(微积分)中的有条件极值的Lagrange乘数法入手,一步步推导到KKT条件. 但在讲述推导过程之前,我想先给出KKT条件: 对于具有等式和不等式约束的一般优化问题 KKT条件给出了 阅读全文

posted @ 2021-06-27 09:11 nlp如此迷人 阅读(467) 评论(0) 推荐(0)

2021年4月19日

tensorflow中GPU 与 CPU利用率以及内存相关问题

摘要: 转载:来源CSDN https://blog.csdn.net/qq_34405401/article/details/108519823 1. GPU内存占用率问题 这往往是由于模型的大小以及batch size的大小,来影响这个指标。当你发下你的GPU占用率很小的时候,比如40%,70%,等等。 阅读全文

posted @ 2021-04-19 21:04 nlp如此迷人 阅读(3016) 评论(0) 推荐(0)

2021年4月10日

稀疏分类交叉熵与稀疏分类交叉熵的使用差异

摘要: sparsecategoricalcrossentropy,和,SparseCategoricalCrossentropy,用法,区别 这两个函数的功能都是将数字编码转化成one-hot编码格式,然后对one-hot编码格式的数据(真实标签值)与预测出的标签值使用交叉熵损失函数。 先看一下官网给出的 阅读全文

posted @ 2021-04-10 19:09 nlp如此迷人 阅读(1893) 评论(0) 推荐(0)

交叉熵损失函数的原理 相关

摘要: 一、二分类损失函数 1.1 从一个简单的实例说起 对于一个二分类问题,比如我们有一个样本,有两个不同的模型对他进行分类,那么它们的输出都应该是一个二维向量,比如: 模型一的输出为:pred_y1=[0.8,0.2] 模型二的输出为:pred_y2=[0.6,0.4] 需要注意的是,这里的数值已经经过 阅读全文

posted @ 2021-04-10 11:21 nlp如此迷人 阅读(680) 评论(0) 推荐(0)

2021年3月31日

Python将list元素转存为CSV文件

摘要: 首先先定义一个list,将其转存为csv文件,看将会报什么错误:list=[[1,2,3],[4,5,6],[7,9,9]]list.to_csv('e:/testcsv.csv',encoding='utf-8')运行后出现:Traceback (most recent call last): F 阅读全文

posted @ 2021-03-31 19:12 nlp如此迷人 阅读(3108) 评论(0) 推荐(0)

2021年3月30日

CNN中相关参数个数的计算

摘要: Consider a CNN composed of three convolutional layers, each with 3 × 3 kernels, a stride of 2, and "same" padding. The lowest layer outputs 100 featur 阅读全文

posted @ 2021-03-30 19:14 nlp如此迷人 阅读(256) 评论(0) 推荐(0)

导航