随笔分类 -  NLP

摘要:近期做实验频繁用到BERT,所以想着下载下来使用,结果各种问题,网上一搜也是简单一句:xxx.from_pretrained("改为自己的路径") 我只想说,大坑!!! 废话不多说: ##1.下载模型文件: 不管你是从hugging-face还是哪里下载来的模型(pytorch版)文件夹,应该包含以 阅读全文
posted @ 2022-01-28 12:03 ZhangHT97 阅读(22752) 评论(4) 推荐(7)
摘要:##问题: 本人在使用BERT进行微调的时候,在读取数据的时候出现了一个错误:ValueError: too many dimensions 'str' 于是我Debug了以后,发现问题出现在这个部分:tensor_labels = torch.tensor(labels, dtype=label_ 阅读全文
posted @ 2020-08-13 16:32 ZhangHT97 阅读(19868) 评论(0) 推荐(3)
摘要:1.LTP介绍 ltp是哈工大出品的自然语言处理工具箱, 提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、 高效、精准的自然语言处理技术。pyltp是python下对ltp(c++)的封装. 在linux下我们很容易的安装pyltp, 因为各种编译工具比较方便. 但是在w 阅读全文
posted @ 2020-08-04 21:14 ZhangHT97 阅读(3149) 评论(0) 推荐(0)
摘要:##TF-IDF的向量表示的稀疏问题 之前在看tf-idf代码时候思考了一个问题,不知道对于初学的大部分同学有没有这样一个疑惑,用tf-idf值构成的向量,维度可能跟词表的大小有关,那么对于一句话来说,这样的向量表示是不是太稀疏了? 例如,对于下面的数据(文档),词表大小为32个词,那么我们每一句话 阅读全文
posted @ 2020-07-26 16:15 ZhangHT97 阅读(799) 评论(0) 推荐(0)
摘要:##论文题目:Matching Article Pairs with Graphical Decomposition and Convolutions ##发表情况:ACL2019 腾讯PCG小组 ###模型简介 模型如图 本文的工作是基于概念图 Concept Interac-tion Graph 阅读全文
posted @ 2020-07-22 17:28 ZhangHT97 阅读(1799) 评论(0) 推荐(0)