摘要:
Pytorch学习记录-torchtext和Pytorch的实例1 0. PyTorch Seq2Seq项目介绍 1. 使用神经网络训练Seq2Seq 1.1 简介,对论文中公式的解读 1.2 数据预处理 我们将在PyTorch中编写模型并使用TorchText帮助我们完成所需的所有预处理。我们还将 阅读全文
posted @ 2019-06-26 15:59
交流_QQ_2240410488
阅读(3013)
评论(0)
推荐(0)
摘要:
测试集大小: test.shape(898, 11) 对某列的字符串做统计长度1、for遍历法:start = time.time()for i in test.index.values: test.loc[i,'contentLen1'] = len(test.loc[i,'content'])t 阅读全文
posted @ 2019-06-26 15:27
交流_QQ_2240410488
阅读(3351)
评论(0)
推荐(2)
摘要:
在我们通常使用的windows系统中,我发现了一个有趣的现象。我新建一个空的文本文档,点击文件-另存为-编码选择UTF-8,然后保存。此时这个文件明明是空的,却占了3字节大小。原因在于:此时保存的编码方式自动会变为UTF-8 BOM 一、一个汉字在不同的编码方式中占多少字节? 1.在UTF-8中,一 阅读全文
posted @ 2019-06-26 14:45
交流_QQ_2240410488
阅读(207)
评论(0)
推荐(0)
摘要:
在UI自动化应用中,经常会出错,打log就是一个很重要的环节,python的logging.basicConfig函数 真是既方便,又简单,每次粘贴到用例前,就可以打log了。 logging模块是Python内置的标准模块,主要用于输出运行日志,可以设置输出日志的等级、日志保存路径、日志文件回滚等 阅读全文
posted @ 2019-06-26 12:35
交流_QQ_2240410488
阅读(1379)
评论(0)
推荐(0)
摘要:
首先需要具备gensim包,然后需要一个语料库用来训练,这里用到的是skip-gram或CBOW方法,具体细节可以去查查相关资料,这两种方法大致上就是把意思相近的词映射到词空间中相近的位置。 语料库test8下载地址: http://mattmahoney.net/dc/text8.zip 这个语料 阅读全文
posted @ 2019-06-26 12:16
交流_QQ_2240410488
阅读(4740)
评论(0)
推荐(1)
摘要:
ELMo的概念也是很早就出了,应该是18年初的事情了。但我仍然是后知后觉,居然还是等BERT出来很久之后,才知道有这么个东西。这两天才仔细看了下论文和源码,在这里做一些记录,如果有不详实的地方,欢迎指出~ 文章目录前言一. ELMo原理1. ELMo整体模型结构2. 字符编码层3. biLMs原理4 阅读全文
posted @ 2019-06-26 11:19
交流_QQ_2240410488
阅读(2934)
评论(0)
推荐(0)

浙公网安备 33010602011771号