摘要: 词频统计1.对词汇换行情况进行处理由于在英文论文中常常出现一个单词换行的情况,导致有些词汇分裂,因此,在处理文本之前,对这种情况进行处理。处理的思路是:逐行读取纯文本文件,然后横向合并。借助正则表达式对词汇换行的情况进行处理。def open_file(file_path): with open(f 阅读全文
posted @ 2021-05-22 21:50 帅超007 阅读(67) 评论(0) 推荐(0)
摘要: #-*-coding:utf-8-*- # @Time :2021/4/17 14:58 # @Author:shuaichao # @File :.py # @Software: PyCharm import gzip from bs4 import BeautifulSoup #网页解析,获悉数 阅读全文
posted @ 2021-05-22 08:44 帅超007 阅读(105) 评论(0) 推荐(0)