2022年3月25日
摘要:
Ajax https://edu.aliyun.com/course/1747 局部 异步 刷新。Asynchronous Javascript And XML(异步JavaScript和XML),是一种在无需重新加载整个网页的情况下,能够更新部分网页的技术。 传统的网页(不使用Ajax)如果需要更
阅读全文
posted @ 2022-03-25 15:45
cookie的笔记簿
阅读(28)
推荐(0)
摘要:
from wordcloud import WordCloud import matplotlib.pyplot as pit myfile = open("*.txt", encoding='utf-8') mytext = myfile.read() mycloud = WordCloud().
阅读全文
posted @ 2022-03-25 14:09
cookie的笔记簿
阅读(149)
推荐(0)
2022年3月23日
摘要:
Python自然语言处理 标注、分类、信息提取 句子、识别句法结构和构建表示句意的方法 nltk库 简单的统计 计数 词类型 频率分布 文本中每一个词项的概率,查找高频词 使用本地编码 # -*- coding: utf-8 -*- 分词 分类和标注词汇 标注语料库 名词 动词 形容词和副词 从文本
阅读全文
posted @ 2022-03-23 15:12
cookie的笔记簿
阅读(97)
推荐(0)
2022年3月22日
摘要:
合并一个文件夹下面的excel文件,适用于只有1个sheet的情况 遍历一个文件夹下的所有excel的文件名称 新建一个df格式的文件,带columns 采用append进行逐个添加 存储为excel格式 import xlrd import xlsxwriter import os import
阅读全文
posted @ 2022-03-22 14:55
cookie的笔记簿
阅读(362)
推荐(0)
摘要:
import xlrd import numpy as np import matplotlib.pyplot as plt import pandas as pd ''' # 设定行名称,第11行为字段名称 data = pd.read_excel("D:/01研/研二/20220115/不同学科
阅读全文
posted @ 2022-03-22 13:21
cookie的笔记簿
阅读(97)
推荐(0)
2022年3月20日
摘要:
正则表达式 https://www.runoob.com/python/python-reg-expressions.html import re line = "Cats are smarter than dogs" pattern = r'(.*) than (.*)' re.match函数 r
阅读全文
posted @ 2022-03-20 14:31
cookie的笔记簿
阅读(27)
推荐(0)
2022年3月19日
摘要:
beautifulsoup4 https://beautifulsoup.cn/#id28 功能:从HTML或者XML文件中提取数据,将一段文档传入BeautifulSoup 的构造方法,就能得到一个文档的对象, 可以传入一段字符串或一个文件句柄。 文档会被转换编码; soup选择最适合的解析器来解
阅读全文
posted @ 2022-03-19 11:12
cookie的笔记簿
阅读(50)
推荐(0)
摘要:
正则表达式 https://www.runoob.com/python/python-reg-expressions.html import re line = "Cats are smarter than dogs" pattern = r'(.*) than (.*)' re.match函数 r
阅读全文
posted @ 2022-03-19 11:10
cookie的笔记簿
阅读(24)
推荐(0)
摘要:
在 Tag 或 BeautifulSoup 对象的 .select() 方法中传入字符串参数, 即可使用CSS选择器的语法找到tag: CSS选择器 soup.select("title") # [<title>The Dormouse's story</title>] soup.select("p
阅读全文
posted @ 2022-03-19 11:00
cookie的笔记簿
阅读(263)
推荐(0)
2022年3月17日
摘要:
知识点补充 user-agent chrome://version/ 简单爬取b站排行榜 import requests #获取页面数据 import pandas as pd #用于数据清洗 from bs4 import BeautifulSoup #解析页面 import numpy as n
阅读全文
posted @ 2022-03-17 21:48
cookie的笔记簿
阅读(113)
推荐(0)