01 2020 档案
摘要:正则表达式使用某种预定义的模式去匹配一类具有共同特征的字符串,主要用于处理字符串,可以快速、准确地完成复杂的查找、替换等处理要求,在文本编辑与处理、网页爬虫之类的场合中有重要应用。Python中,re模块提供了正则表达式操作所需要的功能。 元字符 功能说明 . 匹配除换行符以外的任意单个字符 []
阅读全文
摘要:一、中国大学排名定向爬虫 定向爬虫:仅对输入URL进行爬取,不扩展爬取。 步骤一:从网络上获取大学排名网页内容 getHTMLText() 最好大学网:http://www.zuihaodaxue.com/zuihaodaxuepaiming2016.html 步骤二:提取网页内容中信息到合适的数据
阅读全文
摘要:实例一:京东商品页面的爬取 import requests url = "https://item.jd.com/100004770237.html" try: r = requests.get(url) r.raise_for_status() r.encoding = r.apparent_en
阅读全文
摘要:一、生成汉字词云图的代码如下: from wordcloud import WordCloud import matplotlib.pyplot as plt #绘制图像的模块 import jieba #jieba分词 path_txt='E://python/all.txt' f = open(
阅读全文
摘要:在计算机中线性表可以采用两种方式来保存,一种是顺序存储结构,另一种是链式存储结构。 顺序存储结构的线性表称为顺序表,链式存储结构的线性表称为链表。 顺序表就是按照顺序存储方式存储的线性表,该线性表的结点按照逻辑次序依次存放在计算机的一组连续的存储单元中。 由于顺序表是依次存放的,只要知道了谈顺序表的
阅读全文
摘要:在随机生成一个有20个整数数据的数组中查找某个数据。 #include <stdio.h> #include <stdlib.h> #include <time.h> #define N 20 int main() { int array[N],x,i; int f = -1; srand(time
阅读全文
摘要:数制的基本概念: 人们在生产实践和日常生活中,创造了多种表示数的方法,这些数的表示规则称为数制。其中按照进位方式计数的数制叫进位计数制。 位权: 任何一个R进制的数都是由一串数码表示的,其中每一位数码所表示的实际值的大小,除与数字本身的数值有关外,还与它所处的位置有关。该位置上的基准值就称为位权(或
阅读全文
摘要:为了区分不同进制的数,人们习惯在一个数的后面加上字母D(十进制)、B(二进制)、O(八进制)、H(十六进制)来表示其前面的数用的是哪种进位制。 二进制: 基数为2,即“逢二进一”。它含有两个数字符号:0,1。位权为2^i 特点: 1、简单可行:二进制仅有两个数码“0”和“1”,可以用两种不同的稳定状
阅读全文

浙公网安备 33010602011771号