摘要: 网络爬虫,又称网页蜘蛛、网络机器人。随着计算机技术的高速发展,互联网中的信息量越来越大,搜索引擎应运而生。传统的搜索引擎会有返回结果不精确等局限性。为了解决传统搜索引擎的局限性,专用型网络爬虫在互联网中越来越常见。同时,专用型网络爬虫具有专用性,可以根据制定的规则和特征,最后只体现和筛选出有用的信息 阅读全文
posted @ 2017-10-28 21:20 03郭丽红 阅读(7297) 评论(1) 推荐(0) 编辑
摘要: import requestsimport reimport pandasfrom bs4 import BeautifulSoupdef getclick(newurl): #函数:采用匹配方式,动态获取每一文章点击次数 id=re.search('_(.*).html',newurl).grou 阅读全文
posted @ 2017-10-18 09:54 03郭丽红 阅读(162) 评论(0) 推荐(0) 编辑
摘要: import requests import re from bs4 import BeautifulSoup url='http://news.gzcc.cn/html/xiaoyuanxinwen/' res=requests.get(url) res.encoding='utf-8' soup=BeautifulSoup(res.text,'html.parser') n=int(sou... 阅读全文
posted @ 2017-10-11 11:37 03郭丽红 阅读(150) 评论(0) 推荐(0) 编辑
摘要: 1. 处理某个沟通或技术性难题时是如何应对与解决的? 2. 现在的大数据比较流行,希望能够学习更多能提高操作能力与大数据有关的知识 3. 在工作上一般用python操作什么,python的实际应用之类的,也可以虚拟一个项目来进行实践。 4. 结合python与html的交互知识,用python爬动态 阅读全文
posted @ 2017-09-28 11:28 03郭丽红 阅读(273) 评论(0) 推荐(0) 编辑
摘要: 校园新闻内容提取。 阅读全文
posted @ 2017-09-27 11:39 03郭丽红 阅读(173) 评论(0) 推荐(0) 编辑
摘要: a.精准模式 B.全模式 3.搜索引擎 D,把一个文本保存 第一行: 新建一个c.txt文件,把它给fo 第二行:把内容写在fo里, 第三行:保存 pip install jieba Users\duym\AppData\Local\Programs\Python\Python36>pip inst 阅读全文
posted @ 2017-09-25 10:33 03郭丽红 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 1.列表的增删查改 >>> s=list('turtle')>>> s['t', 'u', 'r', 't', 'l', 'e']>>> 2.字典 3.列表、元组、集合、字典。 4.词频统计 wc.sort(key=lambda x:x[1],reverse=True 阅读全文
posted @ 2017-09-20 11:30 03郭丽红 阅读(288) 评论(0) 推荐(0) 编辑
摘要: 中文变编码: 显示12星座: 九九乘法表: 字符串对齐: 凯撒密码: 歌词替换标点符号: 打开网页。 阅读全文
posted @ 2017-09-18 11:40 03郭丽红 阅读(206) 评论(0) 推荐(0) 编辑
摘要: 2-a.用循环画五角星 2-b用循环画同心圆 2-c.用while循环画太阳花 2-d.用函数定义画五个五角星 import turtleturtle.bgcolor('red')turtle.color('yellow')turtle.fillcolor('yellow') def guo_got 阅读全文
posted @ 2017-09-13 21:30 03郭丽红 阅读(240) 评论(0) 推荐(0) 编辑
摘要: 1.Hello World! 2.简单交互(交互式,文件式)教材P19 3.用户输入两个数字,计算并输出两个数字之和: 4.用户输入三角形三边长度,并计算三角形的面积:(海伦公式) 5.输入半径,计算圆的面积 6.画一组同切圆 7.画一个五角星 8.画一个全黄色的五角星 阅读全文
posted @ 2017-09-06 18:10 03郭丽红 阅读(507) 评论(0) 推荐(0) 编辑