摘要: 一、作业内容 作业一: 要求:熟练掌握 scrapy 中 Item、Pipeline 数据的序列化输出方法;Scrapy+Xpath+MySQL数据库存储技术路线爬取当当网站图书数据 候选网站:http://www.dangdang.com/ 关键词:java 思路:1、建立数据库mydb,在数据库 阅读全文
posted @ 2020-10-31 15:08 wlululu 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 团队介绍 1.团队概况 1.1 博客展示链接 https://www.cnblogs.com/fzucsx/p/13859556.html 1.2 团队项目描述: 酷转——文档批量转换器 1.3 队员风采: 陈晟新 风格:努力尽力齐心协力 擅长的技术:python 编程的兴趣:兴趣广泛,与生活相关 阅读全文
posted @ 2020-10-25 16:02 wlululu 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 表格项 内容 队友博客地址 https://www.cnblogs.com/zxh2001/p/13841725.html 我的博客地址 https://www.cnblogs.com/wlululu/p/13841828.html Github项目地址(小游戏) https://github.co 阅读全文
posted @ 2020-10-19 18:40 wlululu 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 作业一 要求:指定一个网站,爬取这个网站中的所有的所有图片,例如中国气象网(http://www.weather.com.cn)。分别使用单线程和多线程的方式爬取 输出信息:将下载的Url信息在控制台输出,并将下载的图片存储在images子文件中,并给出截图。 单线程: 1 # 031804127王 阅读全文
posted @ 2020-10-17 18:41 wlululu 阅读(177) 评论(0) 推荐(0) 编辑
摘要: 作业一 (1)在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在数据库。 思路: 1.首先建立一个类,用于实现建立数据库,并将数据写入数据库 2.然后再建立一个用于实现爬取数据的类 实现代码: 1 # 031804127wl 2 3 from bs4 阅读全文
posted @ 2020-10-06 15:40 wlululu 阅读(238) 评论(0) 推荐(0) 编辑
摘要: 作业一 (1)UniversitiesRanking实验 代码: 1 # wanglu031804127UniversitiesRanking.py 2 3 import requests 4 from bs4 import BeautifulSoup 5 6 7 def getHtmlText(u 阅读全文
posted @ 2020-09-27 18:01 wlululu 阅读(204) 评论(0) 推荐(0) 编辑
摘要: **我的github地址:**https://github.com/bambilu32/031804127 思路: ● 使用jieba包分别对两篇中文txt文件进行分词,得如['今天', '我', '遇到', '一只', '蹦蹦跳跳', '的', '兔子']的两个字符串数组; ● 对得到的分词后的数 阅读全文
posted @ 2020-09-17 15:30 wlululu 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 1、自我介绍 答:031804127;我的爱好是看小说,追剧;我最喜欢朝阳的烤鱼;最喜欢的一首歌是《不能说的秘密》;一句想说的话:加油。 2、思考 (1)回想一下你初入大学时对计算机专业的畅想 **当初你是如何做出选择计算机专业的决定的?** 答:当初觉得可以用代码编写程序很有趣,就选择了计算机专业 阅读全文
posted @ 2020-09-05 11:29 wlululu 阅读(126) 评论(0) 推荐(0) 编辑