摘要: 大数据分析与可视化 之 百度贴吧(标题和链接) import csv from urllib import request,parse import time import random import requests from lxml import etree from urllib impor 阅读全文
posted @ 2023-12-30 20:36 Ivan丶ky 阅读(133) 评论(0) 推荐(0)
摘要: 大数据分析与可视化 之 百度贴吧爬虫 import csv import datetime import json from urllib import request, parse import time import random from fake_useragent import UserA 阅读全文
posted @ 2023-12-30 20:35 Ivan丶ky 阅读(115) 评论(0) 推荐(0)
摘要: 大数据分析与可视化 之 百度图片爬虫 import requests import re from urllib import parse import os import time # Import the time module class BaiduImageSpider(object): d 阅读全文
posted @ 2023-12-30 20:34 Ivan丶ky 阅读(52) 评论(0) 推荐(0)
摘要: 大数据分析与可视化 之 猫眼电影爬虫 import random import time import re import requests import csv class MaoyanSpider(object): # 初始化 # 定义初始页面url def __init__(self): se 阅读全文
posted @ 2023-12-30 20:33 Ivan丶ky 阅读(113) 评论(0) 推荐(0)
摘要: 大数据分析与可视化 之 爬取小说 import urllib.request import random from bs4 import BeautifulSoup import time def request_html(url): headers={'User-Agent':'Mozilla/5 阅读全文
posted @ 2023-12-30 20:32 Ivan丶ky 阅读(84) 评论(0) 推荐(0)
摘要: 大数据分析与可视化 之 爬取图片 # -*- coding:utf8 -*- import requests import re from urllib import parse import os class BaiduImageSpider(object): def __init__(self) 阅读全文
posted @ 2023-12-30 20:32 Ivan丶ky 阅读(41) 评论(0) 推荐(0)
摘要: 大数据分析与可视化 之 有道翻译爬虫 import requests import time import hashlib from Cryptodome.Cipher import AES import base64 import re #md5加密数据,首尾固定,中间用时间戳连接 def md5 阅读全文
posted @ 2023-12-30 20:31 Ivan丶ky 阅读(66) 评论(0) 推荐(0)
摘要: 大数据分析与可视化 之 有道翻译-2 # coding:utf8 import base64 import hashlib import json import time from hashlib import md5 import requests from Crypto.Cipher impor 阅读全文
posted @ 2023-12-30 20:31 Ivan丶ky 阅读(100) 评论(0) 推荐(0)
摘要: 大数据分析与可视化 之 有道翻译-1 #coding:utf8 import hashlib import random import time from hashlib import md5 import requests class YoudaoSpider(object): def __ini 阅读全文
posted @ 2023-12-30 20:30 Ivan丶ky 阅读(79) 评论(0) 推荐(0)
摘要: 大数据分析与可视化 之 小说爬虫类 import random import requests from lxml import etree import time class WebScraper: def __init__(self, url,output_file): self.url = u 阅读全文
posted @ 2023-12-30 20:29 Ivan丶ky 阅读(36) 评论(0) 推荐(0)
摘要: 随堂练习,随手记录 2.ipynb #%% import numpy as np import csv #%% iris_data = [] with open(r'文件地址')as csvfile: csv_reader = csv.reader(csvfile) birth_header = n 阅读全文
posted @ 2023-12-30 20:28 Ivan丶ky 阅读(149) 评论(0) 推荐(0)
摘要: 实验13 大数据分析与挖掘建模 实验学时:2学时 实验类型:验证 实验要求:必修 一、实验目的 掌握使用Numpy、Pandas进行数据建模。 能够利用模型数据进行相关预测分析。 理解数据建模的编程过程。 二、实验要求 通过编程实现使用电信用户数据画像——建立RFM模型对电信电话数据集、短信数据集、 阅读全文
posted @ 2023-12-30 20:21 Ivan丶ky 阅读(364) 评论(0) 推荐(0)
摘要: 实验12 Matplotlib绘制图表(二) 实验学时:2学时 实验类型:验证 实验要求:必修 一、实验目的 掌握Matplotlib的框架及图形属性。 掌握Matplotlib绘制图形的步骤。 掌握Matplotlib绘制柱形图、条形图、饼图、折线图。 掌握Matplotlib绘制散点图、等高线图 阅读全文
posted @ 2023-12-30 20:17 Ivan丶ky 阅读(288) 评论(0) 推荐(0)
摘要: 实验11 Matplotlib绘制图表(一) 实验学时:2学时 实验类型:验证 实验要求:必修 一、实验目的 掌握Matplotlib的框架及图形属性。 掌握Matplotlib绘制图形的步骤。 掌握Matplotlib绘制直线、曲线图、折线图。 掌握Matplotlib绘制柱形图、条形图、饼图。 阅读全文
posted @ 2023-12-30 20:13 Ivan丶ky 阅读(649) 评论(0) 推荐(0)
摘要: 实验10 Pandas实现数据分析 实验学时:2学时 实验类型:验证 实验要求:必修 一、实验目的 掌握Pandas的字符串函数。 掌握Pandas 统计汇总函数。 掌握Pandas排序、分组、合并与级联函数。 能利用上述函数进行综合数据分析。 二、实验要求 通过编程实现使用Pandas字符串函数进 阅读全文
posted @ 2023-12-30 20:11 Ivan丶ky 阅读(362) 评论(0) 推荐(0)
摘要: 实验09 Pandas函数应用 实验学时:2学时 实验类型:验证 实验要求:必修 一、实验目的 掌握pandas函数应用的方法:pipe()、apply()和applymap()。 能编写自定义函数。 能使用pandas函数应用调用自定义函数解决数据分析实际问题。 二、实验要求 利用pandas函数 阅读全文
posted @ 2023-12-30 20:08 Ivan丶ky 阅读(365) 评论(0) 推荐(0)
摘要: 实验08 Pandas字符串和文本处理 实验学时:2学时 实验类型:验证 实验要求:必修 一、实验目的 学会正确使用常见的字符串函数 如:len()、find()、strip()、replace()、contains()函数。 解决实际数据中的字符串和文本处理问题。 二、实验要求 使用常见的字符串函 阅读全文
posted @ 2023-12-30 20:06 Ivan丶ky 阅读(211) 评论(0) 推荐(0)
摘要: 实验07 Pandas合并与级联 实验学时:2学时 实验类型:验证 实验要求:必修 一、实验目的 掌握pandas合并/拼接 掌握pandas级联 二、实验要求 利用pandas合并、拼接和级联等知识在PyCharm中编写程序,实现Python数据处理的相关操作。 三、实验内容 任务1.现有如下图的 阅读全文
posted @ 2023-12-30 20:04 Ivan丶ky 阅读(243) 评论(0) 推荐(0)
摘要: 实验06 Pandas缺失值处理 实验学时:2学时 实验类型:验证 实验要求:必修 一、实验目的 掌握判断缺失值、过滤缺失值、填充缺失缺失值等缺失值处理 解决实际数据中的缺失值问题 二、实验要求 使用常见的缺失值处理函数(如:isnull()、notnull()、fillna()、dropna()函 阅读全文
posted @ 2023-12-30 20:02 Ivan丶ky 阅读(359) 评论(0) 推荐(0)
摘要: 实验05 Pandas数据读写 实验学时:2学时 实验类型:验证 实验要求:必修 一、实验目的 学会正确使用常见的I/O API函数。 解决文本文件、CSV文件、Excel文件、网页文件、数据库文件和JSON格式文件数据的读写问题。 二、实验要求 使用常见的I/O API函数(如:read_csv( 阅读全文
posted @ 2023-12-30 19:56 Ivan丶ky 阅读(400) 评论(0) 推荐(0)