随笔分类 -  Python

大三上学期考查课,Python数据分析、挖掘与可视化。
摘要:问题描述:数据库表中的数据较之系统中的数据缺少了1000条左右,现有数据库表中每条记录的编码和系统中每条记录的编码,要求列出系统中有而数据库表中没有的所有编码。 f1 = open('./nc_code.txt',encoding='UTF-8') f2 = open('./sql_code.txt 阅读全文
posted @ 2022-08-12 20:41 anyiya 阅读(32) 评论(0) 推荐(0)
摘要:实验数据 本实验所用数据为江苏省南京市出租车的GPS位置数据,包含了7,726辆出租车的共33,042,225条位置记录,各字段以制表符分隔。建议上传至HDFS与Hive进行分析处理。 各字段定义 字段 定义 VehicleId 出租车标识符 Time 数据收集时间 Longitude 经度 Lat 阅读全文
posted @ 2022-05-29 09:11 anyiya 阅读(222) 评论(2) 推荐(0)
摘要:运行Anaconda Prompt conda install scrapy 创建Scrapy项目 scrapy startproject 项目名 路径 运行Scarpy项目 scrapy crawl 项目名 阅读全文
posted @ 2022-04-26 15:42 anyiya 阅读(58) 评论(0) 推荐(0)
摘要:pip install wordcloud from wordcloud import WordCloud import numpy as np from PIL import Image wcd = WordCloud(backgound_color="white",repeat=True,max 阅读全文
posted @ 2022-04-24 22:34 anyiya 阅读(53) 评论(0) 推荐(0)
摘要:1、安装Pyinstaller,在cmd窗口,输入指令“pip install pyinstaller”进行网络安装。 2、使用指令“pyinstaller -F D:\文件夹\xxx.py”生成exe文件 -F生成的有命令框,-Fw生成的没有命令框 3、等待生成完毕后,回到源文件目录,在dist目 阅读全文
posted @ 2022-04-24 17:00 anyiya 阅读(105) 评论(0) 推荐(0)
摘要:需求分析 Anyiya在上网课的日子里表现的十分懒惰,被叫醒时通常耳边还回荡着室友的呼唤:"anyi上课了!",已知anyi大部分课程老师都会使用腾讯会议,然后迷迷糊糊的小anyi总是在思考该进入哪一个会议号的过程中造成晚点现象。乐于用计算机解决问题的anyi决定手写一个脚本帮助自己进入该进入的腾讯 阅读全文
posted @ 2022-04-24 16:58 anyiya 阅读(1118) 评论(0) 推荐(0)
摘要:节点互动案例代码和运行结果截图 from selenium import webdriver import time,random # 设置浏览器隐藏 # option = webdriver.ChromeOptions() # option.add_argument("--headless") b 阅读全文
posted @ 2022-04-20 18:15 anyiya 阅读(42) 评论(0) 推荐(0)
摘要:代入感很强,我已经是大数据分析工程师了。 #数据进行预处理,python,pandas import pandas as pd import numpy as np df = pd.read_csv('./kc_house_data.csv') df.head(10) df.shape (21613 阅读全文
posted @ 2022-04-17 20:49 anyiya 阅读(92) 评论(0) 推荐(0)
摘要:#一、连接下载网页 ###实训 1 生成 GET 请求并获取指定网页内容. 通过 Requests 库向网站“ http://www.tipdm.com/tipdm/gsjj/ ”发送 GET 请求,并上传伪装过的 User-Agent 信息,如“Mozilla/5.0 (Windows NT 6. 阅读全文
posted @ 2022-04-11 15:09 anyiya 阅读(428) 评论(0) 推荐(0)
摘要:yolov5环境部署 yolo下载链接:https://github.com/ultralytics/yolov5,其中大部分环境依赖都可以用 pip install -r requirements.txt 直接批量安装,网上说把requirements.txt放在pip.exe目录下,但是所有都放 阅读全文
posted @ 2022-03-12 14:02 anyiya 阅读(39) 评论(0) 推荐(0)
摘要:测试代码 import webdriver driver = webdriver.Chrome() driver.get('http://www.ptpress.com.cn/search/books') data = driver.page_source print(data) Mongodb路径 阅读全文
posted @ 2022-03-12 13:45 anyiya 阅读(30) 评论(0) 推荐(0)
摘要:#敲黑板: ##今天,我们来实现一下通过python一键向许多个女朋友分享要讲述的故事(非常好用)。 import tkinter as tk from tkinter import ttk, messagebox as msg import pymouse, pykeyboard, pypercl 阅读全文
posted @ 2022-02-26 19:52 anyiya 阅读(95) 评论(0) 推荐(0)
摘要:#高中同学作业绘图 import matplotlib.pyplot as plt import numpy as np from matplotlib.pyplot import MultipleLocator x1 = np.arange(0, 2.3, 0.1) x2 = np.arange( 阅读全文
posted @ 2021-12-22 21:37 anyiya 阅读(114) 评论(0) 推荐(0)
摘要:HaHa,没错又是作业... 理解: 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 这句话里的“相互依赖”划重点,“关系”划重点。 简单的一元线性回归,就是一集合因变量一集合自变量,二者关系在 给定范围 内可以 近似 用 一条直线 表示。 其表达 阅读全文
posted @ 2021-11-21 21:52 anyiya 阅读(517) 评论(0) 推荐(0)
摘要:#结论: yield 就是 记录一个 返回值 及其 返回位置,下次迭代从这个 位置 开始。带 yield 的函数更像是一个生成器,而不再是函数了。 #实例: ##首先定义一个如下函数 def gen(): print('line 1') yield 1 print('line 2') yield 2 阅读全文
posted @ 2021-09-29 10:08 anyiya 阅读(86) 评论(0) 推荐(0)
摘要:实例引入 #这是字符串去重的代码 st=input('一个字符串')ans=''.join(sorted(set(st),key=lambda ch:st.index(ch)))print(ans) 这里面涉及了四个常见的点,是个很好的理解实例:join、sorted、lambda、index jo 阅读全文
posted @ 2021-09-22 09:38 anyiya 阅读(262) 评论(0) 推荐(0)
摘要:第二章课后题答案 1.输入一个包含若干自然数的列表,输出这些自然数的平均值,结果保留3位小数。 ls=eval(input()) ans=float(sum(ls)/len(ls)) print('{:.3f}'.format(ans)) 2.输入一个包含若干自然数的列表,输出这些自然数降序排列后的 阅读全文
posted @ 2021-09-08 22:48 anyiya 阅读(5336) 评论(3) 推荐(0)
摘要:事情是这样的:作为大数据专业学生,有一天老师突然给出了2个多G的csv文件。没做具体任务要求,算是拿着玩。 第一个问题:各种常用文档编辑器都打不开这么大的文件 解决:使用Emeditor,支持文本分段打开,绝活。 第二个问题:对于数据实现简单清洗 描述:老师给出的数据集与交通有关,于是乎其中少不了一 阅读全文
posted @ 2021-04-14 09:29 anyiya 阅读(87) 评论(0) 推荐(0)
摘要:random模块下的方法详解: 1.random.random() 随机生成一个[0,1)之间的浮点数。 2.random.randint(a,b) 随机生成[a,b]范围内一个整数。 3.random.choice(seq) 从非空序列中随机选取一个数据并带回,该序列可以是list、tuple、s 阅读全文
posted @ 2021-04-01 12:39 anyiya 阅读(97) 评论(0) 推荐(0)