摘要: 1. 如何爬取网页上的历史数据 import pandas as pd url='xxxxx' dlt_df=pd.read_html(url)[0] 2.读写excel df = pd.read_excel("input.xlsx") df.to_excel("output.xlsx) DataF 阅读全文
posted @ 2020-10-26 19:43 toto_cynthia 阅读(189) 评论(0) 推荐(0)
摘要: 交作业 阅读全文
posted @ 2019-03-19 11:31 toto_cynthia 阅读(308) 评论(0) 推荐(0)
摘要: 1. list\tuple\dict\set 2. set 的操作 交集:set1 & set2 (set1.intersection(set2))两个set的共有元素 并集: set1 | set2 (set1.union(set2))两个set的元素相加后去重 差集:set1 - set2 (s 阅读全文
posted @ 2019-03-18 17:52 toto_cynthia 阅读(169) 评论(0) 推荐(0)
摘要: 1. 加速跑 spark-sql --name uername --num-executors 21 --driver-memory 8G --executor-memory 8G 2. 上传数据 建表 create table xxx_yyy ( userid varchar(200)) 上传数据 阅读全文
posted @ 2019-03-18 17:31 toto_cynthia 阅读(3138) 评论(0) 推荐(0)
摘要: 相关资料网站 1. python3简明教程 适合新学者,因为可以在线操作,并且校验结果,同时还有考试系统。比较基础 2. python数据分析数据科学中文英文工具书籍下载 免费的中英文数据的PDF下载,内容比较多,但是中文的少英文的多。 3. Python 基础教程 同事推荐的基础教程,我还没来得及 阅读全文
posted @ 2019-03-18 16:11 toto_cynthia 阅读(216) 评论(0) 推荐(0)