摘要: 帮助广大学生解决抢课问题!自动抢课!! 100行代码帮你实现抢课! 代码有不明白的 欢迎来微信公众号“他她自由行”找我,回复任何话都可以 我都会回你哒~   本项目使用了python中splinter的API接口用来操作页面交互,用了twilio用来给手机发送短信通知抢课成功。 &ensp 阅读全文
posted @ 2019-01-28 19:53 xubin97 阅读(8546) 评论(6) 推荐(1) 编辑
摘要: 代码处:https://github.com/xubin97/Data analysis_exp2 分析A/B测试结果 目录 简介 I 概率 II A/B 测试 简介 首先这个项目数据来自某公司的虚拟数据,主要是了解电子商务网站运行的 A/B 测试的结果。目标是通过这个 notebook 来帮助公司 阅读全文
posted @ 2019-03-08 21:12 xubin97 阅读(605) 评论(0) 推荐(0) 编辑
摘要: Kaggle(一) 房价预测 (随机森林、岭回归、集成学习) 代码有不明白的 欢迎来微信公众号“他她自由行”找我,回复任何话都可以 我都会回你哒~  项目介绍:通过79个解释变量描述爱荷华州艾姆斯的住宅的各个方面,然后通过这些变量训练模型, 来预测房价。   kaggle项目链接 阅读全文
posted @ 2019-03-03 20:42 xubin97 阅读(5503) 评论(0) 推荐(2) 编辑
摘要: PS.图片可能不清楚,代码 数据集都在 https://github.com/xubin97/Data Mining_exp1 项目介绍: 本案例的目标是客户价值识别,通过航空公司客户数据识别不同价值的客户。识别客户价值应用最广泛的模型是通过3个指标(最近消费时间间隔、消费频带和消费金额)来进行客户 阅读全文
posted @ 2019-02-25 22:20 xubin97 阅读(4124) 评论(0) 推荐(0) 编辑
摘要:  从18年三月份真正开始学习数据分析,虽说专业(计科 数据信息化)与数据分析非常搭边,但学校里老师 讲的知识过于基础,我又本着起点低要早飞的思想 就自己开始了数据分析之路!   _数据分析过程大体分为三部分:数据清洁,整理 数据探索 数据可视化_   这几天一直在复习数 阅读全文
posted @ 2019-02-14 20:48 xubin97 阅读(399) 评论(0) 推荐(0) 编辑
摘要:   _以下文章内容都是我自己从平时学习SQL语言时整理而来,写这篇文章是希望我或大家在使用能更方便的查询。 如果有不完整或不正确的地方请大家指出~谢谢大家_ 基本SQL操作 创建数据库 插入数据 更新数据 Alter Alter 是不对表格本身内容修改的,对表格框架修改。 逻辑运算符 1. 阅读全文
posted @ 2019-02-14 09:25 xubin97 阅读(992) 评论(2) 推荐(1) 编辑
摘要: Ajax原理 代码有不明白的 欢迎来微信公众号“他她自由行”找我,回复任何话都可以 我都会回你哒~   在用requests抓取页面时,得到的结果可能和浏览器中看到的不一样:在浏览器中可以正常显示的页面数据,但用requests得到的结果并没有。这是因为requests获取的都是原始 HT 阅读全文
posted @ 2019-02-10 09:57 xubin97 阅读(1031) 评论(0) 推荐(0) 编辑
摘要: 一、文件存储 1. TXT文本存储 代码有不明白的 欢迎来微信公众号“他她自由行”找我,回复任何话都可以 我都会回你哒~ 例:知乎发现页面,获得数据存成TXT文本 注意: 1. 在用pyquery解析时,一定要找准属性进行匹配; 2. 打开文件open()函数第二个参数设置为a,其他值: 3.每次o 阅读全文
posted @ 2019-02-07 10:24 xubin97 阅读(1536) 评论(0) 推荐(0) 编辑
摘要: 一、Xpath 解析 代码有不明白的 欢迎来微信公众号“他她自由行”找我,回复任何话都可以 我都会回你哒~   xpath:是一种在XMl、html文档中查找信息的语言,利用了lxml库对HTML解析获取数据。 Xpath常用规则: 1.初始化html etree.parse()是初始化h 阅读全文
posted @ 2019-02-06 13:48 xubin97 阅读(1466) 评论(0) 推荐(0) 编辑
摘要: 爬取豆瓣Top250电影的评分、海报、影评等数据!   本项目是爬虫中最基础的,最简单的一例; 后面会有利用爬虫框架来完成更高级、自动化的爬虫程序。   此项目过程是运用requests请求库来获取html,再用正则表达式来解析从中获取所需数据。 话不多说,直接上代码,盘! (具 阅读全文
posted @ 2019-01-30 20:20 xubin97 阅读(619) 评论(0) 推荐(0) 编辑
摘要: 正则表达式 解释:是处理字符串的强大工具,有自己语法结构,能实现字符串的检索、替换、匹配验证等功能。 对爬虫来说,用它来从html中获得数据就简单了。 re库 1.match() (更适合检测某个字符串是否符合某个正则表达式的规则,后面会讨论到) content='zifuchuan' result 阅读全文
posted @ 2019-01-29 16:41 xubin97 阅读(301) 评论(0) 推荐(0) 编辑