会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
xubin97
为一些越来越常见以及廉价的数据,提供稀缺且附带额外价值的服务!
博客园
首页
新随笔
联系
订阅
管理
随笔 - 12
文章 - 0
评论 - 10
阅读 -
26810
[置顶]
100行代码教你教务系统自动抢课!
摘要: 帮助广大学生解决抢课问题!自动抢课!! 100行代码帮你实现抢课! 代码有不明白的 欢迎来微信公众号“他她自由行”找我,回复任何话都可以 我都会回你哒~ 本项目使用了python中splinter的API接口用来操作页面交互,用了twilio用来给手机发送短信通知抢课成功。 &ensp
阅读全文
posted @ 2019-01-28 19:53 xubin97
阅读(8935)
评论(7)
推荐(1)
2019年3月8日
A/B_test改变新旧网页 观察用户的引流效果
摘要: 代码处:https://github.com/xubin97/Data analysis_exp2 分析A/B测试结果 目录 简介 I 概率 II A/B 测试 简介 首先这个项目数据来自某公司的虚拟数据,主要是了解电子商务网站运行的 A/B 测试的结果。目标是通过这个 notebook 来帮助公司
阅读全文
posted @ 2019-03-08 21:12 xubin97
阅读(648)
评论(0)
推荐(0)
2019年3月3日
Kaggle(一):房价预测
摘要: Kaggle(一) 房价预测 (随机森林、岭回归、集成学习) 代码有不明白的 欢迎来微信公众号“他她自由行”找我,回复任何话都可以 我都会回你哒~ 项目介绍:通过79个解释变量描述爱荷华州艾姆斯的住宅的各个方面,然后通过这些变量训练模型, 来预测房价。 kaggle项目链接
阅读全文
posted @ 2019-03-03 20:42 xubin97
阅读(5657)
评论(0)
推荐(2)
2019年2月25日
航空公司客户价值分析(KMeans聚类)
摘要: PS.图片可能不清楚,代码 数据集都在 https://github.com/xubin97/Data Mining_exp1 项目介绍: 本案例的目标是客户价值识别,通过航空公司客户数据识别不同价值的客户。识别客户价值应用最广泛的模型是通过3个指标(最近消费时间间隔、消费频带和消费金额)来进行客户
阅读全文
posted @ 2019-02-25 22:20 xubin97
阅读(4257)
评论(0)
推荐(0)
2019年2月14日
数据分析之数据清理,数据探索,数据可视化
摘要: 从18年三月份真正开始学习数据分析,虽说专业(计科 数据信息化)与数据分析非常搭边,但学校里老师 讲的知识过于基础,我又本着起点低要早飞的思想 就自己开始了数据分析之路! _数据分析过程大体分为三部分:数据清洁,整理 数据探索 数据可视化_ 这几天一直在复习数
阅读全文
posted @ 2019-02-14 20:48 xubin97
阅读(437)
评论(0)
推荐(0)
SQL基本操作(工作中够用了)
摘要: _以下文章内容都是我自己从平时学习SQL语言时整理而来,写这篇文章是希望我或大家在使用能更方便的查询。 如果有不完整或不正确的地方请大家指出~谢谢大家_ 基本SQL操作 创建数据库 插入数据 更新数据 Alter Alter 是不对表格本身内容修改的,对表格框架修改。 逻辑运算符 1.
阅读全文
posted @ 2019-02-14 09:25 xubin97
阅读(1006)
评论(2)
推荐(1)
2019年2月10日
用Ajax爬取今日头条图片集
摘要: Ajax原理 代码有不明白的 欢迎来微信公众号“他她自由行”找我,回复任何话都可以 我都会回你哒~ 在用requests抓取页面时,得到的结果可能和浏览器中看到的不一样:在浏览器中可以正常显示的页面数据,但用requests得到的结果并没有。这是因为requests获取的都是原始 HT
阅读全文
posted @ 2019-02-10 09:57 xubin97
阅读(1163)
评论(0)
推荐(0)
2019年2月7日
(完整)爬取数据存储之TXT、JSON、CSV存储
摘要: 一、文件存储 1. TXT文本存储 代码有不明白的 欢迎来微信公众号“他她自由行”找我,回复任何话都可以 我都会回你哒~ 例:知乎发现页面,获得数据存成TXT文本 注意: 1. 在用pyquery解析时,一定要找准属性进行匹配; 2. 打开文件open()函数第二个参数设置为a,其他值: 3.每次o
阅读全文
posted @ 2019-02-07 10:24 xubin97
阅读(1596)
评论(0)
推荐(0)
2019年2月6日
(最全)Xpath、Beautiful Soup、Pyquery三种解析库解析html 功能概括
摘要: 一、Xpath 解析 代码有不明白的 欢迎来微信公众号“他她自由行”找我,回复任何话都可以 我都会回你哒~ xpath:是一种在XMl、html文档中查找信息的语言,利用了lxml库对HTML解析获取数据。 Xpath常用规则: 1.初始化html etree.parse()是初始化h
阅读全文
posted @ 2019-02-06 13:48 xubin97
阅读(1567)
评论(0)
推荐(0)
2019年1月30日
基础爬虫,谁学谁会,用requests、正则表达式爬取豆瓣Top250电影数据!
摘要: 爬取豆瓣Top250电影的评分、海报、影评等数据! 本项目是爬虫中最基础的,最简单的一例; 后面会有利用爬虫框架来完成更高级、自动化的爬虫程序。 此项目过程是运用requests请求库来获取html,再用正则表达式来解析从中获取所需数据。 话不多说,直接上代码,盘! (具
阅读全文
posted @ 2019-01-30 20:20 xubin97
阅读(691)
评论(0)
推荐(0)
2019年1月29日
正则表达式功能概括
摘要: 正则表达式 解释:是处理字符串的强大工具,有自己语法结构,能实现字符串的检索、替换、匹配验证等功能。 对爬虫来说,用它来从html中获得数据就简单了。 re库 1.match() (更适合检测某个字符串是否符合某个正则表达式的规则,后面会讨论到) content='zifuchuan' result
阅读全文
posted @ 2019-01-29 16:41 xubin97
阅读(314)
评论(0)
推荐(0)
下一页
积分与排名
积分 - 17152
排名 - 86344
随笔分类
python3 Webspider_notebook(4)
python技术应用(1)
Sql数据库操作(1)
webspider项目(2)
数据分析(3)
数据挖掘(2)
随笔档案
2019年3月(2)
2019年2月(6)
2019年1月(3)
2018年12月(1)
阅读排行榜
1. 100行代码教你教务系统自动抢课!(8935)
2. Kaggle(一):房价预测(5657)
3. 航空公司客户价值分析(KMeans聚类)(4257)
4. (完整)爬取数据存储之TXT、JSON、CSV存储(1596)
5. (最全)Xpath、Beautiful Soup、Pyquery三种解析库解析html 功能概括(1567)
评论排行榜
1. 100行代码教你教务系统自动抢课!(7)
2. SQL基本操作(工作中够用了)(2)
3. 教准备租房的同学如何避开坑!(1)
推荐排行榜
1. Kaggle(一):房价预测(2)
2. SQL基本操作(工作中够用了)(1)
3. 100行代码教你教务系统自动抢课!(1)
点击右上角即可分享