摘要:先跟着mysql官网在centos云主机上部署好MySQL。 切换到一个非root用户,貌似root用户第一次不能直接用mysql。 设置使用密码,要求root授权。完成后切回root用户,运行 没出问题 应该正常运行了,也可以 查看情况 基本简单的操作(更多的指令还在学): show databa
阅读全文
摘要:Chromedriver 肯定是要使用Chrome的 在注册文件中写下下载地址: vim /etc/yum.repos.d/google.repo: [google]name=Google-x86_64baseurl=http://dl.google.com/linux/rpm/stable/x86
阅读全文
摘要:老师给了一个毕业学长的大项目,竟然是python2写的,又不想一个个改错误又不想下python2环境包去下3已经有的包。 还好3早就自带的2转3的脚本2to3.py 这个脚本在python环境下tools/scripts里面 cd 到.\Tools\scripts cmd运行python 2to3.
阅读全文
摘要:正好java也学到面向对象编程,把python的oo风格也对比着学一下。 类的写法,python真的是比java简单多了 直接贴个类吧: 特别的 private在python中用两个下划线__放在数据或者函数名前面,外部无法访问只能从内部访问 构造函数__init__可以自己写但是python不能重
阅读全文
摘要:字典以键值对的方式储存,可以定义d={}空字典,然后再录入数据。 常规的操作:p={‘a’=123,'b'=456}增加一个新对可以: c={'t'=567} p.update(c) 变成{‘a’:123,'b':456,'t':567} 上面的操作等于p.update(t=123) 这种普遍的方式
阅读全文
摘要:项目要做一个四个层级栏的数据抓取,而且点击查询后数据会在新跳出的网页。 源码如下 注释解释
阅读全文
摘要:一开始是想用qq空间说说做词云的,然而qq空间需要用cookies以及其他加密的东西,退而求其次搞搞新闻吧。 直接上代码了 有时候我们在html源码里面难以获得我们想要的元素的id,class只有不特殊的tag时候怎么办?这时候就要用xpath方法来查找。 我很讨厌给你一堆定义,那就直接上例子: 我
阅读全文
摘要:selenium是一款浏览器自动化框架,也算是一种web爬虫,不同于类似requests的爬虫,selenium模拟人工打开浏览器进行操作。支持java,python,.net 它首先需要driver来驱动你电脑上安装的浏览器,例如chrome需要下载chromedriver:https://sit
阅读全文
摘要:自己查了一下校园网点击链接后调出浏览器认证页面的机制叫 potral 具体介绍:https://blog.csdn.net/xianweijian/article/details/49450703 反正太复杂我是看不懂,那就简单暴力点:1,把跳出的浏览器进程kill掉 2,用爬虫实现自动登陆。 首先
阅读全文
摘要:import time as t i1=t.time() 获取unix时间,float类 i2=t.gmtime(i2) 获取struct_time类型 例time.struct_time(tm_year=2018, tm_mon=9, tm_mday=20, tm_hour=9, tm_min=1
阅读全文
摘要:以前以为直接在开头部分直接加上utf8编码声明就不会乱码,结果还是输出了乱码。 具体解决方案在中文输出的字符串前加上u,例如
阅读全文
摘要:1 # -*- coding: utf-8 -*- 2 import urllib 3 import urllib2 4 import json 5 6 def getloca(loca): 7 url='http://api.map.baidu.com/geocoder/v2/?address='
阅读全文