摘要: 1.css基本语法及页面引用 css基本语法 css的定义方法是: 选择器 { 属性:值; 属性:值; 属性:值;} 选择器是将样式和页面元素关联起来的名称,属性是希望设置的样式属性每个属性有一个或多个值。代码示例: css页面引入方法: 1、外联式:通过link标签,链接到外部样式表到页面中。 2 阅读全文
posted @ 2018-06-11 20:33 王琳杰 阅读(270) 评论(0) 推荐(0)
摘要: 1.html概述和基本结构 一个html的基本结构如下: 第一行是文档声明,第二行“<html>”标签和最后一行“</html>”定义html文档的整体,“<html>”标签中的‘lang=“en”’定义网页的语言为英文,定义成中文是'lang="zh-CN"',不定义也没什么影响,它一般作为分析统 阅读全文
posted @ 2018-06-10 23:48 王琳杰 阅读(273) 评论(0) 推荐(0)
摘要: Charles是一个网络抓包工具,相比Fiddler,其功能更为强大,而且跨平台支持得更好,所以这里选用它来作为主要的移动端抓包工具。 1. 下载Charles Proxy 4.2版本,下载链接:https://www.charlesproxy.com/download 2. 安装后先打开Charl 阅读全文
posted @ 2018-06-03 23:35 王琳杰 阅读(8815) 评论(0) 推荐(0)
摘要: 1.ChromeDriver配置 2.PhantomJ配置 $1. 在Linux和Mac下,可以将ChromeDriver配置到$PATH。首先,可以将可执行文件放到某一目录,目录可以任意选择。 例如将当前可执行文件放在/usr/local/目录下,用下面命令打开此路径, 接下来可以修改~/.pro 阅读全文
posted @ 2018-06-02 15:40 王琳杰 阅读(1417) 评论(0) 推荐(0)
摘要: 1 import os 2 import requests 3 from urllib.parse import urlencode 4 from hashlib import md5 5 from multiprocessing.pool import Pool 6 7 GROUP_START = 1 8 GROUP_END = 5 9 10 def get_... 阅读全文
posted @ 2018-06-01 19:50 王琳杰 阅读(273) 评论(0) 推荐(0)
摘要: 1.搜索关键词:利用Selenium驱动浏览器,得到商品列表。 2.分析页码并翻页:得到商品页码数,模拟翻页,得到后续页面的商品列表。 3.分析提取商品内容:利用PyQuery分析源码,解析得到商品列表。 4.存储到MongoDB:将商品列表信息存储到数据库MongoDB。 spider.py co 阅读全文
posted @ 2018-06-01 00:21 王琳杰 阅读(414) 评论(0) 推荐(0)
摘要: pycharm及安装激活文档 链接: https://pan.baidu.com/s/1eseogsifJ-xQPfbDrqbOOQ 密码: 3a76 在Ubuntu下,1.sudo gedit /etc/hosts 2.最后一行添加 0.0.0.0 account.jetbrains.com 3. 阅读全文
posted @ 2018-05-30 19:47 王琳杰 阅读(11809) 评论(0) 推荐(0)
摘要: 在linux里修改文件时,不小心非正常关闭了文件。再次打开的时候提示 E325: 注意发现交换文件 "filename.swp",具体报错如下: E325: 注意 发现交换文件 ".nginx.conf.swp" 所有者: root 日期: Fri Jun 23 09:44:19 2017 文件名: 阅读全文
posted @ 2018-05-30 19:34 王琳杰 阅读(909) 评论(0) 推荐(0)
摘要: 提取猫眼电影TOP100的电影名称、时间、评分、图片等信息,提取的站点URL为,提取的结果会以文件形式保存下来。 阅读全文
posted @ 2018-05-30 19:26 王琳杰 阅读(272) 评论(0) 推荐(0)
摘要: 切片 输出:abc 输出:de 输出:cdef 给定一个字符串aStr, 请反转字符串 阅读全文
posted @ 2018-05-29 23:15 王琳杰 阅读(268) 评论(0) 推荐(0)