2018 年 11月 24 日随笔档案 - yorkmass

摘要：功能描述目标：获取淘宝搜索页面的信息，提取其中的商品名称和价格。理解：淘宝的搜索接口翻页的处理技术路线：requests-re准备，安排！我们先搜索：裙子，查看浏览器返回的链接信息起始页：https://s.taobao.com/... 阅读全文

posted @ 2018-11-24 21:12 yorkmass 阅读(1382) 评论(0) 推荐(0)

摘要：贪婪匹配Re库默认采用贪婪匹配，即输出匹配最长的子串。>>> import re>>> match=re.search(r'PY.*N','PYANBNCNDN')>>> match.group(0)'PYANBNCNDN'最小匹配如何输出最短的子串呢... 阅读全文

posted @ 2018-11-24 18:10 yorkmass 阅读(242) 评论(0) 推荐(0)

摘要： Match对象的属性属性说明 .string 待匹配的文本 .re 匹配时使用的pattern对象（正则表达式... 阅读全文

posted @ 2018-11-24 17:58 yorkmass 阅读(528) 评论(0) 推荐(0)

摘要： Re库介绍Re库是Python的标准库，主要用于字符串匹配。调用方式：import re正则表达式的表示类型*raw string 类型（原生字符串类型）：re库采用raw string类型表示正则表达式，表示为：r'text'例如：r'[1-9]\d... 阅读全文

posted @ 2018-11-24 17:02 yorkmass 阅读(743) 评论(0) 推荐(0)

摘要：把自己电脑做成web服务器加内网穿透发布网站。前言：由于学校WiFi为内网ip，且WiFi 为动态ip 由于为动态IP，每次登陆都会换IP地址，所以建议网线连接或者一直开机不断网，否则每次开机都要重新设置。本方法采用内网穿透，将本机的IP地址映射到云服... 阅读全文

posted @ 2018-11-24 14:00 yorkmass 阅读(1510) 评论(0) 推荐(0)

yorkmass