摘要: # requests模块来请求页面# lxml模块的html构建selector选择器(格式化响应response)# from lxml import html# import requests # response = requests.get(url).content # selector = 阅读全文
posted @ 2017-06-10 22:39 礁石params 阅读(802) 评论(0) 推荐(0) 编辑
摘要: 说到敏感词,小伙伴们可能就要吐糟了吧! 刚好最近做一个电商评论模块,简单的总结一下! 由于天朝的规则比较复杂,在评论的时候要求稍微会高一些,所以评论区都要进行后台敏感词过滤。 而对于敏感词的大致分为:禁用词(BNNED)、审查词(MOD)、替换词(REPLACE)三种。 而对于这些词最令人印象深刻就 阅读全文
posted @ 2016-10-25 20:24 礁石params 阅读(2381) 评论(1) 推荐(0) 编辑