摘要: 我们再工作中可能会遇到需要判断两个字符串有多少相似度的情况(比如抓取页面内容存入数据库,如果相似度大于70%则判定为同一片文章,则不录入数据库) 那这个时候,我们应该怎么判断呢? 不要着急,python自带的difflib库就可以帮助我们解决这个问题。 首先,difflib是python自带的,所以 阅读全文
posted @ 2019-05-21 16:06 超超go 阅读(14670) 评论(0) 推荐(2) 编辑
摘要: 我们再pip安装了beautifulsoup4后,是有下面句子import beautifulsoup4的时候报错:No module named 'bs4' pip install beautifulsoup4 然后,我们再python脚本中这样写: from bs4 import Beautif 阅读全文
posted @ 2019-05-21 11:22 超超go 阅读(5263) 评论(0) 推荐(2) 编辑