摘要: 1,字 将字符以逗号,句号为一个段落,在对段落内的字符同一字进行对比 2,词 同一词语进行对比 import difflibdef stri_similar(s1,s2): return difflib.SequenceMatcher(None,s1,s2).quick_ratio()data1 = 阅读全文
posted @ 2022-06-26 20:02 记录——去繁就简 阅读(663) 评论(0) 推荐(0)
摘要: 「pdfplumber:」 pdfplumber库按页处理 pdf ,获取页面文字,提取表格等操作。 学习文档:https://github.com/jsvine/pdfplumber 「pypdf2:」 PyPDF2 是一个纯 Python PDF 库,可以读取文档信息(标题,作者等)、写入、分割 阅读全文
posted @ 2022-06-26 18:48 记录——去繁就简 阅读(117) 评论(0) 推荐(0)