随笔分类 -  python从放弃到治疗

摘要:有时在处理不规则数据时需要提取文本包含的时间日期。 dateutil.parser模块可以统一日期字符串格式。 datefinder模块可以在字符串中提取日期。 datefinder模块实现也是用正则,功能很全 但是对中文不友好。 但是这两个模块都不能支持中文及一些特殊的情况;所以我用正则写了段代码 阅读全文
posted @ 2020-04-23 19:46 古月月月胡 阅读(9005) 评论(1) 推荐(1)
摘要:python qrcode模块可生成二维码并对二维码样式进行定制,如果二维码内容为url链接,手机扫描后可直接进行跳转。 三行代码即可实现 如下代码可在二维码定制头像图片,更改二维码颜色 阅读全文
posted @ 2019-09-22 23:06 古月月月胡 阅读(2218) 评论(0) 推荐(0)
摘要:用法及优缺点 BloomFilter可以解决的问题: 1.字处理软件中,需要检查一个英语单词是否拼写正确 2.在 FBI,一个嫌疑人的名字是否已经在嫌疑名单上 3.在网络爬虫里,一个网址是否被访问过 4.yahoo, gmail等邮箱垃圾邮件过滤功能 5.可以用来防止缓存击穿 算法优缺点 算法优点: 阅读全文
posted @ 2019-09-17 22:28 古月月月胡 阅读(2529) 评论(0) 推荐(1)
摘要:使用Image包合成图片 添加文字。 下面将通过实例介绍利用py PIL包对图片进行合成,裁减以及添加文字。 原始图片4张 合成后图片: 图片处理 图片拼接 生成圆形图片 因为头像图片为方形,需要裁减成圆形图片然后拼接。 裁减的原理是在正方形中画出一个内切圆,四个角的像素为对应背景位置的像素 裁减的 阅读全文
posted @ 2019-09-14 10:12 古月月月胡 阅读(5796) 评论(0) 推荐(0)
摘要:windows linux环境搭建 windows下载zip linux下载tar 下载地址:https://www.elastic.co/downloads/elasticsearch 解压后运行:bin/elasticsearch (or bin\elasticsearch.bat on Win 阅读全文
posted @ 2019-09-01 22:18 古月月月胡 阅读(2561) 评论(0) 推荐(1)
摘要:需求 将相似的文本进行聚类 然后选出同类中最具有代表的一条数据 输入数据: 运行结果如下,聚类前数据有9条 聚类后6条; 字典key为类别,value是表示同一类别的index(text.dat中的行,从0开始) {0: [0, 1, 2], 1: [3, 4], 2: [5], 3: [6], 4 阅读全文
posted @ 2019-08-31 13:33 古月月月胡 阅读(1099) 评论(0) 推荐(0)
摘要:Exchange发送邮件 config.email_url :邮箱服务地址 config.email_user :账户 config.email_pas:密码 163邮箱发送邮件 "https://www.cnblogs.com/xiaodai12138/p/10483158.html" 阅读全文
posted @ 2019-08-31 13:30 古月月月胡 阅读(1478) 评论(0) 推荐(0)
摘要:python docx 安装依赖包 pip install python docx 官方文档: "https://python docx.readthedocs.io/en/latest/index.html" 官方实例非常简洁清晰的展示了python docx生成的文档所包含的大部分功能:各级标题 阅读全文
posted @ 2019-08-31 13:24 古月月月胡 阅读(1851) 评论(0) 推荐(0)
摘要:pygal是个非常简单且功能丰富的py画图包,折线图、柱状图、饼图等常见和不常见的图像都可轻松实现。 下面将介绍安装方法,解决中文字体问题、Linux系统乱码问题,输出PNG文件问题 基础操作: 安装 pip install pygal 文档特别详细: "http://www.pygal.org/e 阅读全文
posted @ 2019-08-31 12:28 古月月月胡 阅读(1815) 评论(0) 推荐(0)