随笔分类 - python
摘要:$ pip install pkginfo $ pkginfo -f requires_dist psutil-5.4.5-cp27-none-win32.whl requires_dist: ["enum34; extra == 'enum'"] 在需要离线配置环境的情况下,可以用此查看。 参考:
阅读全文
摘要:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.eval.html?highlight=eval#pandas.DataFrame.eval pandas.eval在官方文档中提示到的有点是执行高
阅读全文
摘要:参考链接:Python中设置指定窗口为前台活动窗口(最顶层窗口)win32gui: https://blog.csdn.net/bailichun19901111/article/details/105042145 Win32 API之EnumWindows详解: http://blog.sina.
阅读全文
摘要:需求:单纯的将page.source写入文件的方式,会导致一些图片无法显示,对于google浏览器,直接将页面打包下载成一个mhtml格式的文件,则可以进行离线下载。对应python selenium 微信公众号历史文章随手一点就返回首页?郁闷之下只好将他们都下载下来。:https://www.cn
阅读全文
摘要:参照资料:selenium webdriver 如何添加cookie: https://www.cnblogs.com/sundahua/p/10202494.html 需求: 想阅读微信公众号历史文章,但是每次找回看得地方不方便。 思路: 1、使用selenium打开微信公众号历史文章,并滚动刷新
阅读全文
摘要:参考资料:Python爬虫,你是否真的了解它?: https://www.bilibili.com/read/cv4144658 爬虫:通过计算机去获取信息,以节约人力成本,不节约的就不需要用了。 反爬虫的最终:区别计算机和人,从而达到,排除计算机的访问,允许人的访问。 最终结论:爬虫与反爬虫都是有
阅读全文
摘要:情况:重复索引与非重复索引的取值返回类型是不一样的。 dfa = pd.DataFrame(np.random.randn(6, 4),index=list('aacdeb'),columns=list('ABCD')) dfa print('存在重复索引取一列的情况:',type(dfa.loc[
阅读全文
摘要:情况:业务数据基本字段会有如下: Index(['时间', '地区', '产品', '字段', '数值'], dtype='object') 这样就会引发一个经典“三角不可能定理”,如何同时简约展现分时序、分产品、分字段数据。)一般来说, 1、时序为作为单独的分类, 2、然后剩下两个标签就是,要么:
阅读全文
摘要:pandas 一维台账数据与二维表格数据的转换:https://www.cnblogs.com/cycxtz/p/13394583.html 使用pivot_table或多或少会遇到,分机构空行不显示的问题,导致数据样式有点不统一,部分表的机构数量比较少。 可以使用解决: pd.merge(left
阅读全文
摘要:需求:低版本excel对于使用透视表后,索引方向会出现合并,需要将其恢复为“台账”样式。 解决方法:可以使用reset_index()。 在Pandas中如何给多层索引降级: https://blog.csdn.net/qq_36387683/article/details/86616367 pan
阅读全文
摘要:对前文 https://www.cnblogs.com/cycxtz/p/13378922.html 思路1进行补充。 可以考虑jieba分词库,不过需要先进行训练。 依赖库:jieba 提前准备:国家统计局所有地区信息,以及地区简写。 下来,对使用jieba分词库的add_word。参考使用网站:
阅读全文
摘要:目的:基于办公与互联网隔离,自带的office软件没有带本地帮助工具,因此在写vba程序时比较不方便(后来发现07有自带,心中吐血,瞎折腾些什么)。所以想到通过爬虫在官方摘录下来作为参考。 目标网站:https://docs.microsoft.com/zh-cn/office/vba/api/ov
阅读全文
摘要:转载:https://blog.csdn.net/HYESC/article/details/95459783?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1&utm_source=dis
阅读全文
摘要:转载:https://www.cnblogs.com/lianggege123/articles/9282218.html 在编写爬虫进行网页数据的时候,大多数情况下,需要在请求是增加请求头,下面介绍一个python下非常好用的伪装请求头的库:fake-useragent,具体使用说明如下: 安装f
阅读全文
摘要:转载:https://www.cnblogs.com/lanyinhao/p/9634742.html 1、模块说明 requests是使用Apache2 licensed 许可证的HTTP库。 用python编写。 比urllib2模块更简洁。 Request支持HTTP连接保持和连接池,支持使用
阅读全文
摘要:https://www.cnblogs.com/gufengchen/archive/2019/05/31/10956009.html zipfile是python里用来做zip格式编码的压缩和解压缩的,由于是很常见的zip格式,所以这个模块使用频率也是比较高的, 在这里对zipfile的使用方法做
阅读全文
摘要:#原文: http://blog.csdn.net/Rozol/article/details/70052637#coding=utf-8 # regular.py 正则表达式 import re # 正则模块 def regular(): data = "She is more than pretty. 520" # --- 正则 --- reg = r"mo" #...
阅读全文

浙公网安备 33010602011771号