会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
collin_pxy
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
下一页
2020年11月20日
金额匹配方案
摘要: """ 金额匹配是财务业务经常要处理的一个逻辑,比如发票金额与结算数据的匹配,而这种匹配经常存在1对1,1对多的关系,即一个发票金额可能正好和一条结算数据相匹配, 也可能会和多条结算数据相匹配;有时候结算数据还会有重复值;有时候能够匹配发票的结算数据组合有多种;有时候还要考虑其他因素,比如结算数据对
阅读全文
posted @ 2020-11-20 16:44 collin_pxy
阅读(487)
评论(0)
推荐(0)
2020年11月19日
Python与Pandas关于数据处理的几个重要函数
摘要: Python 的几个重要函数: 1、Lambda表达式: 语法: lambda argument1, argument2,...,argumentN:expression using arguments lambda实质上是一个表达式,冒号后面的部分是表达式的返回值,使用它就可以很方便的用于不允许d
阅读全文
posted @ 2020-11-19 16:13 collin_pxy
阅读(462)
评论(0)
推荐(0)
2020年11月15日
RPA小结
摘要: 1--怎么理解RPA? RPA就是机器人流程自动化,根据业务的固定规则,自动完成一些任务(如数据抓取,信息录入,数据处理,自动化运维等),替代人类的重复劳动, 但RPA的发展已经不仅仅满足于此,正朝着与AI结合的方向发展,试图将决策功能加入其中,现在IBM在推的智能工作流和国内企业在推的智慧RPA都
阅读全文
posted @ 2020-11-15 20:50 collin_pxy
阅读(977)
评论(0)
推荐(0)
2020年7月12日
pandas_01
摘要: # Pandas 知识点总结 # Pandas数据结构:Series 和 DataFrame import pandas as pd import numpy as np # 一,Series: # 1, 创建 Series pd.Series(列表或字典) # 1)使用列表创建Series: #
阅读全文
posted @ 2020-07-12 09:16 collin_pxy
阅读(131)
评论(0)
推荐(0)
2020年7月8日
Numpy_01
摘要: # 引子: # ndarray 是一个 numpy库提供的 同构数据多维模型 import numpy as np list=[1,2,3,4,5,6] myndarray=np.array(list) # type(myndarray) # numpy.ndarray # myndarray.dt
阅读全文
posted @ 2020-07-08 23:59 collin_pxy
阅读(126)
评论(0)
推荐(0)
2020年7月2日
cmd,py脚本,py编译的exe,uipath及uibot对它们的调用
摘要: UIPATH调用Python编译程序exe 好处: 1)code不以可编辑的状态被用户接触,对于不懂反编译的一般用户,可提升一定的代码安全性; 2)不需要用户机器上安装 python环境。 3)可以将能够执行不同任务的脚本编译成同一个exe程序,通过传入不同参数实现不同任务。 1).生成并调用单任务
阅读全文
posted @ 2020-07-02 23:32 collin_pxy
阅读(1508)
评论(0)
推荐(0)
2020年6月29日
Spider_知识目录_基础
摘要: 知识目录 静态网页抓取 Spider_基础总结1_Request(get/post__url传参_headers_timeout)+Reponse Spider_基础总结2_Requests异常 Spider_基础总结3_BeautifulSoup对象+find()+find_all() Spide
阅读全文
posted @ 2020-06-29 17:09 collin_pxy
阅读(99)
评论(0)
推荐(0)
Spider--补充--jsonpath的使用
摘要: # 知识点参见:https://blog.csdn.net/muzico425/article/details/102763176 # 示例:爬取示例网站的首页的评论: # 解析得到的字符串r.text(即 json字符串)可以使用json库来完成解析: import json import req
阅读全文
posted @ 2020-06-29 16:52 collin_pxy
阅读(162)
评论(0)
推荐(0)
Spider--补充--Requests--session&cookie
摘要: # session 与 cookie # 可能大家对session已经比较熟悉了,也大概了解了session的机制和原理,但是我们在做爬虫时如何会运用到session呢,就是接下来要讲到的会话保持。 # 首先说一下,为什么要进行会话保持的操作? # requests库的session会话对象可以跨请
阅读全文
posted @ 2020-06-29 14:16 collin_pxy
阅读(209)
评论(0)
推荐(0)
Spider--实战--bs静态网页爬取TOP250电影
摘要: import requests from bs4 import BeautifulSoup def gettop250(): headers={ 'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (K
阅读全文
posted @ 2020-06-29 13:59 collin_pxy
阅读(210)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
下一页
公告