摘要: 1. 检测与处理重复值 pandas提供了一个名为drop_duplicates的去重方法。该方法只对DataFrame或者Series类型有效。这种方法不会改变数据原始排列,并且兼具代码简洁和运行稳定的特点。该方法不仅支持单一特征的数据去重,还能够依据DataFrame的其中一个或者几个特征进行去 阅读全文
posted @ 2021-02-22 17:40 cjb789 阅读(430) 评论(0) 推荐(0)
摘要: 1. 使用Numpy构造矩阵 例如: [[1,2,3], [4,5,6]] 我们可以这样做: A = np.array([[1,2,3],[4,5,6]]) 2. 构造向量,向量可以分为行向量和列向量 构建列向量: B = np.array([[2],[1],[3]]) 使用这个方法可以将其转置为行 阅读全文
posted @ 2021-01-25 14:06 cjb789 阅读(366) 评论(0) 推荐(0)
摘要: 一. 内存中的numpy对象 1. 元数据(metadata) 存储对目标数组的描述信息,如:ndim、dimensions、dtype、data等。 2. 实际数据 完整的数组数据 将实际数据与元数据分开存放,一方面提高了内存空间的使用效率,另一方面减少对实际数据的访问频率,提高性能。 3. nd 阅读全文
posted @ 2020-12-28 17:40 cjb789 阅读(96) 评论(0) 推荐(0)
摘要: 1.获取当前页面的url方法:current_url 实例:driver.current_url 2.获取元素坐标方法:location解释:首先查找到你要获取元素的,然后调用location方法实例:driver.find_element_by_xpath("xpath").location 3. 阅读全文
posted @ 2020-11-29 10:13 cjb789 阅读(104) 评论(0) 推荐(0)