Python - 随笔分类(第3页) - 静悟生慧

Scipy:高端科学计算

摘要：转：https://blog.csdn.net/lwfcgz/article/details/23290623 Scipy scipy包包含致力于科学计算中常见问题的各个工具箱。它的不同子模块相应于不同的应用。像插值，积分，优化，图像处理，，特殊函数等等。 scipy可以与其它标准科学计算程序库进阅读全文

posted @ 2018-12-15 15:29 静悟生慧阅读(309) 评论(0) 推荐(0)

numpy.ravel() vs numpy.flatten()

摘要：首先声明两者所要实现的功能是一致的（将多维数组降位一维），两者的区别在于返回拷贝（copy）还是返回视图（view），numpy.flatten()返回一份拷贝，对拷贝所做的修改不会影响（reflects）原始矩阵，而numpy.ravel()返回的是视图（view，也颇有几分C/C++引用refe 阅读全文

posted @ 2018-12-15 15:26 静悟生慧阅读(280) 评论(0) 推荐(0)

python 多进程，实际上都没有运行，sleep

摘要：进程以及状态 1. 进程程序：例如xxx.py这是程序，是一个静态的进程：一个程序运行起来后，代码+用到的资源称之为进程，它是操作系统分配资源的基本单元。不仅可以通过线程完成多任务，进程也是可以的 2. 进程的状态工作中，任务数往往大于cpu的核数，即一定有一些任务正在执行，而另外一些任务在等阅读全文

posted @ 2018-12-14 21:10 静悟生慧阅读(10210) 评论(0) 推荐(0)

python map() 函数

摘要：描述 map() 会根据提供的函数对指定序列做映射。第一个参数 function 以参数序列中的每一个元素调用 function 函数，返回包含每次 function 函数返回值的新列表。语法 map() 函数语法：参数 function -- 函数 iterable -- 一个或多个序列返阅读全文

posted @ 2018-12-14 17:16 静悟生慧阅读(262) 评论(0) 推荐(0)

python 多线程和多进程

摘要：1 概念梳理： 1.1 线程线程是操作系统能够进行运算调度的最小单位。它被包含在进程之中，是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流，一个进程中可以并发多个线程，每条线程并行执行不同的任务。一个线程是一个execution context（执行上下文），即一个cpu执行时所需阅读全文

posted @ 2018-12-13 13:19 静悟生慧阅读(305) 评论(0) 推荐(0)

PySpark 行列转换

摘要：Spark实现行列转换pivot和unpivot 背景做过数据清洗ETL工作的都知道，行列转换是一个常见的数据整理需求。首先明确一下啥叫行列转换，因为这个叫法也不是很统一，有的地方叫转置，有的地方叫透视，不一而足。我们就以下图为例，定义如下：从左边这种变成右边这种，叫透视（pivot）反之叫阅读全文

posted @ 2018-12-07 19:48 静悟生慧阅读(3674) 评论(0) 推荐(0)

ASTER：An Attentional Scene Text Recognizer with Flexible Rectification

摘要：代码链接：https://github.com/bgshih/aster 方法概述本文方法主要解决不规则排列文字的文字识别问题，论文为之前一篇CVPR206的paper（Robust Scene Text Recognition with Automatic Rectification，方法简称为阅读全文

posted @ 2018-12-05 17:24 静悟生慧阅读(2690) 评论(0) 推荐(0)

训练深度学习网络时候，出现Nan 或者震荡

摘要：出现Nan ：原因有多种，需要注意的是，要保证训练数据中没有脏数据，如果在training sample中出现了脏数据，那么在固定的迭代次数段，都会loss突然变nan，导致acc骤降，慢慢变0 https://www.zhihu.com/question/49346370 https://blo 阅读全文

posted @ 2018-12-04 20:46 静悟生慧阅读(3846) 评论(0) 推荐(0)

python 中 with 用法

摘要：前言 with 语句适用于对资源进行访问的场合，确保不管使用过程中是否发生异常都会执行必要的“清理”操作，释放资源，比如文件使用后自动关闭／线程中锁的自动获取和释放等。问题引出如下代码：上面代码存在２个问题：（１）文件读取发生异常，但没有进行任何处理；（２）可能忘记关闭文件句柄；改进阅读全文

posted @ 2018-11-29 20:35 静悟生慧阅读(512) 评论(0) 推荐(0)

python 报错 SyntaxError: Non-ASCII character

摘要：报错： SyntaxError: Non-ASCII character 概意思是，默认文件是ASCII格式，需要更改文件编码，操作是在文件首行加上报错：TypeError: unicode argument expected, got 'str' if your environment is 阅读全文

posted @ 2018-11-29 18:16 静悟生慧阅读(745) 评论(0) 推荐(0)

Spark与Pandas中DataFrame对比

摘要：转载请注明：宁哥的小站 » Spark与Pandas中DataFrame对比（详细）阅读全文

posted @ 2018-11-29 13:43 静悟生慧阅读(1335) 评论(0) 推荐(1)

Pandas dataframe 与 Spark dataframe 的区别

摘要：区别：http://www.voidcn.com/article/p-wsqbotem-boa.html 获取列名的列表： DataFrame.columns.values.tolist() 阅读全文

posted @ 2018-11-28 11:52 静悟生慧阅读(466) 评论(0) 推荐(0)

pandas 筛选指定行或者列的数据

摘要：pandas主要的两个数据结构是：series（相当于一行或一列数据结构和DataFrame（相当于多行多列的一个表格数据机构）。原文：https://www.cnblogs.com/gangandimami/p/8983323.html DataFrame.drop(labels=None, a 阅读全文

posted @ 2018-11-22 18:51 静悟生慧阅读(15447) 评论(0) 推荐(0)

导入sklearn 报错，找不到相关模块

摘要：1.问题原因：:安装包的来源问题,也可以理解为包版本兼容问题,有的包使用官方出版,有的包使用whl文件安装解决方案:将所有包都统一来源,要么全部使用官方出版的包,要么全部使用whl里面的包,问题就解决了numpy+scipy+scikit-learn组件,使用whl文件安装下载:http://pan 阅读全文

posted @ 2018-11-22 10:56 静悟生慧阅读(2906) 评论(0) 推荐(0)

python 中hive 取日期时间的方法

摘要：打印结果：阅读全文

posted @ 2018-11-21 12:15 静悟生慧阅读(3800) 评论(1) 推荐(0)

特征选择方法

摘要：特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能，更能帮助我们理解数据的特点、底层结构，这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能：在数据挖掘工作中，通常处理的是一个包含大量特征且含义未知的数据集，并基于该数据集挖掘到有用的特征。那么阅读全文

posted @ 2018-11-15 17:32 静悟生慧阅读(958) 评论(0) 推荐(0)

python pandas 计算相关系数

摘要：pandas 中df 对象自带相关性计算方法corr() , 可以用来计算DataFrame对象中所有列之间的相关系数（包括pearson相关系数、Kendall Tau相关系数和spearman秩相关）。 >>> import numpy as np>>> import pandas as pd 阅读全文

posted @ 2018-11-15 15:52 静悟生慧阅读(14477) 评论(0) 推荐(0)

dataframe 合并（append, merge, concat）

摘要：https://www.cnblogs.com/guxh/p/9451532.html https://blog.csdn.net/zutsoft/article/details/51498026 写得比较完整。注意concat 合并dataframe 时的细节：如果两个表的index都没有实际阅读全文

posted @ 2018-11-14 17:23 静悟生慧阅读(982) 评论(0) 推荐(0)

Python 中的 sys.argv 用法

摘要：sys.argv是获取运行python文件的时候命令行参数下面的代码文件是a.py，当我不用IDE工具，只用命令行窗口运行的时候，进入文件所在目录，输入：python a.py 输出结果如下还是上面的代码，当我运行时候输入：python a.py zhang 输出如下继续运行时候输入：pyth 阅读全文

posted @ 2018-11-13 09:59 静悟生慧阅读(1805) 评论(0) 推荐(0)

sklearn 中的交叉验证

摘要：sklearn中的交叉验证（Cross-Validation） sklearn是利用python进行机器学习中一个非常全面和好用的第三方库，用过的都说好。今天主要记录一下sklearn中关于交叉验证的各种用法，主要是对sklearn官方文档 Cross-validation: evaluating 阅读全文

posted @ 2018-11-03 17:52 静悟生慧阅读(1277) 评论(0) 推荐(0)

静悟生慧

随笔分类 - Python

公告