上一页 1 ··· 67 68 69 70 71 72 73 74 75 ··· 123 下一页
摘要: 点击菜单栏中的宏,创建一个宏,粘贴后附代码,然后运行getcsv这个宏,会跳出一个窗口,选择所有你要转化的xls文件。点击运行。 选中以后,等一段时间,再回到xls文件下,会多一个csv文件夹,里面就是我们要导入R的文本文件了。如果要转换的是xlsx文件,把代码中的xls改成xlsx即可。 Sub 阅读全文
posted @ 2020-03-17 15:02 技术研究与问题解决 阅读(1132) 评论(0) 推荐(0)
摘要: 用python连接Oracle是总是乱码,最后发现时oracle客户端的字符编码设置不对。 编写的python脚本中需要加入如下几句: import osos.environ['NLS_LANG'] = 'SIMPLIFIED CHINESE_CHINA.UTF8' 这样可以保证select出来的中 阅读全文
posted @ 2020-03-17 13:07 技术研究与问题解决 阅读(561) 评论(0) 推荐(0)
摘要: Python+Pandas 读取Oracle数据库 import pandas as pd from sqlalchemy import create_engine import cx_Oracle db=cx_Oracle.connect('userid','password','10.10.1. 阅读全文
posted @ 2020-03-17 10:24 技术研究与问题解决 阅读(1124) 评论(0) 推荐(0)
摘要: 环境:Oracle database 11gR2, RHEL 5.4 导出表中的部分(query): expdp hmt/123456 dumpfile=hmtdb20130301_hmt_log.dmp directory=hmt_dir tables = fct_hmt_log query=fc 阅读全文
posted @ 2020-03-14 17:35 技术研究与问题解决 阅读(3367) 评论(1) 推荐(0)
摘要: sklearn随机森林-分类参数详解 1、sklearn中的集成算法模块ensemble ensemble.AdaBoostClassifier : AdaBoost分类 ensemble.AdaBoostRegressor :Adaboost回归 ensemble.BaggingClassifie 阅读全文
posted @ 2020-03-11 13:48 技术研究与问题解决 阅读(1949) 评论(0) 推荐(0)
摘要: reshape(行数,列数)常用来更改数据的行列数目 一般可用于numpy的array和ndarray, pandas的dataframe和series(series需要先用series.values把对象转化成ndarray结构) 那么问题来了reshape(-1,1)是什么意思呢?难道有-1行? 阅读全文
posted @ 2020-03-10 12:37 技术研究与问题解决 阅读(732) 评论(0) 推荐(0)
摘要: Scikit-Learn & TensorFlow机器学习实用指南(二):一个完整的机器学习项目【上】 阅读全文
posted @ 2020-03-09 14:06 技术研究与问题解决 阅读(78) 评论(0) 推荐(0)
摘要: 查看包内函数: dir(sklearn.preprocessing) 阅读全文
posted @ 2020-03-09 11:50 技术研究与问题解决 阅读(117) 评论(0) 推荐(0)
摘要: 盘点 | Python自带的那些数据集 阅读全文
posted @ 2020-03-09 10:15 技术研究与问题解决 阅读(479) 评论(0) 推荐(0)
摘要: 阅读目录 1. 明确数据集有多少特征,哪些是连续的,哪些是类别的 2. 检查有没有缺失值,对缺失的特征选择恰当的方式进行弥补,使数据完整 3. 对连续的数值型特征进行标准化 4. 对类别型的特征进行编码 5. 根据实际问题分析是否需要对特征进行相应的函数转换 6. 使用Sklearn.pipelin 阅读全文
posted @ 2020-03-09 09:49 技术研究与问题解决 阅读(519) 评论(0) 推荐(0)
上一页 1 ··· 67 68 69 70 71 72 73 74 75 ··· 123 下一页