2019年5月26日

AutoML学习---机器学习01

摘要: 一、机器学习 1、机器学习框架 转换为网络结构,如下图所示: 2、框架分析 (1)数值特性: ① 连续特征:log1P、|x| 、ex、归一化、离散化、顺序号等。 ② 离散特征:频率、目标编码、One-hot 编码、合并、Label-Encoder 等。 (2)特征提取(以文本为例): 特征特征提取 阅读全文

posted @ 2019-05-26 14:46 终是双曲线 阅读(188) 评论(0) 推荐(0) 编辑

2019年5月19日

数据分析------数据处理(2)及 AutoML 学习

摘要: 接上一篇《数据分析 数据处理(1)》https://www.cnblogs.com/lifengB511/p/10848862.html 5、插入记录与修改记录 5.1 插入记录 Pandas里并没有直接指定索引的插入行的方法,需要用户自行设置。 代码如下: 注意:df.loc[:0] 不能写成 l 阅读全文

posted @ 2019-05-19 15:47 终是双曲线 阅读(454) 评论(0) 推荐(0) 编辑

2019年5月12日

数据分析------数据处理(1)

摘要: 1、数据导入 数据存在的形式多种多样,如文件有 csv、Excel、txt 格式,数据库有 MySQL、Access、SQL Server 等形式。 1.1 导入 txt 文件 read_table 函数,导入 txt 文件,格式如下: 其中,file 为文件路径与文件名; names 为列名,默认 阅读全文

posted @ 2019-05-12 14:50 终是双曲线 阅读(599) 评论(0) 推荐(0) 编辑

2019年4月28日

2019-04-28——Django学习

摘要: 1、Django: Python Web应用开发框架,Django是走大而全的方向,它最出名的是其全自动化的管理后台:只需要使用起ORM,做简单的对象定义,它就能自动生成数据库结构、以及全功能的管理后台。 2、Flask:轻量级Web应用框架,也被称为“microframework”,因为它使用简单 阅读全文

posted @ 2019-04-28 11:13 终是双曲线 阅读(318) 评论(1) 推荐(1) 编辑

2019年4月20日

2019-04(2)Python学习

摘要: 一、元组 1、什么是元组? 元组是一个固定长度,不可改变的Python序列对象。创建元组的最简单方式,是用逗号分隔一列值: 当用复杂的表达式定义元组,最好将值放到圆括号内,如下所示: 2、拆分元组 将元组赋值给类似元组的变量,Python会试图拆分等号右边的值,即使含有元组的元组也会被拆分: In 阅读全文

posted @ 2019-04-20 20:27 终是双曲线 阅读(322) 评论(0) 推荐(0) 编辑

2019年4月13日

2019-04(1)(Python学习)

摘要: 9.1 迭代器 创建迭代器的3种方法: 方法一: 容器对象添加 __iter__() 和 __next__() 方法(Python 2.7 中是 next());__iter__() 返回迭代器对象本身 self,__next__() 则返回每次调用 next() 或迭代时的元素; 自定义一个迭代器 阅读全文

posted @ 2019-04-13 16:04 终是双曲线 阅读(313) 评论(2) 推荐(0) 编辑

导航