随笔分类 -  python

上一页 1 2

python
评分卡系列(二):特征工程
摘要:在上一篇文章中,我们对LendingClub的数据有了一个大致的了解,这次我将带大家把10万多条、145个字段的原始数据一步一步处理成建模所需输入的数据。 我们先按照上次一样导入数据,这里我将逾期15天以上的都当作正类 1、评分卡简介 在进行下一步操作之前,我们先来解构一下评分卡。 贷款机构(含银行 阅读全文

posted @ 2019-03-25 16:33 tan_2810 阅读(375) 评论(0) 推荐(0)

python读取日志,存入mysql
摘要:1、从 http://www.almhuette-raith.at/apache-log/access.log 下载 1万条日志记录,保存为一个文件,读取文件并解析日志,从日志中提取ip, time_local, http_method, url, http_status, body_bytes_s 阅读全文

posted @ 2019-03-25 16:28 tan_2810 阅读(218) 评论(0) 推荐(0)

互联网金融风控模型大全
摘要:一、市场调研目前市面主流的风控模型1、互联网金融前10名排行榜(数据截止日期2017-09-12)互联网金融公司排名分别是蚂蚁金服、陆金所、京东金融、苏宁金融、百度金融、腾讯理财通、宜信、钱大掌柜、万达金融和网易理财。1.1 蚂蚁金服1.1.1 大数据技术 对接第三方征信公司芝麻信用分,通过用户信用 阅读全文

posted @ 2019-03-25 16:24 tan_2810 阅读(691) 评论(0) 推荐(0)

用PMML实现机器学习模型的跨平台上线
摘要:在机器学习用于产品的时候,我们经常会遇到跨平台的问题。比如我们用Python基于一系列的机器学习库训练了一个模型,但是有时候其他的产品和项目想把这个模型集成进去,但是这些产品很多只支持某些特定的生产环境比如Java,为了上一个机器学习模型去大动干戈修改环境配置很不划算,此时我们就可以考虑用预测模型标 阅读全文

posted @ 2019-03-25 16:22 tan_2810 阅读(231) 评论(0) 推荐(0)

python pandas stack和unstack函数
摘要:在用pandas进行数据重排时,经常用到stack和unstack两个函数。stack的意思是堆叠,堆积,unstack即“不要堆叠”,我对两个函数是这样理解和区分的。 常见的数据的层次化结构有两种,一种是表格,一种是“花括号”,即下面这样的l两种形式: store1 store2 store3 s 阅读全文

posted @ 2019-02-01 12:59 tan_2810 阅读(838) 评论(0) 推荐(1)

十分钟掌握pandas(pandas官方文档翻译)
摘要:十分钟掌握pandas 文档版本:0.20.3 这是一个对pandas简短的介绍,适合新用户。你可以在Cookbook中查看更详细的内容。 通常,我们要像下面一样导入一些包。 创建对象 用一个包含值的序列创建一个Series,pandas会创建一个默认的整数索引 用numpy数值创建一个带有date 阅读全文

posted @ 2019-01-14 17:58 tan_2810 阅读(432) 评论(0) 推荐(0)

python数据类型详解
摘要:目录 1、字符串2、布尔类型3、整数4、浮点数5、数字6、列表7、元组8、字典9、日期 1、字符串1.1、如何在Python中使用字符串a、使用单引号(')用单引号括起来表示字符串,例如:str='this is string';print str; b、使用双引号(")双引号中的字符串与单引号中的 阅读全文

posted @ 2018-12-28 17:56 tan_2810 阅读(175) 评论(0) 推荐(0)

上一页 1 2

导航