随笔分类 -  互联网金融

摘要:一般银行的数据库是oracle,互联网企业用mysql 因此对于mysql,就可以通过python接口pymysql操作,本质上还是sql语言操作数据库,只是python再去拿结果分析 pymysql操作简介 连接数据库得到表 cursor获得操作句柄 cursor.execute("sql语句") 阅读全文
posted @ 2021-04-03 20:46 Parallax 阅读(122) 评论(0) 推荐(0)
摘要:1. 编码之后的数值,不仅代表此特征取值,还代表了对于标签属性的影响权重 2. WOE编码将非线性特征转化成对于标签来说的线性特征,更契合广义线性模型。 阅读全文
posted @ 2021-03-25 16:13 Parallax 阅读(116) 评论(0) 推荐(0)
摘要:1 阅读全文
posted @ 2021-03-25 15:38 Parallax 阅读(51) 评论(0) 推荐(0)
摘要:2010-2020 互金发展的飞速十年,带来的问题 * p2p暴雷(伪标的) * 校园裸贷 * 用户隐私泄露 * 暴力催收 * 线上高利贷 消金发展的好处: 扩大消费,拉动内需 金融业务: 银行理财 保险 证券 基金 消金 供应链金融:数据难采集,信用体系发展缓慢 支付业务 国家监管政策: 持牌与合 阅读全文
posted @ 2021-03-25 01:07 Parallax 阅读(29) 评论(0) 推荐(0)
摘要:纵坐标:真正例率 正样本被正确召回的比例 横坐标:假正例率(分子是预测为正实际为反,分母是负样本) 负样本被错误找回的比例 因此在ROC曲线的面积AUC,可以理解为是固定FPR,正样本的正确召回率;或者固定TPR,负样本的正确召回率。(样本预测的排序质量) 因此AUC越大越好。 显然,我们关注的是模 阅读全文
posted @ 2021-03-12 18:09 Parallax 阅读(183) 评论(0) 推荐(0)
摘要:可以用来异常值检测 上四分位数:75%的分界线 Q3 下四分位数:25%分界线 Q1 画图时,如何设置异常值界限? 首先确定上下限,比如,如果满足超过上限的3倍区间长度就是异常值。 异常值如何处理: 不宜直接删除 如央行(PBC--people’s Bank of China)征信系统(credit 阅读全文
posted @ 2021-03-09 10:51 Parallax 阅读(683) 评论(0) 推荐(0)
摘要:即非结构化数据,包括 图数据, HBase列存储数据等 Neo4j 工业首选 可用Neo4j数据库来可视化查询等,用的Cypher语言类似sql语言),有python接口py2neo 用途 金融风控中用来欺诈团伙识别 阅读全文
posted @ 2021-03-06 19:24 Parallax 阅读(45) 评论(0) 推荐(0)
摘要:https://www.postgresqltutorial.com/postgresql-python/ 阅读全文
posted @ 2021-02-28 13:29 Parallax 阅读(88) 评论(0) 推荐(0)
摘要:一种用于存储和传输信息的加密安全分布式存储数据库技术。数据库中的每条记录都称为一个块,并包含诸如事务日期和到前一个块的链接等详细信息。 区块链的主要优点是它是分布式的,没有人可以控制输入的数据或它们的完整性。 可以应用于大数据领域,尤其是提高数据的安全性或质量。 因此区块链实际上是与大数据存储传输直 阅读全文
posted @ 2021-02-22 15:47 Parallax 阅读(76) 评论(0) 推荐(0)