06 2017 档案

摘要:为什么医疗险如此引人注意,是由于比起重疾险或者寿险,在逐渐老龄化的中国社会,健康医疗开支已经成为我们的主要经济负担,而医疗险的补偿机制正好为此而生。 但医疗险的保险期间仅仅有一年,属于短期型产品,须要逐年交费续保。假设不能确定续保,非常有可能存在“年轻时买了用不上,年老时想用买不了”的尴尬局面。所以 阅读全文
posted @ 2017-06-30 08:07 知识天地 阅读(341) 评论(0) 推荐(0)
摘要:requests是Python的一个HTTP客户端库,跟urllib,urllib2类似,那为什么要用requests而不用urllib2呢?官方文档中是这样说明的: python的标准库urllib2提供了大部分需要的HTTP功能,但是API太逆天了,一个简单的功能就需要一大堆代码。 我也看了下r 阅读全文
posted @ 2017-06-29 22:46 知识天地 阅读(662) 评论(0) 推荐(0)
摘要:上一节我们介绍了正则表达式,它的内容其实还是蛮多的,如果一个正则匹配稍有差池,那可能程序就处在永久的循环之中,而且有的小伙伴们也对写正则表达式的写法用得不熟练,没关系,我们还有一个更强大的工具,叫Beautiful Soup,有了它我们可以很方便地提取出HTML或XML标签中的内容,实在是方便,这一 阅读全文
posted @ 2017-06-28 23:05 知识天地 阅读(2575) 评论(0) 推荐(0)
摘要:SequenceFile文件是Hadoop用来存储二进制形式的key-value对而设计的一种平面文件(Flat File)。目前,也有不少人在该文件的基础之上提出了一些HDFS中小文件存储的解决方案,他们的基本思路就是将小文件进行合并成一个大文件,同时对这些小文件的位置信息构建索引。不过,这类解决 阅读全文
posted @ 2017-06-24 08:37 知识天地 阅读(1872) 评论(0) 推荐(0)
摘要:随机森林random forest的pro和con是什么?优势是accuracy高,但缺点是速度会降低,并且解释性interpretability会差很多,也会有overfitting的现象。 为什么要最大化information gain?从root到leaf,使得各class distribut 阅读全文
posted @ 2017-06-16 11:12 知识天地 阅读(557) 评论(0) 推荐(0)
摘要:版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com。也可以加我的微博: @leftnoteasy 前言: 决策树这种算法有着很多良好的特 阅读全文
posted @ 2017-06-15 15:32 知识天地 阅读(256) 评论(0) 推荐(0)