2014年2月28日

Python之列表、元组

摘要: 首先说一下python的计数方式,从第一个元素开始依次为0、1、2...,从最后一个元素往前依次是-1,-2,-3....很有趣是吧!列表和元组的区别是前者可修改,后者不可修改。当用于不可修改的情况下必须元组,其他情况下列表都可以替代元组。通用序列操作:索引:依据编号访问分片(是不是显得比C高大上呀,嘿嘿):通过冒号相隔的两个索引实现,第一个索引包含在分片内,第二个不包含在分片内,另外分片最左边的索引比它最右边的索引早出现在序列中。 可以设置步长,步长为负表示从右往左提取元素。 >>> a[0:6:2] [1, 3, 5] >>> a[5:0:-2] ... 阅读全文

posted @ 2014-02-28 21:46 我是咖啡豆哈 阅读(195) 评论(0) 推荐(0)

Python之字符串

摘要: 在一般情况下,'' '和' '都可以表示字符串,但是当字符串里包含 ' 时再用’ ’会报错,这时需用" ",当然也可以用转义字符\进行转义(转义字符是万能哒)。str(string),把值转化为合理形式的字符串;repr(string)和` `(string)将字符串转化为合法的python表达式raw_input()会把所有输入当做原始数据,而input则会假设用户输入的是合法的python表达式,所以应尽可能使用rwa_input函数书写长字符串需要跨行时可用"""原始字符以r开头,可以在原始 阅读全文

posted @ 2014-02-28 21:04 我是咖啡豆哈 阅读(174) 评论(0) 推荐(0)

决策树

摘要: 算法概述:将原始数据集根据决定性特征划分为几个数据子集,这些数据子集会分布在第一个决策点的所有分支上,如果某个分支下的数据属于同一类型,则表示到达终止模块,可以得到结论,无需进一步对数据集进行分割;如果子集内的数据不属于同一类型,则需重复划分数据子集,直到所有具有相同类型的数据均在一个数据子集内。但是应该怎样划分数据呢,显然是根据决定性特征,这里引进一个度量标准--信息增益(划分数据集之前之后信息发生的变化),我们可以计算每个特征值划分划分数据集获得的信息增益,获得信息增益最高的特征就是最好的选择。3.1.1计算熵熵定义为信息的期望。如果待分类的事务可能划分在多个分类之中,则符号xi的信息定义 阅读全文

posted @ 2014-02-28 15:38 我是咖啡豆哈 阅读(1953) 评论(0) 推荐(0)

导航