2014 年 2月 28 日随笔档案 - 我是咖啡豆哈

2014年2月28日

Python之列表、元组

摘要：首先说一下python的计数方式，从第一个元素开始依次为0、1、2...，从最后一个元素往前依次是-1,-2,-3....很有趣是吧！列表和元组的区别是前者可修改，后者不可修改。当用于不可修改的情况下必须元组，其他情况下列表都可以替代元组。通用序列操作：索引：依据编号访问分片（是不是显得比C高大上呀，嘿嘿）：通过冒号相隔的两个索引实现，第一个索引包含在分片内，第二个不包含在分片内,另外分片最左边的索引比它最右边的索引早出现在序列中。可以设置步长，步长为负表示从右往左提取元素。 >>> a[0:6:2] [1, 3, 5] >>> a[5:0:-2] ... 阅读全文

posted @ 2014-02-28 21:46 我是咖啡豆哈阅读(195) 评论(0) 推荐(0)

Python之字符串

摘要：在一般情况下，'' '和' '都可以表示字符串，但是当字符串里包含 ' 时再用’ ’会报错，这时需用" "，当然也可以用转义字符\进行转义（转义字符是万能哒）。str(string),把值转化为合理形式的字符串；repr(string)和` `(string)将字符串转化为合法的python表达式raw_input()会把所有输入当做原始数据，而input则会假设用户输入的是合法的python表达式，所以应尽可能使用rwa_input函数书写长字符串需要跨行时可用"""原始字符以r开头，可以在原始阅读全文

posted @ 2014-02-28 21:04 我是咖啡豆哈阅读(174) 评论(0) 推荐(0)

决策树

摘要：算法概述：将原始数据集根据决定性特征划分为几个数据子集，这些数据子集会分布在第一个决策点的所有分支上，如果某个分支下的数据属于同一类型，则表示到达终止模块，可以得到结论，无需进一步对数据集进行分割；如果子集内的数据不属于同一类型，则需重复划分数据子集，直到所有具有相同类型的数据均在一个数据子集内。但是应该怎样划分数据呢，显然是根据决定性特征，这里引进一个度量标准--信息增益（划分数据集之前之后信息发生的变化），我们可以计算每个特征值划分划分数据集获得的信息增益，获得信息增益最高的特征就是最好的选择。3.1.1计算熵熵定义为信息的期望。如果待分类的事务可能划分在多个分类之中，则符号xi的信息定义阅读全文

posted @ 2014-02-28 15:38 我是咖啡豆哈阅读(1953) 评论(0) 推荐(0)

Python之列表、元组

Python之字符串

决策树

导航

公告