随笔分类 -  python数据分析

摘要:社会心态调查报告 导语: 时代决定心态,心态映照时代。社会心态产生于社会个体心理,又以整体的形态存在,进而影响着每个社会成员的社会价值取向和行为方式,影响着国家经济政治和社会发展大局。良好的社会心态,是促进个人、社会、国家发展进步的重要心理基础,是国家文化软实力的重要组成部分,社会心态是改革发展的“ 阅读全文
posted @ 2017-01-18 21:56 coskaka 阅读(2308) 评论(0) 推荐(0)
摘要:爬虫爬下来的数据,有个字段含有大量脏数据,如图1所示,现在需要提取出“红色框”中的“作者机构名称”。 一开始用的excel,替换、分类、按照模式的快速填充各种都用上了,但是,数据量太大了(有上万条,辛苦机器性能还行)而且你懂得,人工操作肯定有误操作而且分列啥的这些功能适应新不怎么强,结果,弄了小半天 阅读全文
posted @ 2016-11-27 22:14 coskaka 阅读(438) 评论(0) 推荐(0)
摘要:以下分别是numpy、Scipy、pandas的简介。虽然这些包提供的一些结构比python自身的“更高级、更高效”,更高级是因为它们能完成更高级的任务,但是,学习的时候尽量不要和python割裂开认识,最好是辩证的看问题,既要看到区别,又要看到联系,这样才能理解深刻、真正的运用自如。比如pytho 阅读全文
posted @ 2016-11-26 11:53 coskaka 阅读(2384) 评论(0) 推荐(0)
摘要:pandas数据清洗:http://www.it165.net/pro/html/201405/14269.html 贴吧爬取得数据,vehicle字段需要处理一下,即把vehicle字段的某些值做下替换: 阅读全文
posted @ 2016-11-25 13:41 coskaka 阅读(290) 评论(0) 推荐(0)