会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
coskaka
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
下一页
2017年1月18日
利用python进行数据分析—数据清洗记录3,map,apply,
摘要: 社会心态调查报告 导语: 时代决定心态,心态映照时代。社会心态产生于社会个体心理,又以整体的形态存在,进而影响着每个社会成员的社会价值取向和行为方式,影响着国家经济政治和社会发展大局。良好的社会心态,是促进个人、社会、国家发展进步的重要心理基础,是国家文化软实力的重要组成部分,社会心态是改革发展的“
阅读全文
posted @ 2017-01-18 21:56 coskaka
阅读(2308)
评论(0)
推荐(0)
2017年1月2日
python_根据"词库"进行“词联想”
摘要: 输入法中,当你输入一个字的时候,输入法就能猜出你要输入什么词。这就是词联想。现在,再python中简单实现类似这样的功能:根据制定好的词库,输入一个新的词,帮助实现词联想。其中分词用了jieba包。
阅读全文
posted @ 2017-01-02 22:05 coskaka
阅读(6473)
评论(0)
推荐(0)
2016年12月12日
【scrapy实践】_爬取安居客_广州_新楼盘数据
摘要: 需求:爬取【安居客—广州—新楼盘】的数据,具体到每个楼盘的详情页的若干字段。 难点:楼盘类型各式各样:住宅 别墅 商住 商铺 写字楼,不同楼盘字段的名称不一样。然后同一种类型,比如住宅,又分为不同的情况,比如分为期房在售,现房在售,待售,尾盘。其他类型也有类似情况。所以字段不能设置固定住。 解决方案
阅读全文
posted @ 2016-12-12 18:18 coskaka
阅读(2056)
评论(0)
推荐(0)
2016年12月8日
scrapy入门实践1
摘要: Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。 这就是整个Scrapy的架构图了; 各部件职能: Scrapy Engine: 这是引擎,负责Spiders、ItemPipeline、Downloader、Sch
阅读全文
posted @ 2016-12-08 22:20 coskaka
阅读(281)
评论(0)
推荐(0)
2016年12月6日
《大数据客户分析》系列1——客户分析简介
摘要: 注:此系列为《一本书读懂客户分析》一书的读书笔记,其中若是参考其他书籍或是文章会在引用出注明。本系列开始之前作此说明,其他文章不再说明。 客户分析简介
阅读全文
posted @ 2016-12-06 19:52 coskaka
阅读(251)
评论(0)
推荐(0)
2016年11月30日
科学道德
摘要: 关于“科学道德”这个词并不陌生,不管是各类考试的作文中,还是媒体的曝光,但是一直没有引起过多重视,我想不仅是我大多数人也是这样。和很多事情一样,可能只有切身经历过才能有深刻认识;而此类事件频发,我想,一是学术造假等这类科学不道德行为的成本、风险太低,即不管是宣传教育还是法律层面的约束都还不够,这是最
阅读全文
posted @ 2016-11-30 22:08 coskaka
阅读(416)
评论(0)
推荐(0)
梯度下降算法笔记
摘要: 今天课上主要讲的是梯度下降算法。 上一次老师留了梯度下降算法求解线性回归的作业。大部分用java和C++实现的。 笔记也主要来自课程ppt,老师课程的ppt也主要参考的斯坦福吴恩达老师的讲义。 梯度下降法(英语:Gradient descent)是一个一阶最优化算法,通常也称为最速下降法。 要使用梯
阅读全文
posted @ 2016-11-30 22:05 coskaka
阅读(1354)
评论(0)
推荐(0)
2016年11月27日
数据清洗记录2
摘要: 爬虫爬下来的数据,有个字段含有大量脏数据,如图1所示,现在需要提取出“红色框”中的“作者机构名称”。 一开始用的excel,替换、分类、按照模式的快速填充各种都用上了,但是,数据量太大了(有上万条,辛苦机器性能还行)而且你懂得,人工操作肯定有误操作而且分列啥的这些功能适应新不怎么强,结果,弄了小半天
阅读全文
posted @ 2016-11-27 22:14 coskaka
阅读(438)
评论(0)
推荐(0)
pandas中Loc vs. iloc vs. ix vs. at vs. iat?
摘要: loc: only work on indexiloc: work on positionix: You can get data from dataframe without it being in the indexat: get scalar values. It's a very fast
阅读全文
posted @ 2016-11-27 21:12 coskaka
阅读(377)
评论(0)
推荐(0)
Linux下anaconda的安装
摘要: http://peteryuan.net/use-anaconda/ http://www.jianshu.com/p/03d757283339
阅读全文
posted @ 2016-11-27 19:53 coskaka
阅读(150)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
下一页
公告