摘要: Hawk: Advanced Crawler& ETL tool written in C /WPF 1.软件介绍 Hawk3已经发布,本文的很多信息已经不完整或过期,所有更新信息和下载地址都可参考下面的链接: https://github.com/ferventdesert/Hawk HAWK是一阅读全文
posted @ 2016-05-03 12:48 FerventDesert 阅读(29390) 评论(52) 编辑
摘要: 进博客园四年多,从第一篇讨论地图显示的文章到现在,已经有80多篇文章了。此处总结一下写过的文章并作分类,方便大家查看。革命尚未成功,同志仍需努力!个人邮箱 buptzym@qq.com数据分析,编译和模式用数据说话:北京房价数据背后的数据《编程语言实现模式》笔记(一)词法和句法分析数据挖掘工具分析北...阅读全文
posted @ 2013-07-16 09:55 FerventDesert 阅读(3241) 评论(3) 编辑
摘要: 《罗辑思维》大概是所有音频节目里做的最好的,在清醒的10分钟干货满满,后面的时间睡得很香甜。每隔20秒从罗胖嘴里说出来的“人类社会”,"人格道德"这样的大词,都会让瞌睡虫进一步占领大脑,治好了不少人多年的失眠症。 网上有篇文章《罗振宇的骗局》火了一把,文章内容按下不表。罗振宇为此专门开了一次内部阅读全文
posted @ 2018-06-22 07:38 FerventDesert 阅读(67) 评论(0) 编辑
摘要: 超级图形化爬虫Hawk已经发布两年半时间了,2015年升级到第二版,收到上千条用户反馈(tucao),100多个红包,总共666块五毛~一直想攒着这笔钱,去北境之王天通苑的龙德商场买最心爱的阿迪王! 啥,你不知道Hawk是什么?它是智能而强大的网络数据采集工具,全图形化无需编程,一些功能强大到作者自阅读全文
posted @ 2018-05-13 12:20 FerventDesert 阅读(1607) 评论(37) 编辑
摘要: 大型企业面对快速变化的市场形势,需要有像创业公司一样快速的反应能力。然而由于复杂的人员和层级关系,大企业做到“拥抱变化”是很困难的。 传统以职能部门分治的树状组织架构,若一个底层员工有个好点子,就不得不自下而上说服管理层,管理层还需发动行政力量推动层层下属,任何一环出了问题就难以进行,其难度可想而阅读全文
posted @ 2018-04-09 22:47 FerventDesert 阅读(1364) 评论(1) 编辑
摘要: 营销是发现或挖掘准消费者和众多商家需求,通过对自身商品和服务的优化和定制,进而推广、传播和销售产品,实现最大化利益的过程。例如,银行可通过免息卡或降价对处在分期意愿边缘的用户进行营销,促使其分期进而提升整体利润;选择最优时机和地点对用户进行广告投放提升转化。 在大数据和“千人千面”的背景下,营销升级阅读全文
posted @ 2018-03-30 17:24 FerventDesert 阅读(237) 评论(0) 编辑
摘要: 没有隐私的时代 互联网社会,个人难有隐私可言,倒卖信息和电信诈骗比比皆是,然而这只是冰山的一角。数据是金矿,厂商花费高额成本收集用户数据都用于做什么呢? ![此处输入图片的描述][1] 虽然让别人知道自家门牌号和电话是件很可怕的事情。但明确信息不一定最有价值,因为这些很可能是用户刻意伪造或是不准确的阅读全文
posted @ 2018-01-01 19:22 FerventDesert 阅读(130) 评论(1) 编辑
摘要: 针对IEnumerable已经有多篇文章,本篇介绍如何使用IEnumerable实现ETL. ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程。通常来说,从原始端采集的数阅读全文
posted @ 2017-12-18 19:49 FerventDesert 阅读(318) 评论(1) 编辑
摘要: 不想在北京呆了! 最近几天在北京呆不下去了!每天挤地铁被大叔的体香拥抱也就罢了,出门就被有毒的雾霾淹没,回了家还冻成狗,盖了三床被子都冷! 讲道理,今年夏天天气不错,我本来想给北京天气贴个小红花的,可是胶水还没干,10月份开始,重雾霾几次冲击北京,原来危害北京的上班族的,不仅有过劳死,还有毒雾霾! 阅读全文
posted @ 2017-12-18 19:41 FerventDesert 阅读(594) 评论(5) 编辑
摘要: 浮躁已经成了普遍的社会现象。判断一个人是否浮躁非常容易,看他一天主动拿起手机的次数就可以了。据TED的演讲者说,这个值一般是50次,除了8小时的睡觉之外,基本上每20分钟就要去翻翻手机。 你会去用手机做什么?看微信,票圈,微博,知乎,淘宝,或只是来回刷首页。我们不是名人,没人关心你在社交网络上的行动阅读全文
posted @ 2017-12-18 19:05 FerventDesert 阅读(15951) 评论(110) 编辑
摘要: 0. 如何入门数据分析 关注沙漠之鹰的同学一定看过沙漠君写得很多篇数据分析文章,比如分析房价,车价,预测机动车摇号这些话题。其实文章中所有的分析都使用了Python和它非常强大的数据分析库Pandas。一些机器学习和预测的功能则用到了sklearn库。掌握了这些工具,就能应对绝大多数的分析需求。 纸阅读全文
posted @ 2017-07-10 08:33 FerventDesert 阅读(2030) 评论(1) 编辑
摘要: 本文是笔者阅读《推荐系统实战》后的一篇读书笔记,包括了笔者的一部分浅显思考。书质量非常不错,有问题欢迎指正! 什么是好的推荐系统 推荐系统一般有两种:一种是预测用户评分,另外是给出TopN,但后者会更频繁更有用。因为预测分数并不能怎么样。“重点是他看了,而不是评价”。下面都以TopN为主。 衡量推荐阅读全文
posted @ 2017-07-09 10:12 FerventDesert 阅读(1415) 评论(1) 编辑