随笔分类 -  大数据

摘要:网络爬虫,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 爬虫主要应对的问题:1.http请求 2.解析html源码 3.应对反爬机制。 觉得爬虫挺有意思的,恰好看到知乎有人分享的一个爬虫小教程:https://zhuanlan.zhihu.com/p/20410446 立马学起! 主要 阅读全文
posted @ 2017-04-16 20:07 jht_newbie 阅读(2063) 评论(0) 推荐(0)
摘要:锁定: 踢人: 存储过程查找: sybase central里面查询的命令(查找过滤器例如:%table%),Sybase Central/Sybase IQ 15/服务器/xxx/xxx/过程和函数/Sp_load_fileTotable_unix_px_new(xxx) 在SybaseIQ登陆到 阅读全文
posted @ 2017-04-07 16:01 jht_newbie 阅读(1472) 评论(0) 推荐(0)
摘要:开始读《大数据时代》一书,为以后大数据方面的工作做做准备吧。虽然学习状态还是颇为浮躁的,但是多学一点是一点,多看一点是一点,多运动一点是一点,就以这种心态勉励自己继续积极学习和锻炼下去吧。 读一点书,查一查资料,做一点笔记,慢慢更新。MapReduce思想(摘自百度百科) 在MapReduc... 阅读全文
posted @ 2015-01-18 22:06 jht_newbie 阅读(903) 评论(0) 推荐(0)