会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
彩色铅笔
博客园
首页
新随笔
联系
订阅
管理
[置顶]
记一次企业级爬虫系统升级改造(六):基于Redis实现免费的IP代理池
摘要: 前言: 首先表示抱歉,春节后一直较忙,未及时更新该系列文章。 近期,由于监控的站源越来越多,就偶有站源做了反爬机制,造成我们的SupportYun系统小爬虫服务时常被封IP,不能进行数据采集。 这时候,前面有园友提到的IP代理就该上场表演了。 IP代理池设计: 博主查阅与调研了多方资料,最终决定先通
阅读全文
posted @ 2017-03-20 10:32 彩色铅笔
阅读(5719)
评论(40)
推荐(17)
[置顶]
记一次企业级爬虫系统升级改造(五):基于JieBaNet+Lucene.Net实现全文搜索
摘要: 实现效果: 上一篇文章有附全文搜索结果的设计图,下面截一张开发完成上线后的实图: 基本风格是模仿的百度搜索结果,绿色的分页略显小清新。 目前已采集并创建索引的文章约3W多篇,索引文件不算太大,查询速度非常棒。 刀不磨要生锈,人不学要落后。每天都要学一些新东西。 基本技术介绍: 还记得上一次做全文搜索
阅读全文
posted @ 2017-01-20 09:58 彩色铅笔
阅读(3897)
评论(34)
推荐(33)
[置顶]
记一次企业级爬虫系统升级改造(四):爬取微信公众号文章(通过搜狗与新榜等第三方平台)
摘要: SupportYun系统当前一览: 首先说一下,文章的进度一直是延后于系统开发进度的。 当前系统V1.0 已经正式上线服役了,这就给大家欣赏几个主要界面~~ 哈哈~这是系统主页,极简风格。主体框架使用的是 B-JUI ,偶然间看到的一个开源框架,相信它的作者会把它做得越来越好! 这是数据列表的功能页
阅读全文
posted @ 2017-01-11 10:18 彩色铅笔
阅读(4942)
评论(32)
推荐(23)
[置顶]
记一次企业级爬虫系统升级改造(三):文本分析与数据建模规则化处理
摘要: SupportYun当前状况: 博主的SupportYun系统基本已经完成第一阶段预期的底层服务开发啦~~~自己小嘚瑟一下。 有对该系统历史背景与功能等不明白的可先看该系列的第1/2篇文章: 1.记一次企业级爬虫系统升级改造(一) 2.记一次企业级爬虫系统升级改造(二):基于AngleSharp实现
阅读全文
posted @ 2016-12-15 13:35 彩色铅笔
阅读(3157)
评论(33)
推荐(14)
[置顶]
记一次企业级爬虫系统升级改造(二):基于AngleSharp实现的抓取服务
摘要: 爬虫系统升级改造正式启动: 在第一篇文章,博主主要介绍了本次改造的爬虫系统的业务背景与全局规划构思: 未来Support云系统,不仅仅是爬虫系统,是集爬取数据、数据建模处理统计分析、支持全文检索资源库、其他业务部门和公司资讯系统重要数据来源、辅助决策等功能于一身的企业级Support系统。 介于好多
阅读全文
posted @ 2016-12-05 11:15 彩色铅笔
阅读(3161)
评论(15)
推荐(5)
[置顶]
记一次企业级爬虫系统升级改造(一)
摘要: 项目缘由: 公司一直有一个半死不活的爬虫系统,在爬取着市面上竞争公司官网的一些活动、文章等内容。 由于该系统的开发人员已离职快两年,多次经手,现已基本失去爬取能力,每周的报表都得靠人工汇总。 在我们这个以移民业务为主,IT部门隶属于后勤服务的所谓的大企业的子公司里面,英勇的前任leader满口答应高
阅读全文
posted @ 2016-11-29 11:39 彩色铅笔
阅读(7968)
评论(62)
推荐(38)
[置顶]
.NET MVC实现多图片上传并附带参数(ajaxfileupload)
摘要: 做网站呢,都免不了要做图片上传。 还记得去年做微信的时候用WebAPI+ajaxfileupload.js做了一个能够附带参数上传的功能,博文地址:.NET WebAPI 实现图片上传(包括附带参数上传图片) 这段时间在做一个网站,用的MVC5.0,有一个上传多张图片的需求...刚开始用的flash
阅读全文
posted @ 2016-05-19 10:28 彩色铅笔
阅读(8538)
评论(47)
推荐(41)
[置顶]
一个幸运的本命年,2015记事
摘要: 15年过去快一周了,虽说年底现在的团队就要解散,但这一年的付出与收获应该被记录下来,才算是对自己的一种负责... 先来说说我与博客园的相识经历: 大二的时候,天天泡宿舍打游戏,QQ仙侠传,玩的还不错...偶然组的一个下本的野队,聊天的时候,一个上班族(现在看来应该是程序员,当时没细问...
阅读全文
posted @ 2016-01-07 15:23 彩色铅笔
阅读(2900)
评论(28)
推荐(20)
[置顶]
NPOI操作EXCEL(六)——矩阵类表头EXCEL模板的解析
摘要: 哈哈~~~很高兴还活着。总算加班加点的把最后一类EXCEL模板的解析做完了...前面几篇文章介绍了博主最近项目中对于复杂excel表头的解析,写得不好,感谢园友们的支持~~~今天再简单讲诉一下另一种“变异”EXCEL表头模板——矩阵表头模板的解析(博主感觉这种模板虽说怪异,但是偶尔也能遇到,的确是有...
阅读全文
posted @ 2015-10-27 09:11 彩色铅笔
阅读(3775)
评论(21)
推荐(6)
[置顶]
c#与JavaScript实现对用户名、密码进行RSA非对称加密
摘要: 博主最近手上这个项目呢(就是有上百个万恶的复杂excel需要解析的那个项目,参见博客:http://www.cnblogs.com/csqb-511612371/p/4885930.html),由于是一个内网项目,安全性要求很低,不需要做什么报文加密。但是总觉得用户名密码都是明文传输,略微有点坑甲方...
阅读全文
posted @ 2015-10-22 10:04 彩色铅笔
阅读(12242)
评论(49)
推荐(28)
[置顶]
NPOI操作EXCEL(五)——含合并单元格复杂表头的EXCEL解析
摘要: 我们在第三篇文章中谈到了那些非常反人类的excel模板,博主为了养家糊口,也玩命做出了相应的解析方法...我们先来看看第一类复杂表头:......博主称这类excel模板为略复杂表头模板(蓝色部分为表头部分,蓝色前面几行是博主项目的基础样式,称为元数据),这类excel的表头多为2-3行,甚至于5/...
阅读全文
posted @ 2015-10-21 09:52 彩色铅笔
阅读(21793)
评论(74)
推荐(13)
[置顶]
NPOI操作EXCEL(四)——反射机制批量导出excel文件
摘要: 前面我们已经实现了反射机制进行excel表格数据的解析,既然有上传就得有下载,我们再来写一个通用的导出方法,利用反射机制实现对系统所有数据列表的筛选结果导出excel功能。我们来构想一下这样一个画面,管理员筛选出北京的所有员工数据,想导出成excel表格;管理员筛选出北京所有欠费的企业数据,想导出成...
阅读全文
posted @ 2015-10-20 09:30 彩色铅笔
阅读(5405)
评论(21)
推荐(6)
[置顶]
NPOI操作EXCEL(三)——反射机制进行excel表格数据的解析
摘要: 我们先来回忆回忆上篇文章讲到的通过xml配置文件实现excel批量模板解析的整体思路:1.对每个excel模板制定xml配置规则集,实现xml配置文件的解析服务2.为每个excel模板制定DTO,继承于一个BaseDTO3.实现两个工厂方法,一是获取某excel模板xml配置文件路径;一是获取某ex...
阅读全文
posted @ 2015-10-19 12:00 彩色铅笔
阅读(7245)
评论(15)
推荐(2)
[置顶]
NPOI操作EXCEL(二)——大量不同模板时设计方式
摘要: 上一篇文章介绍了一些NPOI的基础接口,我们现在就来看看具体怎么用NPOI来解析一个EXCEL。博主现在有这么一堆excel需要解析数据入库:当然这只是员工的简要模板,还有很多其他的模板。我们可以要求线下人员把表头都做成像这样的表头,但是数据的列数与各列内容是不受我们所控制的。那么我们需要的就是一个...
阅读全文
posted @ 2015-10-16 17:46 彩色铅笔
阅读(6837)
评论(12)
推荐(5)
[置顶]
由一个投票算法引发的思考
摘要: 博主的APP最近又新加了一个小功能,每个员工都可以上传自己的工作照,其他员工可以点赞,规则是:每张工作照每个员工(除上传者外)每日可点赞一次。举个例子:现有注册员工ABCD四人,A上传工作照两张P1和P2,BCD三人每天可为P1、P2分别点赞一次博主略加思考,写了下面一段代码来实现: 1 ...
阅读全文
posted @ 2015-10-13 17:58 彩色铅笔
阅读(1387)
评论(6)
推荐(0)
[置顶]
.NET WebAPI 实现图片上传(包括附带参数上传图片)
摘要: 博主的项目,客户端是APP,考虑到以后也可能会应用到微信端、网站等,图片上传方法就需要兼容多端,并且以目前的设计,不允许非登录用户上传图片,就得在上传时解决附带参数上传图片的问题。先来看看后台方法(逻辑都写在了一起,有点乱,分布式文件系统还没做好,暂时存在了本地...): 1 //...
阅读全文
posted @ 2015-10-12 14:26 彩色铅笔
阅读(34220)
评论(18)
推荐(9)
[置顶]
.NET WebAPI 用ExceptionFilterAttribute实现错误(异常)日志的记录(log4net做写库操作)
摘要: 好吧,还是那个社区APP,非管理系统,用户行为日志感觉不是很必要的,但是,错误日志咱还是得记录则个。总不能上线后报bug了让自己手足无措吧,虽然不管有木有错误日志报bug都是件很头疼的事...我们知道webAPI也有好几个Filter,上篇文章我们做token与权限用到了ActionFilterAt...
阅读全文
posted @ 2015-10-10 10:59 彩色铅笔
阅读(4535)
评论(4)
推荐(4)
[置顶]
.NET WebAPI 用ActionFilterAttribute实现token令牌验证与对Action的权限控制
摘要: 项目背景是一个社区类的APP(求轻吐...),博主主要负责后台业务及接口。以前没玩过webAPI,但是领导要求必须用这个(具体原因鬼知道),只好硬着头皮上了。最近刚做完权限这一块,分享出来给大家。欢迎各种吐槽批判践踏...先说说用户身份的识别,简单的做了一个token机制。用户登录,后台产生令牌,发...
阅读全文
posted @ 2015-10-09 17:44 彩色铅笔
阅读(8140)
评论(36)
推荐(8)
下一页
公告