07 2017 档案
摘要:jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。 jsoup的主要功能如下: 从一个URL,文件或字符串中解析HTML; 使用DOM或CSS选择器来查找、取出
阅读全文
摘要:聚类 聚类任务 在无监督学习(密度估计、异常检测等)中,训练样本的标记信息是未知的(即不人为指定),旨在发现数据之间的内在联系和规律,为进一步的数据分析提供基础。 此类学习任务中研究最多、应用最广的是聚类。 聚类将数据集中的样本划分为若干个通常是不相交(有的时候会相交)的子集(簇,也叫类),即将样本
阅读全文
摘要:业余草网站接收软文推广了。价格低的超乎你的想象。效果明显。 软文是近几年企业较为依赖推广方式,一篇好的软文如果可以出现在一些权威的网站上,可以在短时间内吸引大量的关注,提升品牌和企业的曝光量。那么软文营销是如何为企业锦上添花呢? 相对于图片硬广的短时间聚焦效果,软文页面内容一旦被成功收录,是可以保存
阅读全文
摘要:作为一个程序猿,使用了spring好多年,现在有了spring-boot,也想尝尝鲜。 初听spring-boot,觉得很神秘,实际上就是集合了很多组件,再加上一些boot开发的启动和粘合程序。 个人见解,不一定对。 构建过程 使用 Spring Initializr ,我使用idea构建的,在新项
阅读全文
摘要:自媒体的版权问题找谁解决? 今天我在使用百度时,发现一个牛X的网站:http://www.jxgolden.com/。 这个网站打开竟然是CSDN的内容。吓死我了。 原本我使用百度搜索:使用 jQuery jsPDF 插件生成pdf文档并解决中文乱码问题。结果竟然没有搜索到我的网站上。而跳转进网站,
阅读全文
摘要:1.InfoGlue infoglue是一个高级的、可扩展的、健壮的内容管理系统,完全用Java开发。重要的功能包括完全支持多语言,站点之间良好的重用,以及广泛的集成能力。 该项目主页:http://www.infoglue.org 2.Magnolia Magnolia是一个开源基于Java的We
阅读全文
摘要:HistoryServer服务可以让用户通过Spark UI界面,查看历史应用(已经执行完的应用)的执行细节,比如job信息、stage信息、task信息等,该功能是基于spark eventlogs日志文件的,所以必须打开eventlogs日志开关,关于日志开关的打开和HistoryServer服
阅读全文
摘要:大概在3年以前,我就开通了个人微信公众号:业余草(yyucao),只不过没怎么运营。直到最近微信公众号的收益还不错,我就开始摸索运营,如何快速涨粉。这种涨粉不是靠刷,而是靠实际的阅读分享进行的涨粉。 之前的微信公众号帐号的粉丝一直没有大的提升,最近一周开始逐步加强了运营的动作,粉丝从每天10个之内飙
阅读全文

浙公网安备 33010602011771号