孟尧 - 博客园

2017年1月17日

摘要： package com.mengyao.system.filter; import java.io.IOException; import javax.servlet.FilterChain; import javax.servlet.ServletException; import javax.servlet.http.HttpServletRequest; impor... 阅读全文

posted @ 2017-01-17 21:22 孟尧阅读(7034) 评论(3) 推荐(0)

2016年11月23日

Trident-MySQL

摘要：使用事物TridentTopology 持久化数据到MySQL 1、构建拓扑JDBCTopology类 package storm.trident.mysql; import java.util.Arrays; import java.util.Map; import org.apache.storm.Config; import org.apache.storm.LocalCluster... 阅读全文

posted @ 2016-11-23 16:46 孟尧阅读(946) 评论(0) 推荐(1)

2016年7月21日

Storm-1.0.1+ZooKeeper-3.4.8+Netty-4.1.3 HA集群安装

摘要： Storm-1.0.1+ZooKeeper-3.4.8+Netty-4.1.3 HA集群安装下载Storm-1.0.1 http://mirrors.tuna.tsinghua.edu.cn/apache/storm/apache-storm-1.0.1/apache-storm-1.0.1.tar.gz 下载Z... 阅读全文

posted @ 2016-07-21 17:23 孟尧阅读(1132) 评论(0) 推荐(0)

2016年5月20日

使用Ant自动化发布web工程

摘要：通常在web应用程序需要上线或测试时通常需要部署到类似于tomcat、jboss、weblogic或webspare这些web服务器中，为避免手动部署带来的操作繁琐、易出错等问题，这里使用ant进行标准化部署，这里我的web服务器采用了Nginx+Tomcat集群，so，需要编写的ant脚本如下：阅读全文

posted @ 2016-05-20 11:06 孟尧阅读(1158) 评论(0) 推荐(0)

2016年5月16日

分页过滤SQL求总条数SQL正则

摘要： public static void main(String[] args) throws Exception { String queryForScanUsers_SQL = "select a.username AS user_name,b.* from tbl_aaa a left join tbl_bbb b where a.id=? limit 10"; ... 阅读全文

posted @ 2016-05-16 18:00 孟尧阅读(471) 评论(0) 推荐(0)

2015年12月19日

Spark-Java版本WordCount示例

摘要：首先创建Spark的Maven工程，我这里使用的是Eclipse。 1、编写WordCountApp代码 2、打成jar包上传到集群中 3、使用spark/bin/spark-submit工具提交Spark应用到集群中（运行模式为yarn-cluster） 4、POM文件如下： SparkSessi 阅读全文

posted @ 2015-12-19 18:42 孟尧阅读(3042) 评论(0) 推荐(0)

2015年11月18日

Apache-Tika解析Word文档

摘要：通常在使用爬虫时，爬取到网上的文章都是各式各样的格式处理起来比较麻烦，这里我们使用Apache-Tika来处理Word格式的文章，如下：package com.mengyao.tika.app;import java.io.File;import java.io.FileInputStream;im... 阅读全文

posted @ 2015-11-18 19:58 孟尧阅读(2862) 评论(0) 推荐(0)

Apache-Tika解析JPEG文档

摘要：通常在使用爬虫时，爬取到网上的文章都是各式各样的格式处理起来比较麻烦，这里我们使用Apache-Tika来处理JPEG格式的图片，如下：package com.mengyao.tika.app;import java.io.File;import java.io.FileInputStream;im... 阅读全文

posted @ 2015-11-18 19:45 孟尧阅读(1710) 评论(0) 推荐(0)

Apache-Tika解析HTML文档

摘要：通常在使用爬虫时，爬取到网上的文章都是各式各样的格式处理起来比较麻烦，这里我们使用Apache-Tika来处理HTML格式的文章，如下：package com.mengyao.tika.app;import java.io.File;import java.io.FileInputStream;im... 阅读全文

posted @ 2015-11-18 19:33 孟尧阅读(2371) 评论(0) 推荐(0)

Apache-Tika解析XML文档

摘要：通常在使用爬虫时，爬取到网上的文章都是各式各样的格式处理起来比较麻烦，这里我们使用Apache-Tika来处理XML格式的文章，如下：package com.mengyao.tika.app;import java.io.File;import java.io.FileInputStream;imp... 阅读全文

posted @ 2015-11-18 19:28 孟尧阅读(734) 评论(0) 推荐(0)

孟尧

前途宽广，贵在坚持

公告