上一页 1 2 3 4 5 6 7 ··· 15 下一页
摘要: package com.mengyao.system.filter; import java.io.IOException; import javax.servlet.FilterChain; import javax.servlet.ServletException; import javax.servlet.http.HttpServletRequest; impor... 阅读全文
posted @ 2017-01-17 21:22 孟尧 阅读(7025) 评论(3) 推荐(0)
摘要: 使用事物TridentTopology 持久化数据到MySQL 1、构建拓扑JDBCTopology类 package storm.trident.mysql; import java.util.Arrays; import java.util.Map; import org.apache.storm.Config; import org.apache.storm.LocalCluster... 阅读全文
posted @ 2016-11-23 16:46 孟尧 阅读(942) 评论(0) 推荐(1)
摘要: Storm-1.0.1+ZooKeeper-3.4.8+Netty-4.1.3 HA集群安装 下载Storm-1.0.1 http://mirrors.tuna.tsinghua.edu.cn/apache/storm/apache-storm-1.0.1/apache-storm-1.0.1.tar.gz 下载Z... 阅读全文
posted @ 2016-07-21 17:23 孟尧 阅读(1125) 评论(0) 推荐(0)
摘要: 通常在web应用程序需要上线或测试时通常需要部署到类似于tomcat、jboss、weblogic或webspare这些web服务器中,为避免手动部署带来的操作繁琐、易出错等问题,这里使用ant进行标准化部署,这里我的web服务器采用了Nginx+Tomcat集群,so,需要编写的ant脚本如下: 阅读全文
posted @ 2016-05-20 11:06 孟尧 阅读(1152) 评论(0) 推荐(0)
摘要: public static void main(String[] args) throws Exception { String queryForScanUsers_SQL = "select a.username AS user_name,b.* from tbl_aaa a left join tbl_bbb b where a.id=? limit 10"; ... 阅读全文
posted @ 2016-05-16 18:00 孟尧 阅读(465) 评论(0) 推荐(0)
摘要: 首先创建Spark的Maven工程,我这里使用的是Eclipse。 1、编写WordCountApp代码 2、打成jar包上传到集群中 3、使用spark/bin/spark-submit工具提交Spark应用到集群中(运行模式为yarn-cluster) 4、POM文件如下: SparkSessi 阅读全文
posted @ 2015-12-19 18:42 孟尧 阅读(3032) 评论(0) 推荐(0)
摘要: 通常在使用爬虫时,爬取到网上的文章都是各式各样的格式处理起来比较麻烦,这里我们使用Apache-Tika来处理Word格式的文章,如下:package com.mengyao.tika.app;import java.io.File;import java.io.FileInputStream;im... 阅读全文
posted @ 2015-11-18 19:58 孟尧 阅读(2818) 评论(0) 推荐(0)
摘要: 通常在使用爬虫时,爬取到网上的文章都是各式各样的格式处理起来比较麻烦,这里我们使用Apache-Tika来处理JPEG格式的图片,如下:package com.mengyao.tika.app;import java.io.File;import java.io.FileInputStream;im... 阅读全文
posted @ 2015-11-18 19:45 孟尧 阅读(1670) 评论(0) 推荐(0)
摘要: 通常在使用爬虫时,爬取到网上的文章都是各式各样的格式处理起来比较麻烦,这里我们使用Apache-Tika来处理HTML格式的文章,如下:package com.mengyao.tika.app;import java.io.File;import java.io.FileInputStream;im... 阅读全文
posted @ 2015-11-18 19:33 孟尧 阅读(2356) 评论(0) 推荐(0)
摘要: 通常在使用爬虫时,爬取到网上的文章都是各式各样的格式处理起来比较麻烦,这里我们使用Apache-Tika来处理XML格式的文章,如下:package com.mengyao.tika.app;import java.io.File;import java.io.FileInputStream;imp... 阅读全文
posted @ 2015-11-18 19:28 孟尧 阅读(724) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 ··· 15 下一页