Storm的DRPC
RPC:Remote Procedure Call
DRPC:Distributed RPC
Hadoop提供了RPC的实现机制,实现方法见:《》,本文主要介绍Storm的DRPC。
1、Storm DRPC工作流程
Storm的DRPC由DRPC Server和一个特殊的topology组成。DRPC Server主要起协调客户端和topology的作用,其接收客户端的请求,并将请求发送给topology,然后将topology的处理结果返回给客户端。
下面是官网给出的流程图:

1)客户端向DRPC Server发送请求,发送了想要执行的方法及其参数。
2)DRPC topology提供了一个特殊的spout DRPCSpout,DRPC Server将客户端的请求信息(函数、参数)发送给DRPCSpout,客户端请求进入了topology的处理。
3)DRPC topology的一系列bolt开始处理请求,最后一个bolt是ReturnResult,它负责将处理结果发送给DRPC Server。
4)DRPC Server将结果发送给客户端。
上面的流程也可以具体化为:

其中蓝色的bolt是需要用户自己定义的。
2、DRPC Server
(1)、编辑$STORM_HOME/conf/storm.yaml,配置drpc.servers,Storm会在配置的这些机器上启动DRPC Server
|
1
2
3
|
drpc.servers: - "vm1" - "vm2" |
注意:drpc.servers:前面不能有空格(yaml文件格式)
(2)、在上面配置的那些机器上运行DRPC Server
|
1
|
storm drpc |
3、DRPC topology
1)用户需要定义自己的bolt来执行自己的业务逻辑,如下面的MyBolt.java简单的将输入字符串转换成大写:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
|
package com.test.storm.bolt;import backtype.storm.topology.BasicOutputCollector;import backtype.storm.topology.OutputFieldsDeclarer;import backtype.storm.topology.base.BaseBasicBolt;import backtype.storm.tuple.Fields;import backtype.storm.tuple.Tuple;import backtype.storm.tuple.Values;public class MyBolt extends BaseBasicBolt{ private static final long serialVersionUID = 1L; @Override public void execute(Tuple input, BasicOutputCollector collector) { try { //input里有两个字段:{request:6170525749586968710,args:hello} //request字段是Long类型, args是String类型 Long id = input.getLong(0); System.out.println("request id: " + id); String args = input.getString(1); System.out.println("args: " + args); String result = args.toUpperCase(); //如果这个bolt是最有一个用户的bolt,则必须是两个字段id、result //如果是中间bolt,则第一个字段必须是id //第一个字段是request的id,第二个字段是处理后的结果 collector.emit(new Values(id, result)); } catch (Exception e) { e.printStackTrace(); } } @Override public void declareOutputFields(OutputFieldsDeclarer declarer) { //如果这个bolt是最有一个用户的bolt,则必须是两个字段,建议是id、result(经测试,字段名字可以随意) //如果是中间bolt,则第一个字段必须是id //后面的内置bolt会根据字段位置获取值,0、1 declarer.declare(new Fields("id", "result")); }} |
代码中需要注意的地方和解释。
2)构建topology
Storm提供了LinearDRPCTopologyBuilder类来创建这个特殊的topology,它的作用有:
a、创建DRPCSpout
b、创建ReturnResult,返回topology的处理结果
c、提供有限的聚合操作
|
1
2
3
|
LinearDRPCTopologyBuilder builder = new LinearDRPCTopologyBuilder(FUNC_NAME);builder.addBolt(new MyBolt());StormTopology drpcTopology = builder.createLocalTopology(drpcServer); |
4、运行模式
1)本地模式
本地模式会在一个进程中模式DRPC Server,不需要绑定到端口,必须使用LocalDRPC对象才能调用方法,本地模式仅供测试用。
LocalDRPCTest.java:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
|
package com.test.storm.drpc;import backtype.storm.Config;import backtype.storm.LocalCluster;import backtype.storm.LocalDRPC;import backtype.storm.drpc.LinearDRPCTopologyBuilder;import backtype.storm.generated.StormTopology;import com.test.storm.bolt.MyBolt;public class LocalDRPCTest { private static final String FUNC_NAME = "upper"; public static void main(String[] args) { LocalDRPC drpcServer = new LocalDRPC(); LinearDRPCTopologyBuilder builder = new LinearDRPCTopologyBuilder(FUNC_NAME); builder.addBolt(new MyBolt()); StormTopology drpcTopology = builder.createLocalTopology(drpcServer); LocalCluster cluster = new LocalCluster(); Config config = new Config(); config.setDebug(true); cluster.submitTopology("drpcupper", config, drpcTopology); String result = drpcServer.execute(FUNC_NAME, "hello"); System.out.println("result: " + result); drpcServer.shutdown(); cluster.shutdown(); }} |
2)远程模式
RemoteDRPCTest.java如下:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
package com.test.storm.drpc;import backtype.storm.Config;import backtype.storm.StormSubmitter;import backtype.storm.drpc.LinearDRPCTopologyBuilder;import com.test.storm.bolt.MyBolt;public class RemoteDRPCTest { private static final String FUNC_NAME = "upper"; public static void main(String[] args) throws Exception { LinearDRPCTopologyBuilder builder = new LinearDRPCTopologyBuilder(FUNC_NAME); builder.addBolt(new MyBolt()); StormSubmitter.submitTopology("drpcupper", new Config(), builder.createRemoteTopology()); }} |
在真实的Storm集群上运行,需要如下三个步骤:
(1)如上面(2、DRPC Server)说明的那样配置并运行DRPC Server
(2)提交DRPC topology到Storm集群上
|
1
|
storm jar drpc.jar com.test.storm.drpc.RemoteDRPCTest |
(3)客户端调用程序
DRPCClientTest:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
|
package com.test.storm.drpc;import backtype.storm.utils.DRPCClient;public class DRPCClientTest { public static void main(String[] args) throws Exception { DRPCClient client = new DRPCClient("vm1", 3772); String result = client.execute("upper", "hellmmo"); System.out.println(result); }} |
5、补充
一次可以部署多个DRPC:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
|
package com.test.storm.drpc;import backtype.storm.Config;import backtype.storm.LocalCluster;import backtype.storm.LocalDRPC;import backtype.storm.drpc.LinearDRPCTopologyBuilder;import backtype.storm.generated.StormTopology;import com.test.storm.bolt.MyBolt;public class LocalDRPCMutipleTest { public static void main(String[] args) { LocalDRPC drpcServer = new LocalDRPC(); LinearDRPCTopologyBuilder builder = new LinearDRPCTopologyBuilder("upper"); builder.addBolt(new MyBolt()); StormTopology drpcTopology = builder.createLocalTopology(drpcServer); LinearDRPCTopologyBuilder builder2 = new LinearDRPCTopologyBuilder("upper2"); builder2.addBolt(new MyBolt()); StormTopology drpcTopology2 = builder2.createLocalTopology(drpcServer); LocalCluster cluster = new LocalCluster(); Config config = new Config(); config.setDebug(true); cluster.submitTopology("drpcupper", config, drpcTopology); cluster.submitTopology("drpcupper2", config, drpcTopology2); String result = drpcServer.execute("upper", "hello"); System.out.println("result1: " + result); String result2 = drpcServer.execute("upper2", "hello"); System.out.println("result2: " + result); drpcServer.shutdown(); cluster.shutdown(); }} |
浙公网安备 33010602011771号