导航

Java调用R语言

Posted on 2018-02-27 09:55  水木山川  阅读(8927)  评论(0编辑  收藏  举报

R是统计计算的强大工具,JAVA是做应用系统的主流语言。JAVA负责系统的构建,R用来做运算引擎,从而实现应用型和分析性相结合的系统。

  一、Rserve(远程通信模式)
  Rserve是一个基于TCP/IP的服务器,通过二进制协议传输数据,可以提供远程连接,使得客户端语言能够调用R。
  Rserve作为一个package发布在CRAN上,可以直接使用install.packages("Rserve")进行安装。需要使用时在R控制台下加载该包,然后输入命令Rserve(),开启服务器就可以供客户端调用。首先建立一个新的连接,然后就可以使用eval之类的方法将R中的表达式传到服务器端,通过R求值后传回JAVA中REXP类型的变量,然后打印出来,整个过程非常简单。由于不需要对R进行初始化,因此速度会比较快。在其他系统下可以同时建立多个连接,但是在Windows下只允许同时打开一个连接,后续的连接都会共有相同的命名空间。
  1、Rserve安装和启动(windows环境)
  方法一:前提:安装并配置了R语言
    第一次启动安装Rserve包:
    install.packages("Rserve")

    第一次启动加载Rserve包:
    library(Rserve)

    启动Rserve服务:
    Rserve()

    关闭Rconnection连接:
    关闭Rconnection连接用rc.close();

  方法二:点击R工具栏上的“程序包”--》“设定CRAN镜像”--》China(xxx) —》确定
    点击【程序包】—》安装程序包—》选择 rJava —>OK
    点击【程序包】—》安装程序包—》选择 Rserve —>OK

    点击【程序包】—》加载程序包—》选择 rJava —>OK
    点击【程序包】—》加载程序包—》选择 Rserve —>OK

    安装命令:install.packages("packageName")
    加载命令:library(packageName)

    启动命令:Rserve()

  2.Java调用R
    基本方法:
    Rconnection:连接R服务
    eval():执行R语句
    assgin():声明变量
    REXP:
        asInteger(), asIntegers(), asString(), asDouble(), asDoubles(), asList()获取相应类型的数据

    引用R架包或者添加maven配置:

<!--REngine Java Interface to R -->
<dependency>
    <groupId>org.rosuda.REngine</groupId>
    <artifactId>REngine</artifactId>
    <version>2.1.0</version>
</dependency>
<dependency>
    <groupId>org.rosuda.REngine</groupId>
    <artifactId>Rserve</artifactId>
    <version>1.8.1</version>
</dependency> 

    实例1:求一个数组里面的最大值

//建立连接
RConnection rc=new RConnection();
//构建数据
int[] datas={314,451,56,24,631};
//声明变量,相当于在R命令行中输入data<-datas命令
rc.assign("data",datas);
//执行R语句,相当于在R命令行中输max(data)命令
REXP rexp=rc.eval("max(data)");
//REXP. asXxx()返回相应类型的数据,如果结果类型不符会出错
System.out.println(rexp.asInteger());
rc.close();

    实例2:调用自定义函数

      创建R文件test.R
        myFunc<-function(data){
          x<-data+2;
        }

RConnection rc = new RConnection();
// test.R的路径
String fileName = "D:\\test.R";
rc.assign("fileName", fileName);
//执行test.R脚本,执行这一步才能调用里面的自定义函数myFunc,如果不行,就在R工具上也执行一下test.R脚本
rc.eval("source(fileName)");
String num = "3";
//调用myFunc函数
REXP rexp=rc.eval("myFunc("+num+")");
//返回类型是一个整数类型,所以用asInteger
System.out.println(rexp.asInteger());
rc.close();

    在R-x.x.x\library\Rserve\client\java\Rserve\test目录下有测试用例可以参考。(StartRserve.java是用java启动Rserve服务,而不用打开R语言来手动启动。test.java里包含了基本方法的调试)


   二、JRI(嵌入式模式)
      JRI,全名是Java/R Interface,是通过调用R的动态链接库从而利用R中的函数等。通过install.packages("rJava")安装rJava就行,在安装文件夹中,可以看到一个jri的子文件夹,里面有自带的例子可以用来测试。
      配置环境变量:在PATH中添加%R_HOME%/bin和%R_HOME%/library/rJava/jri,注意R_HOME的路径要正确。
      安装rJava
      install.packages("rJava")
      设置环境变量: PATH后添加 %R_HOME%\library\rJava\jri
      获取jar包:把安装目录jri文件夹下的JRI.jar、REngine.jar和JRIEngine.jar放进Java工程添加到工程中。

    两种方式优缺点比较:
    JRI(嵌入式模式)我体会到最大的优点是它对中文的支持较好,但是使用JRI模式下很容易造成整个系统的崩溃,比如在java调用R的时候,中间出现了异常或者错误,这些错误大致都是致命的,导致java虚拟机崩溃,从而导致整个系统崩溃
    Rserve(远程通信模式) 在这种通信模式下,最大的优点是javaWeb项目不需要去维护R的运行,通过TCP/IP协议直接进行通讯,但是有一个很大的缺点是它对中文的支持很弱,尤其是在windows的环境中。基本是不支持中文的,在linux环境下,似乎对中文的支持稍微好些。不是完全支持中文的话,对返回有中文或者输入有中文的系统将是不可用的。