• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






傻傻小菜鸟

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

2017年8月31日

scala使用FunSpec进行单元测试报错
摘要: 遇到比较奇怪的问题,mvn项目中的main函数可以正常运行,但是test阶段出错,报错信息如下: test代码如下: 解决方法: 将 scala-library.jar 的路径加入到 CLASSPATH 中(参考:https://stackoverflow.com/questions/7781547 阅读全文
posted @ 2017-08-31 19:10 傻傻小菜鸟 阅读(697) 评论(0) 推荐(0)
 

2017年6月23日

用nohup执行python程序时,print无法输出
摘要: nohup Python test.py > nohup.out 2>&1 & 发现nohup.out中显示不出来python程序中print的东西。 这是因为python的输出有缓冲,导致nohup.out并不能够马上看到输出。 python 有个-u参数,使得python不启用缓冲。 nohup 阅读全文
posted @ 2017-06-23 11:56 傻傻小菜鸟 阅读(2642) 评论(0) 推荐(2)
 
thrift的使用及遇到的问题
摘要: centos 系统安装官方文档:http://thrift.apache.org/docs/install/centos 一、按该文档安装出现了一系列的问题,记录如下: 1.安装thrift时./bootstrap.sh出错,然后安装libevent问题解决 (首先:git gc,清除./confi 阅读全文
posted @ 2017-06-23 11:29 傻傻小菜鸟 阅读(5398) 评论(2) 推荐(0)
 

2017年5月10日

随机森林学习笔记
摘要: 1.分类回归树CART 随机森林是由多颗CART树组成的 1、下面简单叙述下CART树及生成树的原理。 CART(Classification and regression tree)是决策树的一种,主要由特征选择,树的生成和剪枝三部分组成。它主要用来处理分类和回归问题。 (1)、回归树:使用平方误 阅读全文
posted @ 2017-05-10 10:39 傻傻小菜鸟 阅读(750) 评论(0) 推荐(0)
 

2017年5月5日

编写自己的UDTF
摘要: 1. UDTF介绍 UDTF(User-Defined Table-Generating Functions) 用来解决 输入一行输出多行(On-to-many maping) 的需求。 2. 编写自己需要的UDTF 继承org.apache.hadoop.hive.ql.udf.generic.G 阅读全文
posted @ 2017-05-05 18:47 傻傻小菜鸟 阅读(737) 评论(0) 推荐(0)
 
maven中把依赖的JAR包一起打包
摘要: 这里所用到的MAVEN-PLUGIN是MAVNE-ASSEMBLY-PLUGIN 官方网站是:http://maven.apache.org/plugins/maven-assembly-plugin/usage.html 1. 添加此PLUGIN到项目的POM.XML中 如果出现CLASS重名的情 阅读全文
posted @ 2017-05-05 18:41 傻傻小菜鸟 阅读(801) 评论(0) 推荐(0)
 

2017年4月17日

xgboost的SparkWithDataFrame版本实现
摘要: 再xgboost的源码中有xgboost的SparkWithDataFrame的实现,如下:https://github.com/dmlc/xgboost/tree/master/jvm-packages。但是由于各种各样的原因吧,这些代码在我的IDE里面编译不过,因此又写了如下代码以供以后查阅使用 阅读全文
posted @ 2017-04-17 16:48 傻傻小菜鸟 阅读(3624) 评论(0) 推荐(0)
 

2016年2月3日

shell脚本ssh自动登陆服务器
摘要: #!/bin/shsshpass -p "your password" ssh user@ip 注意: 需要先安装sshpass: 源码下载地址:http://sourceforge.net/projects/sshpass/ tar -zxvf sshpass-1.05.tar.gz cd ssh 阅读全文
posted @ 2016-02-03 18:22 傻傻小菜鸟 阅读(243) 评论(0) 推荐(0)
 

2015年8月8日

org.dom4j.DocumentException unknown protocol h
摘要: 待解析文件的路径中有空格,把空格去掉就好了 阅读全文
posted @ 2015-08-08 15:56 傻傻小菜鸟 阅读(421) 评论(0) 推荐(0)
 

2015年7月29日

如何计算两个文档的相似度
摘要: 一、TF-IDF、余弦相似度、向量空间模型(1)使用TF-IDF算法,找出两篇文章的关键词;(2)每篇文章各取出若干个关键词(比如20个),合并成一个集合,计算每篇文章对于这个集合中的词的词频(为了避免文章长度的差异,可以使用相对词频);(3)生成两篇文章各自的词频向量;(4)计算两个向量的余弦相似... 阅读全文
posted @ 2015-07-29 18:00 傻傻小菜鸟 阅读(1443) 评论(0) 推荐(0)
 
下一页