摘要: 本文将介绍在springboot中整合solr。 1、前提约束 完成solr中的分词、停词以及扩展词库配置 https://www.jianshu.com/p/0e6f4f4a6505 2、操作步骤 创建一个springboot项目 https://www.jianshu.com/p/de979f5 阅读全文
posted @ 2020-03-26 20:49 张力的程序园 阅读(200) 评论(0) 推荐(0)
摘要: 本文将演示通过java代码完成solr数据的新增、修改与删除。 1、版本约束 CentOS7 工作站 solr 4.10.3 putty apache tomcat 8.5.38 2、前提约束 使用java完成solr的增删改 https://www.jianshu.com/p/eb5fa48077 阅读全文
posted @ 2020-03-26 20:48 张力的程序园 阅读(413) 评论(0) 推荐(0)
摘要: solr是一个企业级搜索应用服务器,以lucence为基础。本文将讲解如何在centos7中安装solr。 1、版本约束 CentOS7 工作站 solr 4.10.3 链接:https://pan.baidu.com/s/1094ttIAo e6zhAfB1DndCg 提取码:zhhg putty 阅读全文
posted @ 2020-03-26 20:46 张力的程序园 阅读(401) 评论(0) 推荐(0)
摘要: 本文将阐述如何把redis与spring集成。 1、前提约束 可以使用java调用redis服务 https://www.jianshu.com/p/83ef8a80508d 2、修改pom.xml 在pom.xml中加入以下依赖: 3、加入接口JeditClient.java 4、完成接口的实现 阅读全文
posted @ 2020-03-26 20:20 张力的程序园 阅读(130) 评论(0) 推荐(0)
摘要: redis是最常见的高速缓存。本文将演示redis的命令行操作。 1、前提约束 已经安装好redis并启动,可以是单机也可以是集群 https://www.jianshu.com/p/cd2592116139 2、操作 redis共有5中数据类型,分别是string, list, hash, set 阅读全文
posted @ 2020-03-26 20:19 张力的程序园 阅读(163) 评论(0) 推荐(0)
摘要: 本文将阐述如何把activemq与spring集成。 1、前提约束 可以使用java完成activemq的topic模式 https://www.jianshu.com/p/d3993d12f3f7 2、修改pom.xml 在pom.xml中加入以下依赖: 3、创建一个消费者的消息监听 4、创建一个 阅读全文
posted @ 2020-03-26 20:17 张力的程序园 阅读(110) 评论(0) 推荐(0)
摘要: activemq是常用的消息队列技术。本文将阐述在CentOS7当中安装activemq。 1、版本约束 CentOS7 工作站 apache activemq 5.12.0 链接:https://pan.baidu.com/s/1H5TNVjP4qJ4jBqcOthTg_Q 提取码:6nv7 xs 阅读全文
posted @ 2020-03-26 20:16 张力的程序园 阅读(133) 评论(0) 推荐(0)
摘要: oracle已经安装完毕,本文将阐述使用java代码访问oracle,我们使用jdbc接口。 1 前提约束 oracle已经安装完毕,scott用户也已经解锁【作者使用的是oracle11g】 已安装jdk,并配置环境变量 熟练使用idea 2 操作 1 使用idea创建一个普通项目 https:/ 阅读全文
posted @ 2020-03-26 20:15 张力的程序园 阅读(596) 评论(0) 推荐(0)
摘要: oracle是最常用的企业级数据库。本文将讲述在win10当中安装oracle10g。 1、前提约束 win10 64 oracle 10g 2、软件下载 百度网盘 链接:https://pan.baidu.com/s/1u3Qjguim 7Z 4GoHDF8Pxg 提取码:gwig 3、操作 以管 阅读全文
posted @ 2020-03-26 20:14 张力的程序园 阅读(1704) 评论(0) 推荐(0)
摘要: 上一节我们了解了在建表时如何创建约束,本文将阐述如何在建表之后添加约束。 1 系统、环境和前提约束 win10 64 熟悉表的约束 https://www.jianshu.com/p/27e79d378062 作者的oracle账号密码分别为 scott/tiger,请读者根据实际情况设置。 2 操 阅读全文
posted @ 2020-03-26 20:13 张力的程序园 阅读(306) 评论(0) 推荐(0)
摘要: 我们通过前面几篇文章熟悉了表的创建修改删除、表的数据的新增修改删除,本文将着重阐述如何进行表中数据的查询。 1 系统、环境和前提约束 win10 64 oracle 11g https://www.jianshu.com/p/1609289f4c5f 2 操作 以系统管理员启动cmd命令行 执行以下 阅读全文
posted @ 2020-03-26 20:12 张力的程序园 阅读(148) 评论(0) 推荐(0)
摘要: oracle当中有默认的sys,system,scott等账户,我们也可以创建一个新的账户。本文将阐述在oracle当中创建一个新账户。 1 前提约束 已安装oracle ,作者安装的事11g 2 操作 以系统管理员启动cmd命令行 执行以下命令 以上,就是oracle当中的简单用户管理。 阅读全文
posted @ 2020-03-26 20:11 张力的程序园 阅读(133) 评论(0) 推荐(0)
摘要: 在学习了存储过程和存储函数以后,本文将阐述通过jdbc访问访问oracle的存储过程和存储函数。 1 前提约束 oracle已经安装完毕,scott用户也已经解锁【作者使用的是oracle11g】 已安装jdk,并配置环境变量 熟练使用idea 熟练使用sqldeveloper 熟悉存储过程和函数 阅读全文
posted @ 2020-03-26 20:10 张力的程序园 阅读(204) 评论(0) 推荐(0)
摘要: oracle当中序列是一组连续且不重复的值,一般用于主键的自增。 触发器是一个特殊的程序,当触发某个事件时会自动执行,用户不能直接调用,主要用于对数据库的特定操作或系统事件进行监听并响应。 1、系统、软件和约束条件 win10 oracle11g sql developer 2、序列操作 执行以下操 阅读全文
posted @ 2020-03-26 20:09 张力的程序园 阅读(245) 评论(0) 推荐(0)
摘要: pl/sql procedural language 过程化语言,是Oracle在标准的SQL基础之上的扩展,可以定义变量、使用逻辑控制语句。默认Oracle一次只能处理一条语句,如果使用PL/SQL,可以使用块组织多条语句,作为一个整体执行,只向数据库服务器发送一次请求调用。块,是pl/sql最基 阅读全文
posted @ 2020-03-26 20:08 张力的程序园 阅读(485) 评论(0) 推荐(0)
摘要: 在安装了svn服务和svn客户端之后,我们需要熟悉一下客户端的使用。 1、系统和环境约束 win10 64 VisualSVN Server 3.9.0 x64 已安装 TortoiseSVN 1.10.0.28176 x64 svn 1.10.0 已安装 2、操作 2.1 上传一个项目 1 创建一 阅读全文
posted @ 2020-03-26 20:06 张力的程序园 阅读(175) 评论(0) 推荐(0)
摘要: svn常用作版本管理,需要安装一个服务。本文将介绍如何在win10中安装svn server,以便为我们后面熟悉svn的客户端操作提供前提。 1 系统和软件约束 win10 64 VisualSVN Server 3.9.0 x64 链接:https://pan.baidu.com/s/14MOOz 阅读全文
posted @ 2020-03-26 20:05 张力的程序园 阅读(116) 评论(0) 推荐(0)
摘要: 通过上一篇文章,我们了解了如何在idea中与github进行交互。本文将阐述如何在eclipse中完成代码版本管理。 1 系统、软件和前提约束 注册github,熟练使用命令行 https://www.jianshu.com/p/b7998722c61f eclipse Oxygen.3 (4.7. 阅读全文
posted @ 2020-03-26 20:04 张力的程序园 阅读(171) 评论(0) 推荐(0)
摘要: git是Linus Torvalds为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。git与github是两个概念,github是git提交代码的一个仓库,通过git我们也可以提交代码到其他仓库,比如码云Gitee。本文将阐述如何安装git。 1 系统、环境和前提约束 win1 阅读全文
posted @ 2020-03-26 20:03 张力的程序园 阅读(169) 评论(0) 推荐(0)
摘要: 通过上面几篇文章,我们熟悉了单机情况下的HDFS操作和MapReduce计算,在实际使用中,为了提升性能和稳定性,大数据组件都会以集群的方式存在,本文将阐述如何搭建hadoop集群。 1 系统、软件和前提约束 CentOS 7 (1)三台CentOS都已经配置免密登录 https://www.jia 阅读全文
posted @ 2020-03-26 20:02 张力的程序园 阅读(133) 评论(0) 推荐(0)
摘要: 上一篇文章我们测试了hadoop自带的词频统计,本节将使用java完成自定义的词频统计。 1 系统、软件和前提约束 完成java访问HDFS服务 https://www.jianshu.com/p/386cd966c04f 测试了hadoop自定义的词频统计 https://www.jianshu. 阅读全文
posted @ 2020-03-26 20:01 张力的程序园 阅读(225) 评论(0) 推荐(0)
摘要: 在上面的例子中,我们通过java代码对hdfs进行了操作,操作结果我们可以用代码继续查看或者通过命令行获得,但不论哪一种都不够直观,eclipse提供了一种直接连接HDFS 并展示的插件。我们将展示如何使用此插件。 1 系统、软件以及前提约束 在CentOS7中安装hadoop https://ww 阅读全文
posted @ 2020-03-26 20:00 张力的程序园 阅读(278) 评论(0) 推荐(0)
摘要: 上一节课我们熟悉了HDFS的命令行操作,接下来我们将通过java代码访问HDFS服务。 1 系统、软件以及前提约束 hadoop已经安装完毕并且启动 https://www.jianshu.com/p/b7ae3b51e559 hadoop2.7.2.zip windows简化版 下载到相关jar包 阅读全文
posted @ 2020-03-26 19:59 张力的程序园 阅读(449) 评论(0) 推荐(0)
摘要: 在安装好Hadoop之后,我们来熟悉在命令行界面当中操作分布式文件存储组件HDFS。 HDFS是Hadoop大数据平台中的分布式文件系统,为上层应用或其他大数据组件提供数据存储,如Hive,Mapreduce,Spark,HBase等。 1 系统、软件以及前提约束 CentOS 7 64 为减少li 阅读全文
posted @ 2020-03-26 19:58 张力的程序园 阅读(206) 评论(0) 推荐(0)
摘要: 这一节我们将介绍Hive查询Hbase中数据的过程。 1、前提约束 已安装hadoop https://www.jianshu.com/p/b7ae3b51e559 假设笔者安装目录是 /root/hadoop 2.5.2 已安装hbase https://www.jianshu.com/p/90d 阅读全文
posted @ 2020-03-26 19:54 张力的程序园 阅读(641) 评论(0) 推荐(0)
摘要: 上一节我们在CentOS7中安装了Hive,本章将演示如何在Hive当中完成词频统计。 1 系统、软件以及前提约束 在CentOS7中安装Hive并启动 https://www.jianshu.com/p/755944f01fab 所有操作都以root用户进行 2 操作 1 在/root下创建一个e 阅读全文
posted @ 2020-03-26 19:53 张力的程序园 阅读(357) 评论(0) 推荐(0)
摘要: 上一节我们安装了hbase,本文将展示如何通过命令行对Hbase进行操作。 1 系统、软件以及前提约束 在CentOS7当中已经安装Hbase并启动 https://www.jianshu.com/p/90d1713d55ce xshell客户端 注意:作者的CentOS7的ip是192.168.1 阅读全文
posted @ 2020-03-26 19:52 张力的程序园 阅读(631) 评论(0) 推荐(0)
摘要: 我们已经了解了使用flume监听端口以及文件内容,本节将展示使用flume导入数据到hbase。 1 系统、软件以及前提约束 CentOS 7 64 工作站 作者的机子ip是192.168.100.200,请读者根据自己实际情况设置 已完成flume安装并监听端口数据,flume的服务名称为a1 h 阅读全文
posted @ 2020-03-26 19:51 张力的程序园 阅读(1006) 评论(0) 推荐(0)
摘要: flume是一个日志收集系统,本文件展示如何在CentOS7当中安装和部署flume服务。 1 系统、软件以及前提约束 CentOS 7 64 工作站 作者的机子ip是192.168.100.200,请读者根据自己实际情况设置 jdk1.8.0_162 已经安装完毕,并配置环境变量,作者的环境变量为 阅读全文
posted @ 2020-03-26 19:50 张力的程序园 阅读(298) 评论(0) 推荐(0)
摘要: kafka是大数据组件中的消息队列,俗语有云:系统卡不卡,全看kafka。kafka的使用能极大的提升的系统吞吐量。本文将阐述在CentOS7中安装kafka。 1 系统、软件以及前提约束 CentOS 7 64 工作站 作者的机子ip是192.168.100.200,请读者根据自己实际情况设置 j 阅读全文
posted @ 2020-03-26 19:49 张力的程序园 阅读(256) 评论(0) 推荐(0)
摘要: 前面我们已经完成了scala的第一个程序,本文将在其基础之上阐述scala的基本语法。 1 系统、软件以及前提约束 win10 64位 已在idea中完成scala的helloworld程序 https://www.jianshu.com/p/ec64c70e6bb6 2 操作 1 数据类型 pyt 阅读全文
posted @ 2020-03-26 19:48 张力的程序园 阅读(167) 评论(0) 推荐(0)
摘要: 前面我们了解了类和对象,本节我们将了解scala当中的抽象类、扩展类以及特质【相当于java中的接口】。 1 系统、软件以及前提约束 win10 64位 已了解scala中的类与对象,并进行code https://www.jianshu.com/p/92f555f859c2 idea2018.1 阅读全文
posted @ 2020-03-26 19:47 张力的程序园 阅读(165) 评论(0) 推荐(0)
摘要: 前面我们已经完成了scala的第一个程序,本文将在其基础之上阐述scala的基本语法。 1 系统、软件以及前提约束 win10 64位 已在idea中完成scala的helloworld程序 https://www.jianshu.com/p/ec64c70e6bb6 2 操作 1 数据类型 sca 阅读全文
posted @ 2020-03-26 19:46 张力的程序园 阅读(274) 评论(0) 推荐(0)
摘要: 常用的分类器有逻辑斯蒂回归分类器和决策树分类器,本文将阐述在scala中使用逻辑斯蒂回归完成判断是否有某字段。 1 系统、软件以及前提约束 CentOS 7 64 工作站 作者的机子ip是192.168.100.200,主机名为danji,请读者根据自己实际情况设置 已完成spark访问hive h 阅读全文
posted @ 2020-03-26 19:45 张力的程序园 阅读(164) 评论(0) 推荐(0)
摘要: 前面我们使用Spark Streaming去监听了端口数据,接下来我们将使用Spark Streaming作为kafka的消费者。 1 系统、软件以及前提约束 CentOS 7 64 工作站 作者的机子ip是192.168.100.200,主机名为danji,请读者根据自己实际情况设置 已完成spa 阅读全文
posted @ 2020-03-26 19:44 张力的程序园 阅读(204) 评论(0) 推荐(0)
摘要: 前面我们了解了RDD编程,RDD优点极多,但是不包含schema信息,即列的信息,只能通过反复的迭代处理获取期待的数据,本文将阐述DataFrame的用法,所谓DataFrame就是包含schema信息的RDD。 RDD【弹性分布式数据集】是spark的核心,它是只读的,基于内存的,RDD结合算子会 阅读全文
posted @ 2020-03-26 19:43 张力的程序园 阅读(223) 评论(0) 推荐(0)
摘要: 前面我们熟悉了通过spark访问mysql,这一节我们将了解通过spark通过hive 1 系统、软件以及前提约束 CentOS 7 64 工作站 作者的机子ip是192.168.100.200,主机名为danji,请读者根据自己实际情况设置 已完成spark访问mysql https://www. 阅读全文
posted @ 2020-03-26 19:42 张力的程序园 阅读(311) 评论(0) 推荐(0)
摘要: 我们已经了解了在spark命令行当中使用交互方式完成词频统计,本节将阐述在idea当中使用sbt环境完成scala代码,并进行词频统计。 1 系统、软件以及前提约束 CentOS 7 64 工作站 作者的机子ip是192.168.100.200,主机名为danji,请读者根据自己实际情况设置 已在l 阅读全文
posted @ 2020-03-26 19:41 张力的程序园 阅读(568) 评论(0) 推荐(0)
摘要: 本节将展示如何在spark中通过python进行词频统计。 1 系统、软件以及前提约束 CentOS 7 64 工作站 作者的机子ip是192.168.100.200,主机名为danji,请读者根据自己实际情况设置 已完成scala方式的词频统计 https://www.jianshu.com/p/ 阅读全文
posted @ 2020-03-26 19:40 张力的程序园 阅读(1019) 评论(0) 推荐(0)
摘要: spark是新一代的大数据组件,包括sparkcore, sparksql,sparkstreaming,mllib,graphx等,在实际生产中作用极大,与HDFS, Hbase, hive等都可以交互。本文将阐述如何在CentOS7中安装spark。 1 系统、软件以及前提约束 CentOS 7 阅读全文
posted @ 2020-03-26 19:38 张力的程序园 阅读(366) 评论(0) 推荐(0)
摘要: 数据分两类,一类是静态处理,多做批量处理,属于OLAP,一类是流式数据,多做实时处理,属于OLTP。Spark Streaming属于微批处理,并非真正意义上的实时处理。本节将介绍一个真正意义上的流处理框架Storm,本文将阐述Storm的安装。 1 系统、软件以及前提约束 CentOS 7 64 阅读全文
posted @ 2020-03-26 19:37 张力的程序园 阅读(228) 评论(0) 推荐(0)
摘要: 数据分两类,一类是静态处理,多做批量处理,属于OLAP,一类是流式数据,多做实时处理,属于OLTP。Spark Streaming属于微批处理,并非真正意义上的实时处理。本节将介绍一个顶级的流处理框架Flink。 1 系统、软件以及前提约束 CentOS 7 64 工作站 作者的机子ip是192.1 阅读全文
posted @ 2020-03-26 19:36 张力的程序园 阅读(1494) 评论(0) 推荐(0)
摘要: 在大数据组件之间进行数据的迁移是必不可少的,本文将阐述数据迁移的重要工具之一sqoop。 1 系统、软件以及前提约束 CentOS 7 64 工作站 作者的机子ip是192.168.100.200,请读者根据自己实际情况设置 sqoop 1.4.7.bin__hadoop 2.6.0 下载链接:ht 阅读全文
posted @ 2020-03-26 19:26 张力的程序园 阅读(174) 评论(0) 推荐(0)