2020 年 3月 26 日随笔档案 - 张力的程序园

2020年3月26日

摘要：本文将介绍在springboot中整合solr。 1、前提约束完成solr中的分词、停词以及扩展词库配置 https://www.jianshu.com/p/0e6f4f4a6505 2、操作步骤创建一个springboot项目 https://www.jianshu.com/p/de979f5 阅读全文

posted @ 2020-03-26 20:49 张力的程序园阅读(200) 评论(0) 推荐(0)

05 java调用solr的api完成数据的查询

摘要：本文将演示通过java代码完成solr数据的新增、修改与删除。 1、版本约束 CentOS7 工作站 solr 4.10.3 putty apache tomcat 8.5.38 2、前提约束使用java完成solr的增删改 https://www.jianshu.com/p/eb5fa48077 阅读全文

posted @ 2020-03-26 20:48 张力的程序园阅读(413) 评论(0) 推荐(0)

01 CentOS7中安装和启动solr

摘要： solr是一个企业级搜索应用服务器，以lucence为基础。本文将讲解如何在centos7中安装solr。 1、版本约束 CentOS7 工作站 solr 4.10.3 链接：https://pan.baidu.com/s/1094ttIAo e6zhAfB1DndCg 提取码：zhhg putty 阅读全文

posted @ 2020-03-26 20:46 张力的程序园阅读(401) 评论(0) 推荐(0)

03 redis与spring的整合

摘要：本文将阐述如何把redis与spring集成。 1、前提约束可以使用java调用redis服务 https://www.jianshu.com/p/83ef8a80508d 2、修改pom.xml 在pom.xml中加入以下依赖： 3、加入接口JeditClient.java 4、完成接口的实现阅读全文

posted @ 2020-03-26 20:20 张力的程序园阅读(130) 评论(0) 推荐(0)

01 redis的命令行操作

摘要： redis是最常见的高速缓存。本文将演示redis的命令行操作。 1、前提约束已经安装好redis并启动，可以是单机也可以是集群 https://www.jianshu.com/p/cd2592116139 2、操作 redis共有5中数据类型，分别是string, list, hash, set 阅读全文

posted @ 2020-03-26 20:19 张力的程序园阅读(163) 评论(0) 推荐(0)

04 activemq与spring的整合

摘要：本文将阐述如何把activemq与spring集成。 1、前提约束可以使用java完成activemq的topic模式 https://www.jianshu.com/p/d3993d12f3f7 2、修改pom.xml 在pom.xml中加入以下依赖： 3、创建一个消费者的消息监听 4、创建一个阅读全文

posted @ 2020-03-26 20:17 张力的程序园阅读(110) 评论(0) 推荐(0)

01 安装activemq

摘要： activemq是常用的消息队列技术。本文将阐述在CentOS7当中安装activemq。 1、版本约束 CentOS7 工作站 apache activemq 5.12.0 链接：https://pan.baidu.com/s/1H5TNVjP4qJ4jBqcOthTg_Q 提取码：6nv7 xs 阅读全文

posted @ 2020-03-26 20:16 张力的程序园阅读(133) 评论(0) 推荐(0)

04 java通过jdbc查询oracle中的emp表

摘要： oracle已经安装完毕，本文将阐述使用java代码访问oracle，我们使用jdbc接口。 1 前提约束 oracle已经安装完毕，scott用户也已经解锁【作者使用的是oracle11g】已安装jdk，并配置环境变量熟练使用idea 2 操作 1 使用idea创建一个普通项目 https:/ 阅读全文

posted @ 2020-03-26 20:15 张力的程序园阅读(596) 评论(0) 推荐(0)

01 在windows10中安装oracle10g

摘要： oracle是最常用的企业级数据库。本文将讲述在win10当中安装oracle10g。 1、前提约束 win10 64 oracle 10g 2、软件下载百度网盘链接：https://pan.baidu.com/s/1u3Qjguim 7Z 4GoHDF8Pxg 提取码：gwig 3、操作以管阅读全文

posted @ 2020-03-26 20:14 张力的程序园阅读(1704) 评论(0) 推荐(0)

07 表的约束-建表之后再添加

摘要：上一节我们了解了在建表时如何创建约束，本文将阐述如何在建表之后添加约束。 1 系统、环境和前提约束 win10 64 熟悉表的约束 https://www.jianshu.com/p/27e79d378062 作者的oracle账号密码分别为 scott/tiger，请读者根据实际情况设置。 2 操阅读全文

posted @ 2020-03-26 20:13 张力的程序园阅读(306) 评论(0) 推荐(0)

04 表的数据的查询

摘要：我们通过前面几篇文章熟悉了表的创建修改删除、表的数据的新增修改删除，本文将着重阐述如何进行表中数据的查询。 1 系统、环境和前提约束 win10 64 oracle 11g https://www.jianshu.com/p/1609289f4c5f 2 操作以系统管理员启动cmd命令行执行以下阅读全文

posted @ 2020-03-26 20:12 张力的程序园阅读(148) 评论(0) 推荐(0)

01 用户管理

摘要： oracle当中有默认的sys，system，scott等账户，我们也可以创建一个新的账户。本文将阐述在oracle当中创建一个新账户。 1 前提约束已安装oracle ，作者安装的事11g 2 操作以系统管理员启动cmd命令行执行以下命令以上，就是oracle当中的简单用户管理。阅读全文

posted @ 2020-03-26 20:11 张力的程序园阅读(133) 评论(0) 推荐(0)

06 jdbc访问oracle存储过程和存储函数

摘要：在学习了存储过程和存储函数以后，本文将阐述通过jdbc访问访问oracle的存储过程和存储函数。 1 前提约束 oracle已经安装完毕，scott用户也已经解锁【作者使用的是oracle11g】已安装jdk，并配置环境变量熟练使用idea 熟练使用sqldeveloper 熟悉存储过程和函数阅读全文

posted @ 2020-03-26 20:10 张力的程序园阅读(204) 评论(0) 推荐(0)

04 序列和触发器

摘要： oracle当中序列是一组连续且不重复的值，一般用于主键的自增。触发器是一个特殊的程序，当触发某个事件时会自动执行，用户不能直接调用，主要用于对数据库的特定操作或系统事件进行监听并响应。 1、系统、软件和约束条件 win10 oracle11g sql developer 2、序列操作执行以下操阅读全文

posted @ 2020-03-26 20:09 张力的程序园阅读(245) 评论(0) 推荐(0)

01 pl/sql简介及代码块

摘要： pl/sql procedural language 过程化语言，是Oracle在标准的SQL基础之上的扩展，可以定义变量、使用逻辑控制语句。默认Oracle一次只能处理一条语句，如果使用PL/SQL，可以使用块组织多条语句，作为一个整体执行，只向数据库服务器发送一次请求调用。块，是pl/sql最基阅读全文

posted @ 2020-03-26 20:08 张力的程序园阅读(485) 评论(0) 推荐(0)

03 使用TortoiseSVN进行版本管理

摘要：在安装了svn服务和svn客户端之后，我们需要熟悉一下客户端的使用。 1、系统和环境约束 win10 64 VisualSVN Server 3.9.0 x64 已安装 TortoiseSVN 1.10.0.28176 x64 svn 1.10.0 已安装 2、操作 2.1 上传一个项目 1 创建一阅读全文

posted @ 2020-03-26 20:06 张力的程序园阅读(175) 评论(0) 推荐(0)

01 安装svn server

摘要： svn常用作版本管理，需要安装一个服务。本文将介绍如何在win10中安装svn server，以便为我们后面熟悉svn的客户端操作提供前提。 1 系统和软件约束 win10 64 VisualSVN Server 3.9.0 x64 链接：https://pan.baidu.com/s/14MOOz 阅读全文

posted @ 2020-03-26 20:05 张力的程序园阅读(116) 评论(0) 推荐(0)

05 eclipse中使用github

摘要：通过上一篇文章，我们了解了如何在idea中与github进行交互。本文将阐述如何在eclipse中完成代码版本管理。 1 系统、软件和前提约束注册github，熟练使用命令行 https://www.jianshu.com/p/b7998722c61f eclipse Oxygen.3 (4.7. 阅读全文

posted @ 2020-03-26 20:04 张力的程序园阅读(171) 评论(0) 推荐(0)

01 git的下载与安装

摘要： git是Linus Torvalds为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。git与github是两个概念，github是git提交代码的一个仓库，通过git我们也可以提交代码到其他仓库，比如码云Gitee。本文将阐述如何安装git。 1 系统、环境和前提约束 win1 阅读全文

posted @ 2020-03-26 20:03 张力的程序园阅读(169) 评论(0) 推荐(0)

07 安装hadoop集群

摘要：通过上面几篇文章，我们熟悉了单机情况下的HDFS操作和MapReduce计算，在实际使用中，为了提升性能和稳定性，大数据组件都会以集群的方式存在，本文将阐述如何搭建hadoop集群。 1 系统、软件和前提约束 CentOS 7 (1)三台CentOS都已经配置免密登录 https://www.jia 阅读全文

posted @ 2020-03-26 20:02 张力的程序园阅读(133) 评论(0) 推荐(0)

06 java完成自定义的词频统计

摘要：上一篇文章我们测试了hadoop自带的词频统计，本节将使用java完成自定义的词频统计。 1 系统、软件和前提约束完成java访问HDFS服务 https://www.jianshu.com/p/386cd966c04f 测试了hadoop自定义的词频统计 https://www.jianshu. 阅读全文

posted @ 2020-03-26 20:01 张力的程序园阅读(225) 评论(0) 推荐(0)

04 在eclipse中查看HDFS

摘要：在上面的例子中，我们通过java代码对hdfs进行了操作，操作结果我们可以用代码继续查看或者通过命令行获得，但不论哪一种都不够直观，eclipse提供了一种直接连接HDFS 并展示的插件。我们将展示如何使用此插件。 1 系统、软件以及前提约束在CentOS7中安装hadoop https://ww 阅读全文

posted @ 2020-03-26 20:00 张力的程序园阅读(278) 评论(0) 推荐(0)

03 java访问HDFS服务

摘要：上一节课我们熟悉了HDFS的命令行操作，接下来我们将通过java代码访问HDFS服务。 1 系统、软件以及前提约束 hadoop已经安装完毕并且启动 https://www.jianshu.com/p/b7ae3b51e559 hadoop2.7.2.zip windows简化版下载到相关jar包阅读全文

posted @ 2020-03-26 19:59 张力的程序园阅读(449) 评论(0) 推荐(0)

02 HDFS的命令行操作

摘要：在安装好Hadoop之后，我们来熟悉在命令行界面当中操作分布式文件存储组件HDFS。 HDFS是Hadoop大数据平台中的分布式文件系统，为上层应用或其他大数据组件提供数据存储，如Hive，Mapreduce，Spark，HBase等。 1 系统、软件以及前提约束 CentOS 7 64 为减少li 阅读全文

posted @ 2020-03-26 19:58 张力的程序园阅读(206) 评论(0) 推荐(0)

05 Hive查询Hbase中的数据

摘要：这一节我们将介绍Hive查询Hbase中数据的过程。 1、前提约束已安装hadoop https://www.jianshu.com/p/b7ae3b51e559 假设笔者安装目录是 /root/hadoop 2.5.2 已安装hbase https://www.jianshu.com/p/90d 阅读全文

posted @ 2020-03-26 19:54 张力的程序园阅读(641) 评论(0) 推荐(0)

02 在Hive中完成词频统计

摘要：上一节我们在CentOS7中安装了Hive，本章将演示如何在Hive当中完成词频统计。 1 系统、软件以及前提约束在CentOS7中安装Hive并启动 https://www.jianshu.com/p/755944f01fab 所有操作都以root用户进行 2 操作 1 在/root下创建一个e 阅读全文

posted @ 2020-03-26 19:53 张力的程序园阅读(357) 评论(0) 推荐(0)

02 Hbase的命令行操作

摘要：上一节我们安装了hbase，本文将展示如何通过命令行对Hbase进行操作。 1 系统、软件以及前提约束在CentOS7当中已经安装Hbase并启动 https://www.jianshu.com/p/90d1713d55ce xshell客户端注意：作者的CentOS7的ip是192.168.1 阅读全文

posted @ 2020-03-26 19:52 张力的程序园阅读(631) 评论(0) 推荐(0)

04 flume将数据导入到Hbase

摘要：我们已经了解了使用flume监听端口以及文件内容，本节将展示使用flume导入数据到hbase。 1 系统、软件以及前提约束 CentOS 7 64 工作站作者的机子ip是192.168.100.200，请读者根据自己实际情况设置已完成flume安装并监听端口数据，flume的服务名称为a1 h 阅读全文

posted @ 2020-03-26 19:51 张力的程序园阅读(1006) 评论(0) 推荐(0)

01 CentOS7中安装flume并监听端口状态

摘要： flume是一个日志收集系统，本文件展示如何在CentOS7当中安装和部署flume服务。 1 系统、软件以及前提约束 CentOS 7 64 工作站作者的机子ip是192.168.100.200，请读者根据自己实际情况设置 jdk1.8.0_162 已经安装完毕，并配置环境变量，作者的环境变量为阅读全文

posted @ 2020-03-26 19:50 张力的程序园阅读(298) 评论(0) 推荐(0)

01 CentOS7中安装kafka并测试生产者消费者

摘要： kafka是大数据组件中的消息队列，俗语有云：系统卡不卡，全看kafka。kafka的使用能极大的提升的系统吞吐量。本文将阐述在CentOS7中安装kafka。 1 系统、软件以及前提约束 CentOS 7 64 工作站作者的机子ip是192.168.100.200，请读者根据自己实际情况设置 j 阅读全文

posted @ 2020-03-26 19:49 张力的程序园阅读(256) 评论(0) 推荐(0)

02 在idea中熟悉python的基本语法

摘要：前面我们已经完成了scala的第一个程序，本文将在其基础之上阐述scala的基本语法。 1 系统、软件以及前提约束 win10 64位已在idea中完成scala的helloworld程序 https://www.jianshu.com/p/ec64c70e6bb6 2 操作 1 数据类型 pyt 阅读全文

posted @ 2020-03-26 19:48 张力的程序园阅读(167) 评论(0) 推荐(0)

05 抽象类、扩展类和特质

摘要：前面我们了解了类和对象，本节我们将了解scala当中的抽象类、扩展类以及特质【相当于java中的接口】。 1 系统、软件以及前提约束 win10 64位已了解scala中的类与对象，并进行code https://www.jianshu.com/p/92f555f859c2 idea2018.1 阅读全文

posted @ 2020-03-26 19:47 张力的程序园阅读(165) 评论(0) 推荐(0)

02 在idea中熟悉scala的基础语法

摘要：前面我们已经完成了scala的第一个程序，本文将在其基础之上阐述scala的基本语法。 1 系统、软件以及前提约束 win10 64位已在idea中完成scala的helloworld程序 https://www.jianshu.com/p/ec64c70e6bb6 2 操作 1 数据类型 sca 阅读全文

posted @ 2020-03-26 19:46 张力的程序园阅读(274) 评论(0) 推荐(0)

16 使用逻辑斯蒂回归分类器预测句子中是否包含某字段

摘要：常用的分类器有逻辑斯蒂回归分类器和决策树分类器，本文将阐述在scala中使用逻辑斯蒂回归完成判断是否有某字段。 1 系统、软件以及前提约束 CentOS 7 64 工作站作者的机子ip是192.168.100.200，主机名为danji，请读者根据自己实际情况设置已完成spark访问hive h 阅读全文

posted @ 2020-03-26 19:45 张力的程序园阅读(164) 评论(0) 推荐(0)

12 整合Kafka与Spark Streaming

摘要：前面我们使用Spark Streaming去监听了端口数据，接下来我们将使用Spark Streaming作为kafka的消费者。 1 系统、软件以及前提约束 CentOS 7 64 工作站作者的机子ip是192.168.100.200，主机名为danji，请读者根据自己实际情况设置已完成spa 阅读全文

posted @ 2020-03-26 19:44 张力的程序园阅读(204) 评论(0) 推荐(0)

10 spark中的DataFrame编程

摘要：前面我们了解了RDD编程，RDD优点极多，但是不包含schema信息，即列的信息，只能通过反复的迭代处理获取期待的数据，本文将阐述DataFrame的用法，所谓DataFrame就是包含schema信息的RDD。 RDD【弹性分布式数据集】是spark的核心，它是只读的，基于内存的，RDD结合算子会阅读全文

posted @ 2020-03-26 19:43 张力的程序园阅读(223) 评论(0) 推荐(0)

07 使用sparksql访问hive

摘要：前面我们熟悉了通过spark访问mysql，这一节我们将了解通过spark通过hive 1 系统、软件以及前提约束 CentOS 7 64 工作站作者的机子ip是192.168.100.200，主机名为danji，请读者根据自己实际情况设置已完成spark访问mysql https://www. 阅读全文

posted @ 2020-03-26 19:42 张力的程序园阅读(311) 评论(0) 推荐(0)

05 使用spark进行词频统计【scala sbt】

摘要：我们已经了解了在spark命令行当中使用交互方式完成词频统计，本节将阐述在idea当中使用sbt环境完成scala代码，并进行词频统计。 1 系统、软件以及前提约束 CentOS 7 64 工作站作者的机子ip是192.168.100.200，主机名为danji，请读者根据自己实际情况设置已在l 阅读全文

posted @ 2020-03-26 19:41 张力的程序园阅读(568) 评论(0) 推荐(0)

03 使用spark进行词频统计【python】

摘要：本节将展示如何在spark中通过python进行词频统计。 1 系统、软件以及前提约束 CentOS 7 64 工作站作者的机子ip是192.168.100.200，主机名为danji，请读者根据自己实际情况设置已完成scala方式的词频统计 https://www.jianshu.com/p/ 阅读全文

posted @ 2020-03-26 19:40 张力的程序园阅读(1019) 评论(0) 推荐(0)

01 在CentOS7当中安装spark

摘要： spark是新一代的大数据组件，包括sparkcore, sparksql,sparkstreaming,mllib,graphx等，在实际生产中作用极大，与HDFS, Hbase, hive等都可以交互。本文将阐述如何在CentOS7中安装spark。 1 系统、软件以及前提约束 CentOS 7 阅读全文

posted @ 2020-03-26 19:38 张力的程序园阅读(366) 评论(0) 推荐(0)

01 在CentOS7当中安装Storm

摘要：数据分两类，一类是静态处理，多做批量处理，属于OLAP，一类是流式数据，多做实时处理，属于OLTP。Spark Streaming属于微批处理，并非真正意义上的实时处理。本节将介绍一个真正意义上的流处理框架Storm，本文将阐述Storm的安装。 1 系统、软件以及前提约束 CentOS 7 64 阅读全文

posted @ 2020-03-26 19:37 张力的程序园阅读(228) 评论(0) 推荐(0)

01 在CentOS7中安装flink

摘要：数据分两类，一类是静态处理，多做批量处理，属于OLAP，一类是流式数据，多做实时处理，属于OLTP。Spark Streaming属于微批处理，并非真正意义上的实时处理。本节将介绍一个顶级的流处理框架Flink。 1 系统、软件以及前提约束 CentOS 7 64 工作站作者的机子ip是192.1 阅读全文

posted @ 2020-03-26 19:36 张力的程序园阅读(1494) 评论(0) 推荐(0)

01 在CentOS中安装Sqoop

摘要：在大数据组件之间进行数据的迁移是必不可少的，本文将阐述数据迁移的重要工具之一sqoop。 1 系统、软件以及前提约束 CentOS 7 64 工作站作者的机子ip是192.168.100.200，请读者根据自己实际情况设置 sqoop 1.4.7.bin__hadoop 2.6.0 下载链接：ht 阅读全文

posted @ 2020-03-26 19:26 张力的程序园阅读(174) 评论(0) 推荐(0)

张力的程序园

公告