第三十三章:influxDB

一:influxdb

1.简介

InfluxDB是一种时序数据库,用来存放监控数据。InfluxDB 是用Go语言编写的一个开源分布式时序、事件和指标数据库,无需外部依赖。

其主要特色功能

1)基于时间序列,支持与时间有关的相关函数(如最大,最小,求和等)

2)可度量性:你可以实时对大量数据进行计算

3)基于事件:它支持任意的事件数据

InfluxDB的主要特色

1)无结构(无模式):可以是任意数量的列

2)可拓展的

3)支持min, max, sum, count, mean, median 等一系列函数,方便统计

4)原生的HTTP支持,内置HTTP API

5)强大的类SQL语法

6)自带管理界面,方便使用

2.下载安装

1、下载 influxdb1.8.4,windows 安装包如下:

# 【influxDB】windows 安装 influxdb1.8.4+ 管理工具
https://blog.csdn.net/qq_31107521/article/details/121739270

ps:官网下载2.0版本缺少配置文件,1.8启动就能用双击 influxd.exe 启动即可

2、解压到安装盘(不用安装),目录为:

# InfluxDB 的数据存储主要有三个目录。默认情况下是 meta, wal 以及 data 三个目录,服务器运行后会自动生成。

meta 用于存储数据库的一些元数据,meta 目录下有一个 meta.db 文件。
wal 目录存放预写日志文件,以 .wal 结尾。
data 目录存放实际存储的数据文件,以 .tsm 结尾。

# 如果不使用 influxdb.conf 配置的话,那么直接双击打开 influxd.exe 就可以使用 influx,此时上面三个文件夹的目录则存放在 Windows系统的 C盘 User 目录下的 .Influx 目录下,
influxdb 使用的端口如下:

8083:InfluxDB 的 Web 管理界面端口,web管理端 [http://ip:8083](https://link.zhihu.com/?target=http%3A//ip%3A8083) 用户名和密码都是admin,

8086:HTTP API 监听端口

8088:集群端口(目前还不是很清楚, 配置在全局的bind-address,默认不配置就是开启的)

3.python快速使用

from influxdb import InfluxDBClient

# 连接远端
# client = InfluxDBClient(host='mydomain.com', port=8086, username='myuser', password='mypass', ssl=True, verify_ssl=True)

# def save_influxdb():
# 连接本地
client = InfluxDBClient(host='localhost', port=8086)
# 切换数据库
client.switch_database('pyexample')

# 定义待插入的数据
# json_body = [
#     {
#         "measurement": "brushEvents",
#         "tags": {
#             "user": "Carol",
#             "brushId": "6c89f539-71c6-490d-a28d-6c5d84c0ee2f"
#         },
#         "time": "2018-03-28T8:01:00Z",
#         "fields": {
#             "duration": 127
#         }
#     },
#     {
#         "measurement": "brushEvents",
#         "tags": {
#             "user": "Carol",
#             "brushId": "6c89f539-71c6-490d-a28d-6c5d84c0ee2f"
#         },
#         "time": "2018-03-29T8:04:00Z",
#         "fields": {
#             "duration": 132
#         }
#     },
#     {
#         "measurement": "brushEvents",
#         "tags": {
#             "user": "Carol",
#             "brushId": "6c89f539-71c6-490d-a28d-6c5d84c0ee2f"
#         },
#         "time": "2018-03-30T8:02:00Z",
#         "fields": {
#             "duration": 129
#         }
#     }
# ]

# 执行插入操作,执行成果返回True


json_body = [
    {
        "measurement": "test_dev_ops",
        "tags": {
            "CPU": "0.0",
            "RAM": "24.3",
            "net_recv": "3.04",
            "net_sent": "1.68",
        },
        "fields": {
            "duration": 129
        }
    }
]
# ret = client.write_points(json_body)
# print(ret)    # True

# 查询数据
# 前面已经插入了几条数据,下面我们演示查询。
# records = client.query("SELECT duration FROM brushEvents WHERE time > now() - 4d GROUP BY user")
records = client.query('select * from test_dev_ops')
print(records)
for rec in records:
    for i in rec:
        print(i)

二:使用指南

1.修改配置

1.1 meta dir 配置

修改以下部分路径

1.2 端口号配置

如果需要更改端口号,则修改以下部分配置

1.3 启动方式

修改配置后启动方式

InfluxDB 使用时需要首先打开 Influxd.exe,直接打开会使用默认配置,需要使用已配置的配置文件的话,需要指定 conf 文件进行启动,启动命令:influxd --config influxdb.conf

如果出现下列情况,启动失败,还需要修改 influxdb.con

influxdb.conf 中修改如下一行,修改地址并且打开注释,修改后保存

再次运行 influxd --config influxdb.conf 命令

出现如下信息启动成功

ps:启动运行 influxd 命令的话,使用默认配置,打开默认 8086 端口号的服务

1.4 注意项

启动 influxd 后,窗口不要关闭。再启动一个 cmd 窗口,执行如下命令:influx

ps:InfluxDB 自带一个客户端程序 influx,可用来增删改查等操作数据库

2.influxDB常用命令

2.1 用户操作

# 显示所有用户
show users

# 新增普通用户
create user "user" with password 'user'

# 新增管理员用户
create user "admin" with password 'admin' with all privileges

# 删除用户
drop user "user"

2.2 数据库操作

# 显示数据库
show databases

# 创建数据库
create database myfirstdb

# 使用数据库
use myfirstdb
# 删除数据库
drop database 数据库名

2.3 表操作

# 显示所有表,没有表则无返回
show measurements

新建表没有具体的语法,只是增加第一条数据时,会自动建立表

# 新建表和插入数据
insert results,hostname=index1 value=1

其中 results 就是表名,hostname是索引(tag),value=xx是记录值(field),记录值可以有多个,系统自带追加时间戳
或者添加数据时,自己写入时间戳(实现修改)
insert results,hostname=server01 value=442221834240i 1435362189575692182

这里的时间看不懂,可以设置一下时间显示格式

precision rfc3339
# 删除表
drop measurements 表名
# 修改数据
insert into measurement,tagKey=tagValue fieldKey=fieldValue timestamp
insert add_test,name=YiHui,phone=110 user_id=20,email="bangzewu@126.com",boy=true,age=18i 1564149327925320596

2.4 查询数据

sql 语句和 MySQL 等关系型数据库很相似

表名有点号时,输入双引号

# 查询数据
# select * from 表名 where 列名 = 值
select * from "jmeter.all.a.avg"
select * from test2_dev_ops where host_ip='139.224.252.227' and time > now() - 1d;

和 sql 语法相同,区别:

measurement 数据库中的表

points 表里面的一行数据,Point 由时间戳(time)、数据(field)、标签(tags)组成。

2.5 数据保存策略

一般情况下基于时间序列的 point 数据不会进行直接删除操作,一般我们平时只关心当前数据,历史数据不需要一直保存,不然会占用太多空间。这里可以配置数据保存策略(Retention Policies),当数据超过了指定的时间之后,就会被删除。

# 查看当前数据库的 Retention Policies
show retention policies on  数据库名
# 创建新的 Retention Policies
create retention policy "rp_name" on "db_name" duration 180d replication 1 default

# 注释如下:
rp_name:策略名
db_name:具体的数据库名
180d:保存 180 天,180 天之前的数据将被删除
    - 它具有各种时间参数,比如:h(小时),w(星期)
REPLICATION 1:副本个数,这里填 1 就可以了
DEFAULT:设为默认的策略
# 选择使用 telegraf 数据库
> use telegraf;
Using database telegraf
> 
> 
# 查询数据保留策略
> show retention policies on telegraf
name    duration shardGroupDuration replicaN default
----    -------- ------------------ -------- -------
autogen 0s       168h0m0s           1        true

从查询的结果来看,默认只有一个策略,而上面这个策略的说明了什么信息呢?

字段 描述
name 策略名称 autogen【默认】
duration 持续时间 0s 【默认】
shardGroupDuration shardGroup数据存储时间 shardGroup是InfluxDB的一个基本存储结构, 应该大于这个时间的数据在查询效率上应该有所降低。
replicaN 副本个数 1
default 是否默认策略 true

3.influxdb 与传统数据库的比较

库、表等比较:

influxDB 传统数据库中的概念
database 数据库
measurement 数据库中的表
points 表里面的一行数据

influxdb 数据的构成:

Point由时间戳(time)、数据(field)、标签(tags)组成。

Point属性 传统数据库中的概念
time 每个数据记录时间,是数据库中的主索引(会自动生成)
fields 各种记录值(没有索引的属性)也就是记录的值:温度, 湿度
tags 各种有索引的属性:地区,海拔

附件

一:其它配置说明

reporting-disabled = false # 该选项用于上报influxdb的使用信息给InfluxData公司,默认值为false
bind-address = “:8088” # 备份恢复时使用,默认值为8088

1、meta相关配置

[meta]

dir = "/var/lib/influxdb/meta" # meta数据存放目录

retention-autocreate = true # 用于控制默认存储策略,数据库创建时,会自动生成autogen的存储策略,默认值:true

logging-enabled = true # 是否开启meta日志,默认值:true

2、data相关配置

[data]

dir = "/var/lib/influxdb/data" # 最终数据(TSM文件)存储目录

wal-dir = "/var/lib/influxdb/wal" # 预写日志存储目录

query-log-enabled = true # 是否开启tsm引擎查询日志,默认值: true

cache-max-memory-size = 1048576000 # 用于限定shard最大值,大于该值时会拒绝写入,默认值:1000MB,单位:byte

cache-snapshot-memory-size = 26214400 # 用于设置快照大小,大于该值时数据会刷新到tsm文件,默认值:25MB,单位:byte

cache-snapshot-write-cold-duration = "10m" # tsm引擎 snapshot写盘延迟,默认值:10Minute

compact-full-write-cold-duration = "4h" # tsm文件在压缩前可以存储的最大时间,默认值:4Hour

max-series-per-database = 1000000 # 限制数据库的级数,该值为0时取消限制,默认值:1000000

max-values-per-tag = 100000 # 一个tag最大的value数,0取消限制,默认值:100000

3、coordinator查询管理的配置选项

[coordinator]

write-timeout = "10s" # 写操作超时时间,默认值: 10s

max-concurrent-queries = 0 # 最大并发查询数,0无限制,默认值: 0

query-timeout = "0s # 查询操作超时时间,0无限制,默认值:0s

log-queries-after = "0s" # 慢查询超时时间,0无限制,默认值:0s

max-select-point = 0 # SELECT语句可以处理的最大点数(points),0无限制,默认值:0

max-select-series = 0 # SELECT语句可以处理的最大级数(series),0无限制,默认值:0

max-select-buckets = 0 # SELECT语句可以处理的最大"GROUP BY time()"的时间周期,0无限制,默认值:0

4、retention旧数据的保留策略

[retention]

enabled = true # 是否启用该模块,默认值 : true

check-interval = "30m" # 检查时间间隔,默认值 :"30m"

5、shard-precreation分区预创建

[shard-precreation]

enabled = true # 是否启用该模块,默认值 : true

check-interval = "10m" # 检查时间间隔,默认值 :"10m"

advance-period = "30m" # 预创建分区的最大提前时间,默认值 :"30m"

6、监控系统

monitor控制InfluxDB自有的监控系统。 默认情况下,InfluxDB把这些数据写入_internal 数据库,如果这个库不存在则自动创建。 _internal 库默认的retention策略是7天,如果你想使用一个自己的retention策略,需要自己创建。

[monitor]

store-enabled = true # 是否启用该模块,默认值 :true

store-database = "_internal" # 默认数据库:"_internal"

store-interval = "10s # 统计间隔,默认值:"10s"

7、admin web管理页面

[admin]

enabled = true # 是否启用该模块,默认值 : false

bind-address = ":8083" # 绑定地址,默认值 :":8083"

https-enabled = false # 是否开启https ,默认值 :false

https-certificate = "/etc/ssl/influxdb.pem" # https证书路径,默认值:"/etc/ssl/influxdb.pem"

8、http API

[http]

enabled = true # 是否启用该模块,默认值 :true

bind-address = ":8086" # 绑定地址,默认值:":8086"

auth-enabled = false # 是否开启认证,默认值:false

realm = "InfluxDB" # 配置JWT realm,默认值: "InfluxDB"

log-enabled = true # 是否开启日志,默认值:true

write-tracing = false # 是否开启写操作日志,如果置成true,每一次写操作都会打日志,默认值:false

pprof-enabled = true # 是否开启pprof,默认值:true

https-enabled = false # 是否开启https,默认值:false

https-certificate = "/etc/ssl/influxdb.pem" # 设置https证书路径,默认值:"/etc/ssl/influxdb.pem"

https-private-key = "" # 设置https私钥,无默认值

shared-secret = "" # 用于JWT签名的共享密钥,无默认值

max-row-limit = 0 # 配置查询返回最大行数,0无限制,默认值:0

max-connection-limit = 0 # 配置最大连接数,0无限制,默认值:0

unix-socket-enabled = false # 是否使用unix-socket,默认值:false

bind-socket = "/var/run/influxdb.sock" # unix-socket路径,默认值:"/var/run/influxdb.sock"

9、subscriber控制Kapacitor接受数据的配置

[subscriber]

enabled = true # 是否启用该模块,默认值 :true

http-timeout = "30s" # http超时时间,默认值:"30s"

insecure-skip-verify = false # 是否允许不安全的证书

ca-certs = "" # 设置CA证书

write-concurrency = 40 # 设置并发数目,默认值:40

write-buffer-size = 1000 # 设置buffer大小,默认值:1000

10、graphite相关配置

[[graphite]]

enabled = false # 是否启用该模块,默认值 :false

database = "graphite" # 数据库名称,默认值:"graphite"

retention-policy = "" # 存储策略,无默认值

bind-address = ":2003" # 绑定地址,默认值:":2003"

protocol = "tcp" # 协议,默认值:"tcp"

consistency-level = "one" # 一致性级别,默认值:"one

batch-size = 5000 # 批量size,默认值:5000

batch-pending = 10 # 配置在内存中等待的batch数,默认值:10

batch-timeout = "1s" # 超时时间,默认值:"1s"

udp-read-buffer = 0 # udp读取buffer的大小,0表示使用操作系统提供的值,如果超过操作系统的默认配置则会出错。 该配置的默认值:0

separator = "." # 多个measurement间的连接符,默认值: "."

11、collectd

[[collectd]]

enabled = false # 是否启用该模块,默认值 :false

bind-address = ":25826" # 绑定地址,默认值: ":25826"

database = "collectd" # 数据库名称,默认值:"collectd"

retention-policy = "" # 存储策略,无默认值

typesdb = "/usr/local/share/collectd" # 路径,默认值:"/usr/share/collectd/types.db"

auth-file = "/etc/collectd/auth_file"

batch-size = 5000

batch-pending = 10

batch-timeout = "10s"

read-buffer = 0 # udp读取buffer的大小,0表示使用操作系统提供的值,如果超过操作系统的默认配置则会出错。默认值:0

12、opentsdb

[[opentsdb]]

enabled = false # 是否启用该模块,默认值:false

bind-address = ":4242" # 绑定地址,默认值:":4242"

database = "opentsdb" # 默认数据库:"opentsdb"

retention-policy = "" # 存储策略,无默认值

consistency-level = "one" # 一致性级别,默认值:"one"

tls-enabled = false # 是否开启tls,默认值:false

certificate= "/etc/ssl/influxdb.pem" # 证书路径,默认值:"/etc/ssl/influxdb.pem"

log-point-errors = true # 出错时是否记录日志,默认值:true

batch-size = 1000

batch-pending = 5

batch-timeout = "1s"

13、udp

[[udp]]

enabled = false # 是否启用该模块,默认值:false

bind-address = ":8089" # 绑定地址,默认值:":8089"

database = "udp" # 数据库名称,默认值:"udp"

retention-policy = "" # 存储策略,无默认值

batch-size = 5000

batch-pending = 10

batch-timeout = "1s"

read-buffer = 0 # udp读取buffer的大小,0表示使用操作系统提供的值,如果超过操作系统的默认配置则会出错。 该配置的默认值:0 

14、continuous_queries

[continuous_queries]

enabled = true # enabled 是否开启CQs,默认值:true

log-enabled = true # 是否开启日志,默认值:true

run-interval = "1s" # 时间间隔,默认值:"1s"

二:参考文献

https://zhuanlan.zhihu.com/p/559898070

posted @ 2023-04-03 15:35  亦双弓  阅读(378)  评论(0)    收藏  举报