第三十三章：influxDB

一：influxdb

1.简介

InfluxDB是一种时序数据库，用来存放监控数据。InfluxDB 是用Go语言编写的一个开源分布式时序、事件和指标数据库，无需外部依赖。

其主要特色功能

1）基于时间序列，支持与时间有关的相关函数（如最大，最小，求和等）

2）可度量性：你可以实时对大量数据进行计算

3）基于事件：它支持任意的事件数据

InfluxDB的主要特色

1）无结构（无模式）：可以是任意数量的列

2）可拓展的

3）支持min, max, sum, count, mean, median 等一系列函数，方便统计

4）原生的HTTP支持，内置HTTP API

5）强大的类SQL语法

6）自带管理界面，方便使用

2.下载安装

1、下载 influxdb1.8.4，windows 安装包如下：

# 【influxDB】windows 安装 influxdb1.8.4+ 管理工具
https://blog.csdn.net/qq_31107521/article/details/121739270

ps：官网下载2.0版本缺少配置文件，1.8启动就能用双击 influxd.exe 启动即可

2、解压到安装盘（不用安装），目录为：

# InfluxDB 的数据存储主要有三个目录。默认情况下是 meta, wal 以及 data 三个目录，服务器运行后会自动生成。

meta 用于存储数据库的一些元数据，meta 目录下有一个 meta.db 文件。
wal 目录存放预写日志文件，以 .wal 结尾。
data 目录存放实际存储的数据文件，以 .tsm 结尾。

# 如果不使用 influxdb.conf 配置的话，那么直接双击打开 influxd.exe 就可以使用 influx，此时上面三个文件夹的目录则存放在 Windows系统的 C盘 User 目录下的 .Influx 目录下，

influxdb 使用的端口如下：

8083：InfluxDB 的 Web 管理界面端口，web管理端 [http://ip:8083](https://link.zhihu.com/?target=http%3A//ip%3A8083) 用户名和密码都是admin,

8086：HTTP API 监听端口

8088：集群端口(目前还不是很清楚, 配置在全局的bind-address，默认不配置就是开启的)

3.python快速使用

from influxdb import InfluxDBClient

# 连接远端
# client = InfluxDBClient(host='mydomain.com', port=8086, username='myuser', password='mypass', ssl=True, verify_ssl=True)

# def save_influxdb():
# 连接本地
client = InfluxDBClient(host='localhost', port=8086)
# 切换数据库
client.switch_database('pyexample')

# 定义待插入的数据
# json_body = [
#     {
#         "measurement": "brushEvents",
#         "tags": {
#             "user": "Carol",
#             "brushId": "6c89f539-71c6-490d-a28d-6c5d84c0ee2f"
#         },
#         "time": "2018-03-28T8:01:00Z",
#         "fields": {
#             "duration": 127
#         }
#     },
#     {
#         "measurement": "brushEvents",
#         "tags": {
#             "user": "Carol",
#             "brushId": "6c89f539-71c6-490d-a28d-6c5d84c0ee2f"
#         },
#         "time": "2018-03-29T8:04:00Z",
#         "fields": {
#             "duration": 132
#         }
#     },
#     {
#         "measurement": "brushEvents",
#         "tags": {
#             "user": "Carol",
#             "brushId": "6c89f539-71c6-490d-a28d-6c5d84c0ee2f"
#         },
#         "time": "2018-03-30T8:02:00Z",
#         "fields": {
#             "duration": 129
#         }
#     }
# ]

# 执行插入操作，执行成果返回True


json_body = [
    {
        "measurement": "test_dev_ops",
        "tags": {
            "CPU": "0.0",
            "RAM": "24.3",
            "net_recv": "3.04",
            "net_sent": "1.68",
        },
        "fields": {
            "duration": 129
        }
    }
]
# ret = client.write_points(json_body)
# print(ret)    # True

# 查询数据
# 前面已经插入了几条数据，下面我们演示查询。
# records = client.query("SELECT duration FROM brushEvents WHERE time > now() - 4d GROUP BY user")
records = client.query('select * from test_dev_ops')
print(records)
for rec in records:
    for i in rec:
        print(i)

二：使用指南

1.修改配置

1.1 meta dir 配置

修改以下部分路径

1.2 端口号配置

如果需要更改端口号，则修改以下部分配置

1.3 启动方式

修改配置后启动方式

InfluxDB 使用时需要首先打开 Influxd.exe，直接打开会使用默认配置，需要使用已配置的配置文件的话，需要指定 conf 文件进行启动，启动命令：influxd --config influxdb.conf

如果出现下列情况，启动失败，还需要修改 influxdb.con

在 influxdb.conf 中修改如下一行，修改地址并且打开注释，修改后保存

再次运行 influxd --config influxdb.conf 命令

出现如下信息启动成功

ps：启动运行 influxd 命令的话，使用默认配置，打开默认 8086 端口号的服务

1.4 注意项

启动 influxd 后，窗口不要关闭。再启动一个 cmd 窗口，执行如下命令：influx

ps：InfluxDB 自带一个客户端程序 influx，可用来增删改查等操作数据库

2.influxDB常用命令

2.1 用户操作

# 显示所有用户
show users

# 新增普通用户
create user "user" with password 'user'

# 新增管理员用户
create user "admin" with password 'admin' with all privileges

# 删除用户
drop user "user"

2.2 数据库操作

# 显示数据库
show databases

# 创建数据库
create database myfirstdb

# 使用数据库
use myfirstdb

# 删除数据库
drop database 数据库名

2.3 表操作

# 显示所有表，没有表则无返回
show measurements

新建表没有具体的语法，只是增加第一条数据时，会自动建立表

# 新建表和插入数据
insert results,hostname=index1 value=1

其中 results 就是表名，hostname是索引（tag），value=xx是记录值（field），记录值可以有多个，系统自带追加时间戳
或者添加数据时，自己写入时间戳(实现修改)
insert results,hostname=server01 value=442221834240i 1435362189575692182

这里的时间看不懂，可以设置一下时间显示格式

precision rfc3339

# 删除表
drop measurements 表名

# 修改数据
insert into measurement,tagKey=tagValue fieldKey=fieldValue timestamp
insert add_test,name=YiHui,phone=110 user_id=20,email="bangzewu@126.com",boy=true,age=18i 1564149327925320596

2.4 查询数据

sql 语句和 MySQL 等关系型数据库很相似

表名有点号时，输入双引号

# 查询数据
# select * from 表名 where 列名 = 值
select * from "jmeter.all.a.avg"
select * from test2_dev_ops where host_ip='139.224.252.227' and time > now() - 1d;

和 sql 语法相同，区别：

measurement 数据库中的表

points 表里面的一行数据，Point 由时间戳（time）、数据（field）、标签（tags）组成。

2.5 数据保存策略

一般情况下基于时间序列的 point 数据不会进行直接删除操作，一般我们平时只关心当前数据，历史数据不需要一直保存，不然会占用太多空间。这里可以配置数据保存策略（Retention Policies），当数据超过了指定的时间之后，就会被删除。

# 查看当前数据库的 Retention Policies
show retention policies on  数据库名
# 创建新的 Retention Policies
create retention policy "rp_name" on "db_name" duration 180d replication 1 default

# 注释如下：
rp_name：策略名
db_name：具体的数据库名
180d：保存 180 天，180 天之前的数据将被删除
    - 它具有各种时间参数，比如：h（小时），w（星期）
REPLICATION 1：副本个数，这里填 1 就可以了
DEFAULT：设为默认的策略

# 选择使用 telegraf 数据库
> use telegraf;
Using database telegraf
> 
> 
# 查询数据保留策略
> show retention policies on telegraf
name    duration shardGroupDuration replicaN default
----    -------- ------------------ -------- -------
autogen 0s       168h0m0s           1        true

从查询的结果来看，默认只有一个策略，而上面这个策略的说明了什么信息呢？

字段	描述	值
name	策略名称	autogen【默认】
duration	持续时间	0s 【默认】
shardGroupDuration	shardGroup数据存储时间	shardGroup是InfluxDB的一个基本存储结构, 应该大于这个时间的数据在查询效率上应该有所降低。
replicaN	副本个数	1
default	是否默认策略	true

3.influxdb 与传统数据库的比较

库、表等比较：

influxDB	传统数据库中的概念
database	数据库
measurement	数据库中的表
points	表里面的一行数据

influxdb 数据的构成：

Point由时间戳（time）、数据（field）、标签（tags）组成。

Point属性	传统数据库中的概念
time	每个数据记录时间，是数据库中的主索引(会自动生成)
fields	各种记录值（没有索引的属性）也就是记录的值：温度，湿度
tags	各种有索引的属性：地区，海拔

附件

一：其它配置说明

reporting-disabled = false # 该选项用于上报influxdb的使用信息给InfluxData公司，默认值为false
bind-address = “:8088” # 备份恢复时使用，默认值为8088

1、meta相关配置

[meta]

dir = "/var/lib/influxdb/meta" # meta数据存放目录

retention-autocreate = true # 用于控制默认存储策略，数据库创建时，会自动生成autogen的存储策略，默认值：true

logging-enabled = true # 是否开启meta日志，默认值：true

2、data相关配置

[data]

dir = "/var/lib/influxdb/data" # 最终数据（TSM文件）存储目录

wal-dir = "/var/lib/influxdb/wal" # 预写日志存储目录

query-log-enabled = true # 是否开启tsm引擎查询日志，默认值： true

cache-max-memory-size = 1048576000 # 用于限定shard最大值，大于该值时会拒绝写入，默认值：1000MB，单位：byte

cache-snapshot-memory-size = 26214400 # 用于设置快照大小，大于该值时数据会刷新到tsm文件，默认值：25MB，单位：byte

cache-snapshot-write-cold-duration = "10m" # tsm引擎 snapshot写盘延迟，默认值：10Minute

compact-full-write-cold-duration = "4h" # tsm文件在压缩前可以存储的最大时间，默认值：4Hour

max-series-per-database = 1000000 # 限制数据库的级数，该值为0时取消限制，默认值：1000000

max-values-per-tag = 100000 # 一个tag最大的value数，0取消限制，默认值：100000

3、coordinator查询管理的配置选项

[coordinator]

write-timeout = "10s" # 写操作超时时间，默认值： 10s

max-concurrent-queries = 0 # 最大并发查询数，0无限制，默认值： 0

query-timeout = "0s # 查询操作超时时间，0无限制，默认值：0s

log-queries-after = "0s" # 慢查询超时时间，0无限制，默认值：0s

max-select-point = 0 # SELECT语句可以处理的最大点数（points），0无限制，默认值：0

max-select-series = 0 # SELECT语句可以处理的最大级数（series），0无限制，默认值：0

max-select-buckets = 0 # SELECT语句可以处理的最大"GROUP BY time()"的时间周期，0无限制，默认值：0

4、retention旧数据的保留策略

[retention]

enabled = true # 是否启用该模块，默认值： true

check-interval = "30m" # 检查时间间隔，默认值："30m"

5、shard-precreation分区预创建

[shard-precreation]

enabled = true # 是否启用该模块，默认值： true

check-interval = "10m" # 检查时间间隔，默认值："10m"

advance-period = "30m" # 预创建分区的最大提前时间，默认值："30m"

6、监控系统

monitor控制InfluxDB自有的监控系统。默认情况下，InfluxDB把这些数据写入_internal 数据库，如果这个库不存在则自动创建。 _internal 库默认的retention策略是7天，如果你想使用一个自己的retention策略，需要自己创建。

[monitor]

store-enabled = true # 是否启用该模块，默认值：true

store-database = "_internal" # 默认数据库："_internal"

store-interval = "10s # 统计间隔，默认值："10s"

7、admin web管理页面

[admin]

enabled = true # 是否启用该模块，默认值： false

bind-address = ":8083" # 绑定地址，默认值：":8083"

https-enabled = false # 是否开启https ，默认值：false

https-certificate = "/etc/ssl/influxdb.pem" # https证书路径，默认值："/etc/ssl/influxdb.pem"

8、http API

[http]

enabled = true # 是否启用该模块，默认值：true

bind-address = ":8086" # 绑定地址，默认值：":8086"

auth-enabled = false # 是否开启认证，默认值：false

realm = "InfluxDB" # 配置JWT realm，默认值: "InfluxDB"

log-enabled = true # 是否开启日志，默认值：true

write-tracing = false # 是否开启写操作日志，如果置成true，每一次写操作都会打日志，默认值：false

pprof-enabled = true # 是否开启pprof，默认值：true

https-enabled = false # 是否开启https，默认值：false

https-certificate = "/etc/ssl/influxdb.pem" # 设置https证书路径，默认值："/etc/ssl/influxdb.pem"

https-private-key = "" # 设置https私钥，无默认值

shared-secret = "" # 用于JWT签名的共享密钥，无默认值

max-row-limit = 0 # 配置查询返回最大行数，0无限制，默认值：0

max-connection-limit = 0 # 配置最大连接数，0无限制，默认值：0

unix-socket-enabled = false # 是否使用unix-socket，默认值：false

bind-socket = "/var/run/influxdb.sock" # unix-socket路径，默认值："/var/run/influxdb.sock"

9、subscriber控制Kapacitor接受数据的配置

[subscriber]

enabled = true # 是否启用该模块，默认值：true

http-timeout = "30s" # http超时时间，默认值："30s"

insecure-skip-verify = false # 是否允许不安全的证书

ca-certs = "" # 设置CA证书

write-concurrency = 40 # 设置并发数目，默认值：40

write-buffer-size = 1000 # 设置buffer大小，默认值：1000

10、graphite相关配置

[[graphite]]

enabled = false # 是否启用该模块，默认值：false

database = "graphite" # 数据库名称，默认值："graphite"

retention-policy = "" # 存储策略，无默认值

bind-address = ":2003" # 绑定地址，默认值：":2003"

protocol = "tcp" # 协议，默认值："tcp"

consistency-level = "one" # 一致性级别，默认值："one

batch-size = 5000 # 批量size，默认值：5000

batch-pending = 10 # 配置在内存中等待的batch数，默认值：10

batch-timeout = "1s" # 超时时间，默认值："1s"

udp-read-buffer = 0 # udp读取buffer的大小，0表示使用操作系统提供的值，如果超过操作系统的默认配置则会出错。该配置的默认值：0

separator = "." # 多个measurement间的连接符，默认值： "."

11、collectd

[[collectd]]

enabled = false # 是否启用该模块，默认值：false

bind-address = ":25826" # 绑定地址，默认值： ":25826"

database = "collectd" # 数据库名称，默认值："collectd"

retention-policy = "" # 存储策略，无默认值

typesdb = "/usr/local/share/collectd" # 路径，默认值："/usr/share/collectd/types.db"

auth-file = "/etc/collectd/auth_file"

batch-size = 5000

batch-pending = 10

batch-timeout = "10s"

read-buffer = 0 # udp读取buffer的大小，0表示使用操作系统提供的值，如果超过操作系统的默认配置则会出错。默认值：0

12、opentsdb

[[opentsdb]]

enabled = false # 是否启用该模块，默认值：false

bind-address = ":4242" # 绑定地址，默认值：":4242"

database = "opentsdb" # 默认数据库："opentsdb"

retention-policy = "" # 存储策略，无默认值

consistency-level = "one" # 一致性级别，默认值："one"

tls-enabled = false # 是否开启tls，默认值：false

certificate= "/etc/ssl/influxdb.pem" # 证书路径，默认值："/etc/ssl/influxdb.pem"

log-point-errors = true # 出错时是否记录日志，默认值：true

batch-size = 1000

batch-pending = 5

batch-timeout = "1s"

13、udp

[[udp]]

enabled = false # 是否启用该模块，默认值：false

bind-address = ":8089" # 绑定地址，默认值：":8089"

database = "udp" # 数据库名称，默认值："udp"

retention-policy = "" # 存储策略，无默认值

batch-size = 5000

batch-pending = 10

batch-timeout = "1s"

read-buffer = 0 # udp读取buffer的大小，0表示使用操作系统提供的值，如果超过操作系统的默认配置则会出错。该配置的默认值：0　

14、continuous_queries

[continuous_queries]

enabled = true # enabled 是否开启CQs，默认值：true

log-enabled = true # 是否开启日志，默认值：true

run-interval = "1s" # 时间间隔，默认值："1s"

二：参考文献

https://zhuanlan.zhihu.com/p/559898070

posted @ 2023-04-03 15:35 亦双弓阅读(449) 评论(0) 收藏举报

刷新页面返回顶部

亦双弓

第三十三章：influxDB

一：influxdb

1.简介

2.下载安装

3.python快速使用

二：使用指南

1.修改配置

1.1 meta dir 配置

1.2 端口号配置

1.3 启动方式

1.4 注意项

2.influxDB常用命令

2.1 用户操作

2.2 数据库操作

2.3 表操作

2.4 查询数据

2.5 数据保存策略

3.influxdb 与传统数据库的比较

附件

一：其它配置说明

1、meta相关配置

2、data相关配置

3、coordinator查询管理的配置选项

4、retention旧数据的保留策略

5、shard-precreation分区预创建

6、监控系统

7、admin web管理页面

8、http API

9、subscriber控制Kapacitor接受数据的配置

10、graphite相关配置

11、collectd

12、opentsdb

13、udp

14、continuous_queries

二：参考文献

公告