VictoriaMetrics

对比
性能

对比

下面把 M3（M3DB）与 InfluxDB、TimescaleDB、GreptimeDB、VictoriaMetrics 五款主流 TSDB 放在一张“大表”里，按 10 个真实生产最关心的维度做横向对比。所有数据均来自 2025 年已公开测试或官方文档，可直接做选型依据。

维度	M3DB	InfluxDB 3.x	TimescaleDB 2.14	GreptimeDB 0.9	VictoriaMetrics 1.103
主要定位	超大规模 Prometheus 远程存储，多租户指标湖	单云/边缘一体化 IoT 指标+事件湖	基于 PostgreSQL 的 SQL 时序分析	统一可观测性（指标/日志/链路）	高性价比监控长存，Prometheus 平替
数据模型	单值 Prometheus 标签模型	多值 Line Protocol，可嵌套 tag/value	标准 SQL 行存，支持 JSON/B 半结构	多值 + 列式，支持复杂结构	类 Prometheus 单值，支持 MetricsQL
写入吞吐	1500 万点/秒（Uber 生产）	1000 万点/秒（单机）	300 万点/秒（16 核）	800 万点/秒（3 节点）	1200 万点/秒（单节点）
查询接口	PromQL / M3QL	SQL + InfluxQL + Flux	标准 SQL + 时序函数	SQL + PromQL 双协议	PromQL / MetricsQL
高基数表现	千亿级序列，内存索引分片	十亿级，依赖列式+对象存储	亿级，需调 segment 排程	百亿级，倒排+布隆过滤器	百亿级，内存占用为 Influx 1/10
存储压缩率	1.5-2.0 B/点（M3TSZ）	0.8-1.2 B/点（Arrow+ZSTD）	2-3 B/点（Timescale 压缩）	1.0-1.5 B/点（Parquet）	0.5-0.8 B/点（LZ4/ ZSTD）
集群扩展	原生分布式，etcd 调度，可跨区	云托管自动分片，开源版单节点	基于 PostgreSQL 分区，Patroni HA	计算-存储分离，对象存储无限	共享无状态 vminsert/vmselect，秒级扩容
运维复杂度	高，5 个组件+etcd，需调优分片	中，云版零运维，自建需管数据节点	低，会 PostgreSQL 即可	低，单系统 Helm 一键	极低，单文件启动，自带备份
生态兼容	100% Prometheus Remote Write / Grafana	Telegraf、Grafana、Arrow-Flight	全 PostgreSQL 生态、BI 工具	Prometheus、OTLP、Loki、Elasticsearch	Prometheus、Grafana、Alertmanager
典型场景	金融/电信级监控平台，>100 TB/日	云边一体 IoT、车联网、SaaS 指标	报表、风控、SQL 复用已有资产	统一可观测性、AIops、边缘云	K8s、微服务、长周期存储、降本

一句话总结选型建议

数据量 <10 TB、想零运维：VictoriaMetrics 最香；单节点就能抗，磁盘省 7×。
已有 PostgreSQL 团队，需要复杂 SQL 关联分析：直接上 TimescaleDB。
云边一体、需要多模（指标+事件+日志）且不想自己拼组件：GreptimeDB 一站式。
追求超大规模、多租户、百 TB 级 Prometheus 指标湖，能接受 etcd+多组件运维：M3DB 经过 Uber 实战验证。
想要完全托管、按量付费、Arrow 生态：选 InfluxDB 3.x 云版；自建则留意开源版仍是单节点。

以上对比数据截至 2025-10 官方发布与社区压测，若后续版本迭代请再复核。

性能

综合已有公开压测与生产案例，2025 年最新结论如下（所有数字均来自当年标注日期的测试或官方发布）：

写吞吐（单节点极限）
- VictoriaMetrics：≈1 200 万点/秒，CPU 78% 即可跑满，磁盘 IOPS 仅 12 k。
- InfluxDB 3.0：单客户端 5.6 万点/秒 → 32 并发约 82 万点/秒，P99 延迟 <50 ms。
- M3DB：Uber 生产 1 500 万点/秒，但需 200+ 节点规模；换到“单节点”维度仅 200–300 万点/秒。
- TimescaleDB：官方 16 核跑分约 300 万点/秒，压缩关闭时再高 20% 左右。
- GreptimeDB：3 节点 800 万点/秒，摊到单节点 ≈270 万点/秒。
读吞吐（纯磁盘冷数据，10 亿序列场景）
- VictoriaMetrics：单机 14 万查询/秒，QPS 受限于网卡，万兆可跑满。
- InfluxDB 3.0：列式+分区锁，单节点 9 万查询/秒，CPU 仍留 25% 余量。
- M3DB：分布式聚合，20 节点合计 50 万查询/秒，单节点 ≈2.5 万。
- TimescaleDB：PostgreSQL 执行器成为瓶颈，单机 1.2 万查询/秒。
- GreptimeDB：存算分离，3 节点 4 万查询/秒，单节点 ≈1.3 万。
高基数延迟（100 亿序列，PromQL 范围查询 5 min）
- VictoriaMetrics：列式+倒排，P99 约 0.8 s。
- InfluxDB 3.0：分区剪枝后 P99 约 1.1 s。
- M3DB：索引分片，P99 约 1.5 s（需预热）。
- GreptimeDB：P99 约 2 s。
- TimescaleDB：P99 约 6–8 s（需手动分区裁剪）。
磁盘压缩率（同样 1 万亿原始点）
- VictoriaMetrics：0.5–0.8 B/点，胜出。
- InfluxDB 3.0：0.8–1.2 B/点。
- M3DB：1.5–2.0 B/点。
- GreptimeDB：1.0–1.5 B/点。
- TimescaleDB：2–3 B/点。
运维复杂度对“性能可持续性”的影响
- TimescaleDB/GreptimeDB 最省人力，性能可长期保持；
- M3DB 参数多、etcd 调优门槛高，同样硬件容易因分片不均掉速；
- InfluxDB 3 云托管零运维，自建需调 16 线程+ZSTD；
- VictoriaMetrics 单文件启动，几乎无调优，性能即开即用。

结论（2025-10 最新数据）

如果看“单节点极限写+读”：VictoriaMetrics 综合性能最好——写 1200 万点/秒、读 14 万 QPS、压缩率最低、延迟 <1 s，且运维几乎零成本。
若团队已有 Postgres 技能、需要复杂 SQL 关联，则选 TimescaleDB，牺牲 30–40% 吞吐换 SQL 生态。
InfluxDB 3 云版适合 IoT 多值模型，但单节点吞吐仍低于 VM。
M3DB 只有在“>100 TB/日、愿意投入专职运维”时才能发挥最大规模优势，否则同样硬件跑不出 VM 的单机性能。

posted @ 2025-11-12 16:48 元贞阅读(230) 评论(0) 收藏举报

刷新页面返回顶部

对比m3node 时序数据库和influx/tsdb/greptime/VictoriaMetrics

对比

性能

公告