数据集问题一览

0. 数据集来源

  • 算法数据侠公众号,电力负荷数据/故障诊断数据。

1. 预测问题数据集

采样点数 = 采样频率 * 采样时间
eg:(采样频率25.6Khz,采样时间0.1s,则在此时间内,采样25.6k*0.1=2560个点)

1.1 PHM2012数据集

  • 数据文件分为①acc_xxx,为振动数据。②temp_xxx,为温度数据。
  • 以文件包bearing_1-2内振动数据文件为例进行说明:
  • 共有871个.csv数据文件,每个文件内记录了0.1s内的2560个采样点数据(采样点数计算如上),每个数据由6列构成:
  • 前四列为时间数据,后两列为 水平轴传感器 和 垂轴传感器 ,通常使用后两列数据。

2. 化工过程软测量 预测问题数据集

2.1 TE田纳西数据集

  • 包含22组文件(编号d00-d21的训练集和测试集)其中每个数据文件包含52列,对应52个观测变量。
  • 采样3分钟进行一次,不同文件运行时常不一样,因此采样数量也不一样。具体如下:
  1. d00.dat和d00_te.dat为正常工况下的样本。d00.dat训练样本是在25h运行仿真下获得的。观测数据总数为500。而d00_te.dat测试样本是在48h运行仿真下获得的,观测数据总数为960。
  2. d01.dat至d21.dat为带有故障的训练集样本,d01_te.dat至d21_te.dat为带有故障的测试集样本。每个训练集\测试样本代表一种故障。
  3. 带有故障的训练集样本,是在25h运行仿真下获得的。仿真开始时没有故障情况,故障是在仿真时间为1h的时候引入的。但观测数据是在引入故障后才开始采集的,即只有480个观测值。
  4. 带有故障的测试集样本是在48h运行仿真下获得的,故障在8h的时候引入,共采集960个观测值,其中前160个观测值为正常数据。

2.2 Chiyoda SUR 硫化工预测数据集

介绍和代码实现链接:https://zhuanlan.zhihu.com/p/348103088

posted @ 2022-03-01 15:31  青梧成林2022  阅读(509)  评论(0)    收藏  举报