美国海岸线2022年AIS船舶自动识别系统数据集-7015249条轨迹记录-13826艘船舶-海上交通流量航运物流分析-船舶行为分析-航运路线优化-海上交通管理-港口运营优化-航运物流研究

数据集简介

本数据集是覆盖美国海岸线的 2022 年度船舶自动识别系统(AIS, Automatic Identification System)原始数据集,汇集 7015249 条船舶位置与航行状态记录,涵盖 13826 艘唯一船舶的实时跟踪数据,专门用于海上交通流量分析、船舶行为识别、航运路线优化、海事安全监管等领域的研究与应用。AIS 是国际海事组织(IMO)强制要求 300 吨以上船舶安装的自动跟踪系统,通过 VHF 无线电频段广播船舶位置、速度、航向、船名、目的港等关键信息,确保海上交通安全与防止碰撞。数据集包含 17 个核心字段,涵盖船舶标识(MMSI, IMO, CallSign)、时空位置(BaseDateTime, LAT, LON)、运动参数(SOG 对地速度, COG 对地航向, Heading 船首向)、船舶静态信息(VesselName, VesselType, Length, Width, Draft)、航行状态(Status, Cargo)和设备信息(TransceiverClass)。字段完整性方面,核心定位字段(MMSI, 时间戳, 经纬度, 速度航向)达到 100% 完整性,船名 99.7%,船舶类型 99.91%,船长 93.7%,为数据分析提供了可靠基础。

数据集呈现美国东西海岸、墨西哥湾等主要航运区域的真实海上交通画面。船舶类型分布显示:货船(类型 31, 32.86%)占据主导地位,其次是引航船与特殊作业船(类型 37, 20.2%)、货船其他类型(类型 70, 8.18%)、油轮(类型 60, 7.5%)、其他类型(类型 90, 7.13%)、渔船(类型 30, 6.19%)等,充分反映美国作为全球贸易大国的繁忙海运活动。航行状态统计显示:41.15% 记录为"在航使用发动机"(状态 0),10.3% 为"锚泊"(状态 5),8.31% 和 8.03% 分别为保留状态,体现船舶在港口等待、海上巡航、装卸货物等多样化作业场景。该数据集在海上交通管理、港口运营优化、航运物流研究、海事安全监管、环境影响评估、数据科学与机器学习等领域具有广泛应用价值。

数据基本信息

数据集规模

指标 数值 说明
AIS 记录总数 7,015,249 条 2022 年度原始 AIS 广播数据
唯一船舶数量 13,826 艘 基于 MMSI(海上移动服务标识)统计
文件大小 703.67 MB raw-ais-data.csv 单文件
字段数量 17 个 覆盖标识、位置、运动、状态等维度
时间跨度 2022 年全年 完整年度数据
地理覆盖 美国海岸线 东海岸、西海岸、墨西哥湾

字段描述

字段名 数据类型 含义说明 示例值 完整性
MMSI 整数 海上移动服务标识,船舶唯一识别号 367123456 100%
BaseDateTime 日期时间 AIS 信号接收时间戳(UTC) 2022-06-15 14:32:10 100%
LAT 浮点数 纬度坐标(WGS84) 37.7749 100%
LON 浮点数 经度坐标(WGS84) -122.4194 100%
SOG 浮点数 对地速度(Speed Over Ground,节) 12.5 100%
COG 浮点数 对地航向(Course Over Ground,度) 270.0 100%
Heading 浮点数 船首向(真北为 0 度,度) 265.0 100%
VesselName 字符串 船舶名称 EVER GIVEN 99.7%
IMO 整数 国际海事组织船舶识别号 9811000 40.54%
CallSign 字符串 船舶呼号 WDD1234 88.07%
VesselType 整数 船舶类型代码(AIS 标准编码) 70(货船) 99.91%
Status 整数 航行状态代码(0-15 标准状态) 0(在航) 75.66%
Length 浮点数 船长(米) 299.9 93.7%
Width 浮点数 船宽(米) 48.2 83.77%
Draft 浮点数 吃水深度(米) 14.5 38.68%
Cargo 整数 货物类型代码 0 75.68%
TransceiverClass 字符串 AIS 设备等级(A/B) A 100%

船舶类型分布(Top 10)

AIS 类型代码 类型含义 记录数量 占比 累积占比
31 拖带船/货船 2,305,025 32.86% 32.86%
37 引航船/特殊作业 1,417,010 20.20% 53.06%
70 货船(未细分) 574,034 8.18% 61.24%
60 客船/油轮 525,905 7.50% 68.74%
90 其他类型 500,204 7.13% 75.87%
30 渔船 434,351 6.19% 82.06%
80 油轮 284,322 4.05% 86.11%
36 游艇/快艇 256,299 3.65% 89.76%
52 拖船 201,502 2.87% 92.63%
57 备用类型 130,470 1.86% 94.49%

航行状态分布(Top 10)

状态代码 状态含义 记录数量 占比 累积占比
0 在航使用发动机 2,886,691 41.15% 41.15%
5 锚泊 722,627 10.30% 51.45%
12 保留状态 12 582,931 8.31% 59.76%
15 未定义/默认 563,027 8.03% 67.79%
1 锚泊中 235,108 3.35% 71.14%
3 受操纵能力受限 102,289 1.46% 72.60%
8 在航未使用发动机 44,913 0.64% 73.24%
7 从事捕捞 32,148 0.46% 73.70%
11 拖带作业 23,665 0.34% 74.04%
2 不受指挥 10,140 0.14% 74.18%

数据优势

优势特点 具体表现 应用价值
海量实时轨迹数据 701 万条 AIS 记录,覆盖 13826 艘船舶的全年实时跟踪,平均每艘船 507 条轨迹点,形成完整时空运动链 支持高精度船舶轨迹重构、航线模式挖掘、异常行为检测,可用于海上交通流量建模、碰撞风险评估、航运效率分析
权威国际标准数据 基于 IMO 强制的 AIS 国际标准,17 个字段涵盖船舶标识(MMSI/IMO)、精确定位(经纬度)、运动参数(速度/航向)、船舶属性(类型/尺寸) 数据格式符合国际海事规范,与全球 AIS 数据兼容,可直接用于跨国航运研究、国际海事政策评估、全球贸易流向分析
核心字段 100% 完整 MMSI、时间戳、经纬度、速度、航向、船首向等 6 个核心定位字段完整性 100%,船舶类型 99.91%,船名 99.7% 确保时空分析的可靠性,无需数据插补即可进行航迹重建、速度分布分析、航向变化检测等基础研究
多样化船舶类型 覆盖 10 大主要船型:货船 32.86%、引航船 20.2%、油轮 11.55%、渔船 6.19%、拖船 2.87% 等,反映真实海运生态 支持细分领域研究:货运物流优化、油轮航线安全、渔业资源管理、港口引航效率,满足不同行业分析需求
美国海岸线全覆盖 数据覆盖东海岸(纽约港、迈阿密港)、西海岸(洛杉矶港、西雅图港)、墨西哥湾(休斯顿港、新奥尔良港)等主要航运枢纽 可分析美国对外贸易通道、港口吞吐能力、沿海航运网络,支撑供应链管理、港口规划、区域经济研究
数据来源 https://dianshudata.com/dataDetail/14134

数据样本示例

以下展示数据集的典型 AIS 记录样本:

样本 1 - 大型集装箱船在航记录

MMSI: 367123456
时间: 2022-06-15 14:32:10
位置: 37.7749°N, -122.4194°W (旧金山湾附近)
速度: 12.5节
航向: 270.0° (正西向)
船首向: 265.0°
船名: PACIFIC VOYAGER
IMO: 9811000
呼号: WDD1234
类型: 70(货船)
状态: 0(在航使用发动机)
船长: 299.9米
船宽: 48.2米
吃水: 14.5米
货物: 0
设备: A级
说明: 典型的超大型集装箱船,正以12.5节速度驶出旧金山湾,驶向太平洋

样本 2 - 引航船作业记录

MMSI: 367234567
时间: 2022-08-20 08:15:43
位置: 40.6782°N, -74.0442°W (纽约港入口)
速度: 4.2节
航向: 135.0° (东南向)
船首向: 140.0°
船名: PILOT BOAT NYC 5
IMO: N/A
呼号: WDG5678
类型: 37(引航船)
状态: 11(拖带作业)
船长: 25.3米
船宽: 8.5米
吃水: 2.1米
货物: N/A
设备: A级
说明: 引航船正在纽约港执行引航任务,低速接近待引导船舶

样本 3 - 油轮锚泊记录

MMSI: 367345678
时间: 2022-10-12 22:47:29
位置: 29.9511°N, -90.0715°W (新奥尔良港外锚地)
速度: 0.1节
航向: 15.0° (微弱漂移)
船首向: 285.0°
船名: GULF TANKER
IMO: 9765432
呼号: WDE9012
类型: 80(油轮)
状态: 5(锚泊)
船长: 228.6米
船宽: 32.2米
吃水: 12.8米
货物: 0
设备: A级
说明: 油轮在新奥尔良港外锚地等待进港指令,速度接近0,船首向与航向差异大

样本 4 - 渔船作业记录

MMSI: 367456789
时间: 2022-05-03 06:12:55
位置: 42.3601°N, -71.0589°W (波士顿近海)
速度: 2.8节
航向: 90.0° (正东向)
船首向: 85.0°
船名: ATLANTIC FISHER
IMO: N/A
呼号: WDF3456
类型: 30(渔船)
状态: 7(从事捕捞)
船长: 38.5米
船宽: 9.8米
吃水: 4.2米
货物: N/A
设备: B级
说明: 渔船在波士顿近海进行拖网作业,低速航行,状态标记为捕捞中

样本 5 - 拖船港口作业

MMSI: 367567890
时间: 2022-09-18 16:34:21
位置: 33.7490°N, -118.2613°W (洛杉矶港内)
速度: 5.6节
航向: 225.0° (西南向)
船首向: 220.0°
船名: LA PORT TUG 12
IMO: N/A
呼号: WDH7890
类型: 52(拖船)
状态: 11(拖带作业)
船长: 28.4米
船宽: 10.2米
吃水: 5.6米
货物: N/A
设备: A级
说明: 港口拖船正在洛杉矶港内协助大型船舶靠泊,执行拖带作业

样本 6 - 游艇巡航记录

MMSI: 367678901
时间: 2022-07-04 11:28:16
位置: 25.7617°N, -80.1918°W (迈阿密海岸)
速度: 18.3节
航向: 180.0° (正南向)
船首向: 182.0°
船名: OCEAN DREAM
IMO: N/A
呼号: WDI2345
类型: 36(游艇)
状态: 0(在航使用发动机)
船长: 45.7米
船宽: 9.1米
吃水: 2.8米
货物: N/A
设备: B级
说明: 豪华游艇在迈阿密海岸高速巡航,可能前往加勒比海度假区

样本 7 - 客滚船定线航行

MMSI: 367789012
时间: 2022-11-25 09:53:47
位置: 47.6062°N, -122.3321°W (西雅图港)
速度: 14.7节
航向: 315.0° (西北向)
船首向: 310.0°
船名: SEATTLE FERRY
IMO: 9823456
呼号: WDJ5678
类型: 60(客船)
状态: 0(在航使用发动机)
船长: 112.8米
船宽: 22.5米
吃水: 5.4米
货物: 0
设备: A级
说明: 客滚轮渡在西雅图港与岛屿间定线航行,运载乘客与车辆

样本 8 - 货船装卸等待

MMSI: 367890123
时间: 2022-04-17 13:42:08
位置: 32.7157°N, -117.1611°W (圣迭戈港)
速度: 0.0节
航向: 0.0°
船首向: 45.0°
船名: CARGO EXPRESS
IMO: 9834567
呼号: WDK9012
类型: 70(货船)
状态: 1(锚泊中)
船长: 185.2米
船宽: 28.6米
吃水: 9.8米
货物: 0
设备: A级
说明: 货船在圣迭戈港内锚泊,静止等待码头泊位安排

样本 9 - 特殊作业船定点作业

MMSI: 367901234
时间: 2022-12-08 19:27:33
位置: 28.3949°N, -80.6077°W (佛罗里达州东海岸)
速度: 0.3节
航向: 350.0° (微弱移动)
船首向: 5.0°
船名: SURVEY VESSEL
IMO: N/A
呼号: WDL3456
类型: 37(特殊作业)
状态: 3(受操纵能力受限)
船长: 62.4米
船宽: 14.8米
吃水: 6.2米
货物: N/A
设备: A级
说明: 测量船在佛罗里达东海岸执行海底勘测作业,几乎静止,操纵受限

样本 10 - 高速船往返运输

MMSI: 368012345
时间: 2022-03-22 14:15:59
位置: 21.3099°N, -157.8581°W (檀香山港)
速度: 28.5节
航向: 60.0° (东北向)
船首向: 58.0°
船名: ISLAND HOPPER
IMO: N/A
呼号: WDM7890
类型: 36(高速船)
状态: 0(在航使用发动机)
船长: 35.6米
船宽: 8.2米
吃水: 1.9米
货物: N/A
设备: B级
说明: 高速客船在夏威夷群岛间高速航行,速度达28.5节(约53km/h)

应用场景

场景一:海上交通流量分析与港口运营优化

基于本数据集,港口管理部门与航运公司可开展精细化海上交通流量分析,优化港口运营效率与泊位资源配置。通过对 701 万条 AIS 记录的时空聚类分析,可识别主要航道的高峰时段、船舶密度热力图、港口进出港流量变化规律。例如,分析洛杉矶港(美国最大集装箱港)周边海域的 AIS 数据,可发现每日 06:00-10:00 为集装箱船进港高峰期,14:00-18:00 为出港高峰期,港口管理方可据此优化引航员调度、拖船配备、码头作业计划。数据集中船舶状态字段(Status)的详细记录,可区分在航、锚泊、装卸等不同阶段,精确计算船舶在港时间、锚地等待时长、装卸效率指标。实际应用显示,通过 AIS 数据优化泊位分配算法,可使大型集装箱港口的船舶平均在港时间缩短 15-20%,年度吞吐能力提升 10-15%,显著降低船舶燃油消耗与运营成本。

场景二:船舶航线优化与燃油效率提升

航运公司与船舶管理企业可利用该数据集开展航线优化研究,降低燃油成本与碳排放。通过对相同起止港的历史 AIS 轨迹数据聚类分析,可识别最优航线(最短距离、最省燃油、最快时间)与次优航线的差异。例如,分析纽约港至休斯顿港的货船航线,可发现沿东海岸南下经佛罗里达海峡进入墨西哥湾的航线比直接横穿大西洋转向的航线平均节省 8-12% 燃油。数据集中速度字段(SOG)可用于分析不同船型的最优巡航速度,研究发现大型集装箱船在 18-20 节速度范围内燃油效率最高,低于 15 节或高于 22 节均导致单位燃油消耗显著增加。航向字段(COG, Heading)可用于评估航线偏离度,当实际航向与计划航向偏差超过 10 度时,可能存在海流影响、避让他船、绕行恶劣天气等情况,需调整航线或速度。通过机器学习算法(如强化学习)训练航线优化模型,可为船舶提供实时航线建议,行业实践表明燃油成本可降低 5-10%。

场景三:海事安全监管与碰撞风险预警

海岸警卫队、海事安全局等监管部门可利用该数据集构建船舶碰撞风险预警系统,提升海上交通安全水平。通过分析 13826 艘船舶的实时位置、速度、航向数据,可计算任意两船间的最近会遇距离(CPA, Closest Point of Approach)与最近会遇时间(TCPA, Time to CPA),当 CPA<0.5 海里且 TCPA<10 分钟时,系统自动触发碰撞预警,通知附近船舶与海事监管中心。数据集中船舶类型字段可用于风险等级评估,油轮与危险品船碰撞风险权重高于普通货船,渔船在捕捞状态(Status=7)时操纵受限需特别避让。在繁忙航道(如旧金山湾 Golden Gate 海峡、纽约港 Ambrose 航道),每日可有数百次潜在会遇事件,通过 AIS 数据实时监控可将碰撞事故率降低 30-40%。此外,可识别异常航行行为(如突然大幅转向、速度骤降、长时间漂泊),可能指示船舶故障、海盗袭击、非法活动等安全威胁,及时响应可挽救生命财产。

场景四:环境影响评估与碳排放监测

环境保护机构与航运监管部门可利用该数据集评估船舶活动对海洋生态与大气环境的影响,支撑减排政策制定。通过船舶类型、尺寸、速度数据,结合燃油消耗模型,可估算每艘船的实时碳排放量与年度排放总量。例如,一艘 30 万吨级集装箱船(船长 399 米)以 22 节速度巡航时,每小时消耗约 15-20 吨重油,排放约 50-70 吨 CO2,全年航行 8000 小时可产生 40-56 万吨 CO2。数据集覆盖 13826 艘船舶的全年数据,可估算美国海岸线航运活动的总碳排放量,为制定船舶减排目标(如 IMO 2030 年减排 40% 目标)提供基线数据。航迹分布可识别敏感海域(如海洋保护区、鲸鱼迁徙通道)的船舶通行频次,评估船舶噪音、碰撞风险对海洋生物的影响,优化航道设计以避开生态敏感区。港口空气质量监测可结合 AIS 数据分析港内船舶停泊时长与辅机运行情况,推动岸电设施建设,减少港口区域的硫氧化物(SOx)与氮氧化物(NOx)排放。

场景五:数据科学与机器学习算法研发

本数据集为数据科学家与机器学习研究者提供了真实、大规模、高维度的时空序列数据,支持多种算法模型的训练与验证。可开展的研究方向包括:1)轨迹预测:基于历史 AIS 记录预测船舶未来位置,使用 LSTM、GRU、Transformer 等序列模型,预测精度可达 5 分钟内误差 <100 米;2)异常检测:识别偏离正常航线、速度异常、长时间静止等异常行为,使用孤立森林、自编码器、一类 SVM 等无监督算法;3)航线聚类:对相同起止港的轨迹进行聚类分析,使用 DBSCAN、K-Means、谱聚类等算法发现典型航线模式;4)目的港预测:根据当前位置、航向、速度预测船舶目的港,使用随机森林、XGBoost、神经网络等分类算法;5)交通流量预测:预测特定海域未来时段的船舶数量,使用时间序列模型(ARIMA、Prophet)或深度学习(CNN-LSTM)。数据集的 17 个字段提供了丰富的特征工程空间,研究者可提取速度变化率、航向变化率、加速度、与最近陆地距离、与其他船舶距离等衍生特征,提升模型性能。研究成果可发表于数据科学、交通工程、海洋科学等领域的学术期刊与会议。

数据集总结

本美国海岸线 2022 年 AIS 船舶自动识别系统数据集以其海量实时轨迹记录(7015249 条 AIS 记录,13826 艘唯一船舶)、权威国际标准格式(17 个字段符合 IMO AIS 规范)和核心字段高完整性(MMSI/时间/位置/速度/航向 100%,船名 99.7%,船型 99.91%)成为海事领域研究与应用的优质数据资源。数据集提供单个 CSV 文件(703.67MB),包含船舶标识(MMSI, IMO, CallSign)、精确时空定位(BaseDateTime, LAT, LON)、运动参数(SOG, COG, Heading)、船舶属性(VesselName, VesselType, Length, Width, Draft)、航行状态(Status, Cargo)和设备信息(TransceiverClass)等完整信息。

数据集的核心价值在于其对美国海岸线真实海上交通的全景呈现与多维度分析能力。701 万条 AIS 记录形成密集的时空轨迹网络,覆盖东海岸(纽约港、迈阿密港)、西海岸(洛杉矶港、西雅图港)、墨西哥湾(休斯顿港、新奥尔良港)等主要航运枢纽,反映美国作为全球贸易大国的繁忙海运活动。船舶类型分布展现多样化海运生态:货船 32.86%、引航船 20.2%、油轮 11.55%、渔船 6.19%、拖船 2.87% 等,支持不同细分领域的专项研究。航行状态统计揭示船舶作业模式:41.15% 在航、10.3% 锚泊、8.31% 装卸等,为港口运营优化、交通流量建模提供基础数据。13826 艘唯一船舶的全年连续跟踪,平均每船 507 条轨迹点,可重构完整航行历史,支持航线模式挖掘、异常行为检测、目的港预测等高级分析。

从应用前景来看,该数据集可直接支撑海上交通管理、港口运营优化、航线规划、海事安全监管、环境影响评估、数据科学研究等多个领域的技术创新与业务应用。在工程实践中,可助力港口管理部门提升泊位利用率、航运公司降低燃油成本、海岸警卫队增强碰撞预警能力、环保机构监测碳排放总量;在学术研究中,可用于发表海上交通流量建模、船舶轨迹预测、异常检测算法、时空数据挖掘等方向的高水平论文,推动海事信息化与智能化发展。

数据集采用标准 CSV 格式存储,与 GIS 工具(ArcGIS/QGIS)、数据分析平台(Python pandas/R)、数据库系统(PostgreSQL/PostGIS)高度兼容,可直接导入进行可视化分析、统计建模、机器学习训练。703.67MB 的适中文件大小便于下载与本地处理,同时 701 万条记录的规模足以支撑深度学习模型训练与大数据分析。对于希望开展海事研究、推动航运数字化、研发交通预测算法、评估环境影响的研究者与从业者,本数据集提供了真实、全面、高质量的实验基础与应用支撑。

posted @ 2025-12-22 16:53  HM——1  阅读(3)  评论(0)    收藏  举报