Veritas NetBackup™ 状态码"十大"常见报错状态码

我在刚开始学习Netbackup的时候,没少走弯路。经常会遇到各种稀奇古怪的 error 信息,遇到报错会很慌张,急需一个解决问题的办法。跟无头苍蝇一样,会不加思索地把错误粘到百度上,希望赶紧查找一下有没有好的处理问题的方法。

 

今天就给大家列举 Netbackup中,最经典的十大错误案例,并附有处理问题的解决思路和方法,希望能给刚入行一些帮助,今后再遇到任何报错,我们都可以很淡定地去处理。

 

学习任何一门技术的同时,其实就是自我修炼的过程。沉下心,尝试去拥抱技术的世界!

 

Top  1状态码: 1  消息:请求的操作部分成功

(在执行请求的操作的过程中, 检测到一个可能需要更正操作的问题。)

 

解决方法:    

1、确保该备份文件当前未被使用或修改。 检查文件或目录路径的长度是否超过了 1023 个字符。无法打开文件。检查文件的权限或目录中是否有隐藏文件

 

 如果是Archivelog备份,而且后续的备份均返回1。通常情况,需要进行Oracle 数据库的Archivelog同步。

Oracle数据库Archivelog同步的方法为:

以Oracle数据库用户登录到Oracle数据库服务上,通过RMAN来运行下面的命令:

$ su – oracle

$ rman

RMAN> connect target /

RMAN> change archivelog all validate;

RMAN> exit

 如果是数据库在线全备份,需要查看备份脚本所在目录中的.out输出文件,查看哪部分没有备份成功,再进行相应处理。

 

 

Top 2状态码: 2   消息: 请求的文件都未备份 

(备份或存档操作未备份文件列表中的任何文件。

此状态码主要在以下情况下出现:在使用 Lotus Notes 或 SQL Server 数据库代理进行自动备份时,所有与该作业相关的备份均已失败。或者,Enterprise Vault 备份已失败。在进行标准文件系统备份时不会出现该状态码。

如果在进行 UNIX、Linux 或 Windows 文件系统备份时遇到此错误,或者在 SQL Server 或 Lotus Notes 以外的数据库代理中发生此错误,请打开技术说明 TECH38838) 中推荐的 NetBackup 支持案例。) 

 

解决方法:

根据需要,执行以下操作:

  • 下列信息仅适用于 Lotus Notes。

在 UNIX 上,如果没有为 Lotus Domino Server 启用存档式日志记录,则会发生此错误。如果正在对事务日志进行另一个备份操作,也会发生此错误。

单击此处查看 Veritas 知识库中有关此状态码的技术说明和其他信息。

 

客户端空间不足、卡进程、sql服务没有启动

出现在sql数据库,客户端名字带域名,去客户端设置里修改

看看磁盘使用情况

看看脚本是否正常(注册表)

看看客户端与SQL的连接是否已认证(SQL代理服务器)

 

 

Top 3状态码: 6  消息:备份操作未能备份请求的文件 

(所出现的错误导致用户备份失败。) 

 

解决方法:

验证您是否具有读取这些文件的权限。检查文件读取权限或 Windows上的用户权限。

对于 数据库扩展客户机 (如 NetBackup for Oracle),这可能意味着 控制备份的脚本出现问题。详细信息请查看脚本的 Out 文件和错误信息。

 

oracle归档问题,试试能否全备成功,oracle交叉验证

rman target /

allocate channel for maintenance device type disk connect 'sys/abc123@nfjd1';//改节点

crosscheck archivelog all;

delete force expired archivelog all;

也有可能是客户端验证失败,在netbackup client service重新验证一下。(.out文件报错ORA-03113)

也有可能是文件夹权限不足,开发/usr/openv文件夹权限后再进行oracle_link(.out文件报错ORA-19554)

 

 

Top 4状态码: 13  消息: 文件读取失败

( 无法读取某个文件或套接字。) 

 

可能的原因如下:

  • 在主服务器、介质服务器或某个客户端上发生网络通信问题。
  • 从文件系统进行读取时出现 I/O 错误。
  • 读取的文件不完整或已损坏。
  • 由于网络问题或写入套接字的进程出现问题而导致套接字读取失败。
  • 特定于 NetBackup Snapshot Client 的问题(请参见“推荐的操作”)。
  • 在 NetBackup 安装失败后,首先进行 EV-SQL 备份。

请参见 NetBackup for Enterprise Vault Agent 管理指南的“故障排除”一节。

  • 在 Windows 平台上,NetBackup 为快照副本操作生成的文件列表可能没有足够的信息,无法从 tar32 副本还原。例如,因为尚未创建 tar32 副本,所以块编号信息不正确。
  • 对于双引导 VM,NetBackup 不支持策略的“启用从 VM 备份恢复文件”选项。
  • VMware VDDK 中的锁定超时可能会导致从同一 VMware 备份主机同时进行的 hotadd 备份失败。

在 NetBackup 活动监视器中,详细状态日志可能包括如下类似消息:

12/05/2014 06:43:53 - begin writing

12/05/2014 06:48:53 - Error bpbrm (pid=2605) socket read failed:

errno = 62 - Timer expired

12/05/2014 06:48:55 - Error bptm (pid=2654) media manager terminated

by parent process

 

/NetBackup/logs/vxms 日志可能包含类似如下 VDDK 消息的重复实例:

12/08/2014 05:11:35 : g_vixInterfaceLogger:libvix.cpp:1844 <DEBUG> :

[VFM_ESINFO] 2014-12-08T05:11:35.146-06:00 [7F1B1163F700 info Libs']

FILE: FileLockWaitForPossession timeout on '/var/log/vmware/hotAddLock.

dat.lck/M34709.lck' due to a local process '15882-26732358(bpbkarv)'

解决方法:

根据需要,执行以下操作:

  • 检查 NetBackup 的“问题”报告,查找问题发生位置及原因的提示。
  • 检查网络通信是否正常运行。

请参见 NetBackup 故障排除指南中的“解决网络通信问题”。

  • 对于 FlashBackup 客户端,检查 /var/adm/messages 日志,查找类似下面的错误:

Mar 24 01:35:58 bison unix: WARNING: sn_alloccache: cache

/dev/rdsk/c0t2d0s3 full - all snaps using this cache are now

unusable

 

此错误指示缓存分区不够大。如果可能的话,请增大缓存分区的大小。或者,如果多个备份使用同一个缓存,请减少并行备份的数量。要减少并行备份的数量,请重排其中的一些备份,或者将整个备份重排到文件系统活动较少的时间进行。

  • 要获取详细的故障排除信息,请为返回此状态码的进程创建调试日志目录。然后重试该操作并检查所生成的调试日志。
  • 确保已安装了所有产品和组件(SQL Server、Exchange、Notes 等)的最新 Service Pack 。
  • 确保整个环境中的所有网络硬件(NIC、集线器、交换机、路由器等)均设置为全双工,而不是半双工。
  • 针对系统中的 NIC 检查以下各项:
  • 在整个系统中升级到最新的 NIC 驱动程序。
  • 确保所有 NIC 均设置为全双工,而不是半双工。

请参见 NetBackup 故障排除指南中的“对网络接口卡性能进行故障排除”。

  • 增加 NIC 的超时设置。
  • 如果实施了 NIC 合作,请将其停用,以便进行测试。
  • 在受影响的客户端或服务器上替换 NIC 本身。
  • 对于 NetBackup Snapshot Client,状态码 13 可能会显示在 /usr/openv/netbackup/logs/bpbkar 日志中。

该日志可能会指出下列情况:

  • 要备份的文件驻留在 IDE 驱动器上而不是 SCSI 驱动器上。脱离主机备份方法设置为“NetBackup 介质服务器”或“第三方复制设备”。如果使用的是脱离主机备份,则包含客户端文件的磁盘必须是 SCSI 设备或光纤通道设备。

如果磁盘是 IDE 驱动器,则在 /usr/openv/ netbackup/logs/ bpfis 日志中可能会看到下列内容:

get_disk_info: FTL - /var/tmp/caa026fEU disk_inquiry failed.

Errno = 25: Inappropriate ioctl for device

 

在 /usr/openv/netbackup/logs/bpbkar 日志中可能会出现下列内容:

bpbkar: INF - Processing /var

bpbkar: ERR - get_disk_info() failed, status 13

bpbkar: ERR - tpc_get_disk_info() failed: err 13

bpbkar: ERR - bpbkar FATAL exit status = 13: file read failed

bpbkar: INF - EXIT STATUS 13: file read failed

  • 要备份的文件位于未装入的文件系统上。必须装入被指定为快照源的文件系统。如果没有装入快照源但存在装入点,则 NetBackup 可能会尝试针对指定为快照源的目录的上一级目录创建快照。
  • 对于 NetBackup 介质服务器方法,可能需要增大客户端读取超时值。在某些环境中,NetBackup 需要的读取时间可能比默认值所允许的读取时间长。如果客户端读取超时不足,则备份可能会失败,并导致出现此错误。

要增大所有客户端的客户端读取超时,请在“NetBackup 管理控制台”中,转到“主机属性”>“主服务器”>,双击主服务器,然后转到“属性”>“超时”。然后增大客户端读取超时。

  • 在 Windows 平台上,刷新“备份、存档和还原”客户端控制台,然后重试还原。此操作会刷新客户端控制台上显示的文件列表,并传递有关选定文件的正确信息。
  • 要防止 VMware VDDK 超时导致从同一 VMware 备份主机同时进行的 hotadd 备份失败,请执行下列操作之一:
  • 减少同时运行的 hotadd 备份数。
  • 根据需要增大介质服务器上的客户端读取超时(15 分钟或更长时间):

在 NetBackup 管理控制台中,单击“NetBackup 管理”>“主机属性”> 双击主服务器 >“超时”>“客户端读取超时”

单击此处查看 Veritas 知识库中有关此状态码的技术说明和其他信息。

 

 

Top 5状态码: 48 消息:找不到客户端主机名

( 系统函数 gethostbyname() 未能找到客户端的主机名。)

 

解决方法:

在下列位置验证客户端名称是否正确:

  • 主服务器上的 NetBackup 策略配置。
  • 下列对话框中的“常规”选项卡:“NetBackup 客户端属性”和“指定 NetBackup 计算机和策略类型”(在 Microsoft Windows 非目标客户端上)。要显示这些对话框,可在客户端上启动“备份、存档和还原”界面。对于“常规”选项卡,请单击“文件”菜单上的“NetBackup 客户端属性”;单击“文件”菜单上的“指定 NetBackup 计算机和策略类型”。
  • UNIX 和 Linux 客户端上的 bp.conf 文件。
  • 在客户端和服务器上,验证名称服务是否设置为能够正确解析 NetBackup 客户端名称。

在 UNIX 客户端上,验证客户端的主机名是否在 /etc/hosts 文件、YP hosts 文件或 NIS 映射中。

单击此处查看 Veritas 知识库中有关此状态码的技术说明和其他信息。

 

 

Top 6状态码: 57 消息:客户机连接被拒绝

(客户机拒绝 bpcd 端 口号上的连接。)

 

解决方法:

发生这种情况的原因可能是 在该 bpcd 端 口没有进程监听,或者因为到该 bpcd 端 口的连接太多,超过了 网络子系统使用 listen()调用可以处理的数量。

 

 

Top 7状态码: 71 消息:文件列表中的文件都不存在 

(文件列表中的文件与客户机上的任何文件都不匹配。)

 

解决方法:

验证是否为此客户机指定了正确的文件列表。

在 Windows 客户机上, 验证用来启动 NetBackup 客户机服务的帐户 是否有读取这些文件的权限。

 

 

Top 8状态码: 156 消息:遇到快照错误

(以下是出现此状态码的可能原因:

  • 与 VMware 相关的错误
  • Enterprise Vault Agent 相关错误。以下错误可能会导致状态码 156:
    • VSS_E_BAD_STATE 快照错误
    • VSS_E_INSUFFICIENT_STORAGE 快照错误
  • 与 Windows Open File Backup 或 Snapshot Client 有关的快照备份相关错误。
  • 将多个卷装入到同一个装入点上)

 

解决方法:

根据需要,执行以下操作:

  • NetBackup for VMware:
    • NetBackup 无法获取驱动器的卷 ID。

NetBackup 可能无法获取驱动器的卷 ID。在此情况下,将不会备份任何虚拟机驱动器。备份失败,NetBackup 状态码为 156。

驱动器可能会关闭。

  • 虚拟机的备份已处于活动状态

每次只能对一个虚拟机运行一个备份。如果在第一个备份处于活动状态时启动虚拟机的第二个备份,则第二个作业将失败,状态码为 156。

推荐的操作:请等到第一个作业完成后再运行第二个作业。

  • 无法找到虚拟机名称

NetBackup 无法查找备份策略中列出的虚拟机的主机名或 VM 显示名称。详细状态日志可能包含以下错误消息:

Critical bpbrm (pid=<pid number>) from client <client name>:

FTL - snapshot creation failed, status 156.)

 

如果虚拟机没有静态 IP 地址,可以将 NetBackup 配置为通过虚拟机的 VM 显示名称或 UUID 来识别虚拟机。不使用静态 IP 地址的环境包括群集和动态分配 IP 地址的网络等。

请注意,可能已将 NetBackup 配置为通过虚拟机的 VM 显示名称来识别虚拟机。在这种情况下,请确保显示名称是唯一的,且不包含特殊字符。

  • 虚拟机已关闭

通过 vCenter Server,NetBackup 可以备份已关闭的虚拟机。必须为 NetBackup 提供用于访问 vCenter Server 的凭据。

如果 NetBackup 使用 ESX Server(而不是 vCenter)的凭据,则可能无法识别已关闭的虚拟机。请注意以下几点:

  • 如果策略使用 VM 主机名或 VM DNS 名称作为“主 VM 标识符”,NetBackup 可能找不到虚拟机。备份将失败。
  • 如果策略使用 VM 显示名称或 VM UUID 作为“主 VM 标识符”,NetBackup 则可以标识虚拟机。备份将成功。
  • 虚拟机有一个或多个独立磁盘且处于暂停状态

如果具有独立磁盘的虚拟机处于暂停状态,则快照作业将失败。作业详细信息日志中将出现类似下面的消息:

01/12/2015 17:11:37 - Critical bpbrm (pid=10144) from client

<client name>: FTL - VMware error received: Cannot take a

memory snapshot, since the virtual machine is configured with

independent disks.

 

以下 VMware 文章中提供了更多信息:

http://kb.vmware.com/kb/1007532

解决方法是,将虚拟机的状态更改为打开或关闭,然后重新运行备份。

注意:

不能使用快照捕获独立磁盘中的数据。将会备份虚拟机的其余数据。

  • 虚拟机的磁盘处于原始模式 (RDM) 下

将忽略 RDM(不备份),并重新创建任一独立磁盘,但该磁盘是空的。

  • 创建快照的尝试超过 VMware 超时

如果尝试创建虚拟机的快照超出 10 秒的 VMware 超时,快照将失败,并显示 NetBackup 状态 156。如果虚拟机配置了大量的卷,可能会发生该超时。请注意,即使禁用“虚拟机静默”选项,仍可能会遇到超时问题。

执行以下操作之一:

  • 减少虚拟机中卷的数量。
  • 在虚拟机上安装 NetBackup 客户端,并为策略选择另一种备份方法(而不是 VMware 快照方法)。
  • 没有为虚拟机分配 vmdk 文件

没有 vmdk 文件的虚拟机可以出现在 vCenter Site Recovery Manager (SRM) 环境中。如果复制虚拟机从未处于活动状态,则它处于被动模式,且可能没有 vmdk 文件。

您可以在策略的“VMware 高级属性”选项卡上启用“忽略无盘 VM”选项。如果启用此选项:在 SRM 环境中,如果该虚拟机没有 vmdk 文件,NetBackup 就不会备份复制(被动)虚拟机。

  • vmdk 文件有太多增量文件

只要发生 VMware 快照,就会为每个 vmdk 创建一个 delta.vmdk 文件。如果单个 vmdk 文件存在 32 个或更多此类增量文件,则 NetBackup 对该 VM 的备份可能会失败(状态为 156)。NetBackup 活动监视器的作业详细信息包含类似以下内容的消息:

02/06/2015 10:33:17 - Critical bpbrm (pid=15799) from

client fl5vm1_2012: FTL - vSphere_freeze: Unable to proceed with

snapshot creation, too many existing delta files(44).

02/06/2015 10:33:17 - Critical bpbrm (pid=15799) from client

fl5vm1_2012: FTL - VMware_freeze: VIXAPI freeze (VMware snapshot)

failed with 25: SYM_VMC_FAILED_TO_CREATE_SNAPSHOT

02/06/2015 10:33:17 - Critical bpbrm (pid=15799) from client

fl5vm1_2012: FTL - vfm_freeze: method: VMware_v2, type: FIM,

function: VMware_v2_freeze

 

要备份 VM,请执行以下操作:

  • 合并 VM 的快照。

在 VMware 界面中,右键单击 VM 并选择“快照”>“合并”。有关更多信息,请参见 VMware 文档。

  • 确认 VM 的每个 vmdk 文件现在拥有的增量文件数少于 32 个。

如果快照合并失败,请参见以下 VMware 文章以获取更多帮助:

http://kb.vmware.com/kb/1004545

  • 重新运行 NetBackup 备份。
  • VMware 快照静默操作失败

如果 NetBackup 策略可用于虚拟机静默(默认),vSphere 中的 VMware 快照操作将启动虚拟机静默。如果快照静默失败,则 NetBackup 作业失败,状态为 156。

  • 对于 Enterprise Vault Agent:

请参见 NetBackup for Enterprise Vault Agent 管理指南的“故障排除”一节。

  • 对于使用 VSS 的 Windows Open File Backup 快照提供程序:

请参见下列指南之一的“故障排除”一节:

  • NetBackup for VMware 管理指南
  • NetBackup for Hyper-V 管理指南
  • NetBackup Snapshot Client 管理指南
  •  
  • 对于使用 VSS 备份的文件数目来说,VSS 缓存文件可能太小。
  • 如果启用了 bpbkar 调试日志,则在备份的 bpbkar 调试日志中会出现类似如下的消息。
  • 8:51:14.569 AM: [1924.2304] <2> tar_base::V_vTarMsgW: ERR -
  • failure reading file: D:\ test.file (WIN32 5: Access is denied.
  • )
  • 8:51:14.569 AM: [1924.2304] <4> tar_base::V_vTarMsgW: INF - tar
  • message received from dos_backup::tfs_readdata
  • 8:51:14.569 AM: [1924.2304] <2> tar_base::V_vTarMsgW: ERR -
  • Snapshot Error while reading test.file
  • 8:51:14.569 AM: [1924.2304] <4> tar_base::V_vTarMsgW: INF - tar
  • message received from tar_backup::nextfile_state_switch
  • 8:51:14.569 AM: [1924.2304] <2> tar_base::V_vTarMsgW: FTL -
  • Backup operation aborted!
  • 8:51:14.569 AM: [1924.2304] <2> tar_base::V_vTarMsgW: INF -
  • Client completed sending data for backup
  • 8:51:14.569 AM: [1924.2304] <2> tar_base::V_vTarMsgW: INF - EXIT
  • STATUS 156: snapshot error encountered
  •  
  • 要使用 Windows 中的卷影副本配置增加 VSS 缓存大小,请按顺序执行下列操作:
    • 在 Windows 中,右键单击“我的电脑”,然后选择“管理”。
    • 在控制台树中,右键单击“共享文件夹”,选择“所有任务”,然后选择“配置卷影副本”。
    • 选择要进行更改的卷,然后选择“设置”。
    • 在“设置”对话框中,将“最大空间”设置更改为下列设置之一:“没有限制”或足够大的值,以满足安装和使用 VSS 的要求。
  • 对于使用 Snapshot Client 和 NAS_Snapshot 方法的备份(包含或不包含 SnapVault):
    • 如果备份失败并显示状态码 156,请查阅 /usr/openv/netbackup/logs (UNIX) 或 install_path\NetBackup\logs (Windows) 中的 bpfis 旧式日志。如果 bpfis 目录不存在,必须创建它并重新运行此作业。

如有必要,提高日志记录级别并重试该作业。

请参见 NetBackup 日志记录参考指南中的“关于日志”。

  • 在 Windows 客户端上,从使用 NAS_Snapshot 方法创建的备份还原文件时,请以管理员帐户登录 NetBackup 客户端服务,而不要以本地系统帐户登录。否则,备份失败,状态为 156。
    • 在 Windows 服务中,双击“NetBackup 客户端服务”。
    • 然后检查“登录”选项卡:如果没有以管理员帐户登录服务,则停止该服务。
    • 改用管理员帐户登录并重新启动服务。
    • 重试还原。

单击此处查看 Veritas 知识库中有关此状态码的技术说明和其他信息。

 

 

Top 9状态码: 196 消息:因为备份时段已过,所以没有尝试进行客户机备份 

(备份调度程序对其进行排队的备份或归档操作没有尝试执行,因为 备份时段不再打开。)

 

解决方法:

请检查是否有进程卡死,一直占用驱动器。

如果有重启备份服务器或 介质服 务器的服务,重试备份。

如果可能, 更改日程表, 为此策略和日程表组合延长备份时段的时间, 以便不再出现此错误。 如果必须运行该备份,请使用 “备份策略管理”窗口策略(Policy)菜单上 的手动备份(Manual Backup) 命令执行该备份。手动备份将忽略备份窗口。

 

 

Top 10状态码:800

消息: 资源请求失败 

( nbjm 进程无法获取作业所需的资源。此状态码附带有 EMM 原因字符串,该字符串出现在活动监视器的作业详细信息屏幕中以及 nbjm 调试日志中。EMM 原因字符串确定失败的资源请求的原因。)

 

解决方法:

找到 EMM 原因字符串,更正问题,然后重新运行该作业。

对于某些通用的 EMM 原因字符串(如“磁盘卷已关闭”),可能需要生成某些报告来确定失败原因。可以通过在“NetBackup 管理控制台”中使用 bperror 或者各种日志条目报告(如“报告”>“磁盘报告”>“磁盘日志”)来生成此类报告。

单击此处查看 Veritas 知识库中有关此状态码的技术说明和其他信息。

 

 

今后还会继续总结 Netbackup中的各种报错处理思路与方法,希望跟各位老铁们,同学们一起努力。多沟通多交流!

 

 

posted @ 2018-04-24 16:39  HR·  阅读(3904)  评论(0编辑  收藏  举报