Re: Meaning of an OEM error

  • From: Courtney Llamas <COURTNEY.LLAMAS@xxxxxxxxxx>
  • To: "Reen, Elizabeth" <elizabeth.reen@xxxxxxxx>
  • Date: Mon, 1 Jun 2020 10:15:44 -0500

Looks like it’s coming from the alert log and one of the automated db health 
checks that is run.    For more details, review Checker Run Found xx New 
Persistent Data Failures. (Doc ID 1391202.1)


https://docs.oracle.com/en/enterprise-manager/cloud-control/enterprise-manager-cloud-control/13.3.1/emdbm/database-instance.html#GUID-D1EED667-55F5-4667-AFDE-535E9E6EB4F9
 
Data Failure
Enterprise Manager uses the metrics in this category to alert you to checker 
failures reported in the alert log. It contains the number of checker failures 
detected. It also generates a critical alert by default when these problems are 
found in the alert log.

The alert log file provides this data. It is collected using the perl script 
$ORACLE_HOME/sysman/admin/scripts/alertlog.pl where $ORACLE_HOME refers to the 
home of the Management Agent.

 <> <> <>Alert Log Name
This metric reports the name of the alert log file.

Target Version  Collection Frequency
11g, 12c
Every 5 Minutes
Data Source

The source of the data is 
$AGENT_BASE/plugins/oracle.sysman.db.agent.plugin_n.n.n.n/scripts/alertlogAdr.pl.
 

In the preceding directory path, $AGENT_BASE refers to the home of the Oracle 
Management Agent and n.n.n.n refers to the release version of the Oracle 
Database plug-in, such as plug-in release 13.1.0.0.

User Action

No user action is required.

 <> <> <>Data Failure Detected
This metric signifies that a database health checker has detected one or more 
persistent data failures. Examples of data failures include missing files, 
corrupt files, inconsistent files, and corrupt blocks. The alert shows the 
number of data failures detected by a checker run. Details of individual data 
failures can be accessed from the Perform Recovery page in Enterprise Manager.

Target Version  Evaluation and Collection Frequency     Default Warning 
Threshold       Default Critical Threshold      Alert Text
11g, 12c
Every 5 Minutes
Not Defined
.Foot 1 
<https://docs.oracle.com/en/enterprise-manager/cloud-control/enterprise-manager-cloud-control/13.3.1/emdbm/index.html#fn_1>
     
Checker run found %numberOfFailures% new persistent data failures.
Footnote 1 

After an alert is triggered for this metric, it must be manually cleared. 


Setting Thresholds

To edit the thresholds for any of the following metrics, from the Cloud Control 
UI, right-click the target name, select Monitoring, then Metric and Collection 
Settings. The following settings provide examples of some of the possible 
settings:

Warning Threshold: Not Defined; Critical Threshold: .*
In this case, the Management Agent generates a critical error alert in 
Enterprise Manager when a data failure occurs.
Warning Threshold: .*; Critical Threshold: Not Defined
In this case, the Management Agent generates a warning alert in Enterprise 
Manager when a data failure occurs.
Warning Threshold: Not Defined; Critical Threshold: Not Defined
In this case, the Management Agent does not generate an alert in Enterprise 
Manager when a data failure occurs. 
Data Source

The source of the data is 
$AGENT_BASE/plugins/oracle.sysman.db.agent.plugin_n.n.n.n/scripts/alertlogAdr.pl.
 

In the preceding directory path, $AGENT_BASE refers to the home of the Oracle 
Management Agent and n.n.n.n refers to the release version of the Oracle 
Database plug-in, such as plug-in release 13.1.0.0.

User Action

Details of individual data failures can be accessed from the Perform Recovery 
page in Enterprise Manager.

Note:This event does not automatically clear because there is no automatic way 
of determining when the problem has been resolved. Therefore, you must manually 
clear the event after the problem is fixed.

On Jun 1, 2020, at 10:07 AM, Reen, Elizabeth <elizabeth.reen@xxxxxxxx> wrote:

 
                Version 13.3 with April patching.  The db is 11.2.0.4 on RHEL 
7.
 
<image001.png>
 
Thanks,
 
Liz
 
 
From: [ORACLE.COM] Courtney Llamas <COURTNEY.LLAMAS@xxxxxxxxxx> 
Sent: Monday, June 1, 2020 11:05 AM
To: Reen, Elizabeth [ICG-IT]
Cc: ORACLE-L
Subject: Re: Meaning of an OEM error
 
Not sure if you provided a screenshot, but that doesn’t give a lot to go on. 
What target type is the message from? Where are you seeing it?  What version 
OEM?


On Jun 1, 2020, at 9:55 AM, Reen, Elizabeth <dmarc-noreply@xxxxxxxxxxxxx 
<mailto:dmarc-noreply@xxxxxxxxxxxxx>> wrote:
 
                Data Failure Detected is the message.  When I click on that I 
go to a screen that does not give me any info. I know that OEM is trying to 
tell be something, I just don’t know what that is.
 
Thanks for any help you can give,
 
 
Liz

Other related posts: