Intervalo de detección de fallas (IDF)

Definición: Un intervalo de detección de fallas (IDF) es el tiempo máximo permitido entre pruebas funcionales sucesivas de una función oculta o protectora. Especifica con qué frecuencia los equipos de mantenimiento deben probar equipos dormidos, incluyendo alarmas, paradas de emergencia y sistemas de supresión de incendios, para garantizar que esos sistemas respondan correctamente cuando se requiera. El IDF es un resultado clave del análisis de mantenimiento centrado en la confiabilidad (MCC) y se calcula a partir de la no disponibilidad del sistema deseada y el tiempo medio entre fallas del dispositivo.

¿Qué es un intervalo de detección de fallas (IDF)?

Un intervalo de detección de fallas es una frecuencia de inspección programada diseñada para una clase específica de activo: equipos que realizan una función oculta. Las funciones ocultas son aquellas que no serán demandadas y, por tanto, cuya falla no se notará bajo condiciones normales de operación. La única manera de detectar si dicho equipo está en estado de falla es probarlo deliberadamente.

Los ejemplos incluyen un sistema de diluvio para supresión de incendios, una válvula de paro de emergencia, un generador diesel de respaldo y una válvula de alivio de alta presión. Estos activos permanecen dormidos por períodos prolongados. Si uno falla mientras está dormido, nadie lo sabe hasta que ocurre un incendio, una excursión del proceso o un corte de energía, momento en que la falla tiene consecuencias catastróficas.

El IDF responde una pregunta precisa: ¿con qué frecuencia debemos probar este dispositivo para mantener la probabilidad de que esté actualmente fallado por debajo de un umbral aceptable?

El concepto se origina en la metodología MCC, formalizada en documentos como SAE JA1011 y popularizada por el libro RCM II de John Moubray. Hoy es práctica estándar en sector energético, generación de energía, procesamiento químico, aviación y cualquier industria que depende fuertemente de capas protectoras.

Por qué las fallas ocultas necesitan su propia categoría de tarea de mantenimiento

La mayoría de las tareas de mantenimiento abordan fallas evidentes: degradación que produce ruido, calor, vibración o pérdida de rendimiento que los operadores o los sensores notarán. Para estas fallas, la frecuencia de la tarea se establece por la tasa de deterioro del activo, según lo rige la curva P-F.

Las fallas ocultas siguen una lógica completamente diferente. Una falla funcional de un dispositivo protector deja el sistema con un aspecto completamente normal. No suena ninguna alarma. Ninguna métrica de rendimiento cambia. Ningún operador nota nada inusual.

El peligro no es la falla oculta en sí misma. Es la combinación de la falla oculta con un segundo evento separado: la demanda sobre la función protectora. Esto se llama falla múltiple. Un sello de bomba puede fallar con el sistema de diluvio de incendios simultáneamente fuera de servicio. Ninguno de los dos eventos por sí solo causa una catástrofe. Juntos, pueden causarla.

Dado que el modo de falla es diferente, la lógica de mantenimiento es diferente. La tarea no es prevenir la falla: los equipos protectores frecuentemente fallan de forma aleatoria, sin un patrón relacionado con la edad que una tarea basada en tiempo pudiera interceptar. La tarea es encontrar la falla antes de que ocurra la demanda, probando el dispositivo con una frecuencia que mantenga la probabilidad de una falla no detectada aceptablemente baja.

La fórmula del IDF

La fórmula estándar de MCC para derivar un IDF es:

IDF = 2 × MTBF × P(no disponibilidad)

Donde:

  • MTBF es el tiempo medio entre fallas del dispositivo protector. Este es el intervalo promedio entre fallas funcionales ocultas: ¿con qué frecuencia, en promedio, falla silenciosamente este dispositivo?
  • P(no disponibilidad) es la probabilidad máxima aceptable de que el dispositivo esté actualmente en estado de falla en cualquier momento dado. Se expresa como decimal (por ejemplo, 0.05 para 5%).

Ejemplo práctico

Una instalación tiene un sistema de detección de gas. Según datos del fabricante y registros del sector, el sistema tiene un tiempo medio entre fallas ocultas de 8,000 horas. El caso de seguridad del sitio requiere una no disponibilidad máxima del 5% (0.05) para esta función protectora.

IDF = 2 × 8,000 × 0.05

IDF = 800 horas

El sistema de detección de gas debe probarse funcionalmente al menos cada 800 horas para mantener la probabilidad de que esté en estado de falla por debajo del 5%.

Si el MTBF o la no disponibilidad aceptable cambian, por ejemplo si la evaluación de riesgos ajusta el objetivo del 5% al 2%, el IDF debe recalcularse.

De dónde proviene la fórmula

La derivación asume que las fallas ocultas ocurren a una tasa de falla constante y aleatoria (distribución exponencial). Bajo este supuesto, la probabilidad de que el dispositivo haya fallado en cualquier momento entre dos pruebas sucesivas aumenta linealmente desde cero inmediatamente después de la última prueba hasta un máximo justo antes de la siguiente. La probabilidad promedio durante el intervalo completo es la mitad de la probabilidad al final del intervalo, por eso aparece el factor 2 en el denominador, o equivalentemente, por eso aparece 2 en el numerador en la forma estándar.

Esta es una aproximación apropiada para la planificación inicial. Se pueden aplicar cálculos más precisos usando distribuciones de falla reales (Weibull, por ejemplo) cuando hay suficientes datos de fallas disponibles.

IDF vs intervalo de mantenimiento preventivo: diferencias clave

Atributo IDF (tarea de detección de fallas) Intervalo estándar de MP
Aplica a Funciones ocultas: equipos de respaldo y protección Equipos activos en servicio con modos de falla evidentes
Visibilidad de la falla La falla no es aparente durante la operación normal La falla produce un síntoma inmediato y observable
Base del intervalo Probabilidad de no disponibilidad deseada y MTBF Tasa de degradación, intervalo P-F o recomendación del fabricante
Objetivo de la tarea Detectar una falla que ya ocurrió pero no se detectó Prevenir o reducir la probabilidad de la próxima falla
Tipo de tarea Prueba funcional Inspección, lubricación, calibración, reemplazo de componentes
Fuente del intervalo Análisis de riesgos/seguridad y fórmula estadística Datos del fabricante, análisis de ingeniería, registros históricos
Patrón de falla supuesto Aleatorio (sin relación con la edad) Relacionado con la edad (patrón de desgaste o fatiga)

Entender esta distinción es importante al construir una biblioteca de intervalos de mantenimiento. Las tareas IDF no deben tratarse como PMs ordinarios basados en tiempo: su lógica, documentación y justificación de programación son fundamentalmente diferentes.

Cómo encaja el IDF en el MCC

En un análisis formal de MCC, cada función de cada activo se evalúa a través de un árbol de lógica estructurado. Cada función se clasifica primero como evidente u oculta. Para las funciones evidentes, las opciones de tareas de mantenimiento incluyen respuestas basadas en condición, basadas en tiempo o de rediseño. Para las funciones ocultas, la primera pregunta siempre es: ¿puede identificarse una tarea de detección de fallas que reduzca el riesgo de falla múltiple a un nivel aceptable?

El componente AMEF del estudio de MCC identifica cada modo de falla oculto y sus efectos. El cálculo del IDF luego proporciona la frecuencia de prueba necesaria para gestionar ese riesgo. Si ninguna tarea práctica de detección de fallas puede reducir el riesgo suficientemente, el proceso de MCC escala hacia el rediseño: agregar redundancia, cambiar la arquitectura del sistema o modificar el contexto operativo para eliminar el modo de falla oculto.

Las tareas de IDF se documentan en el plan de mantenimiento con una descripción específica de la tarea (qué constituye exactamente una prueba funcional), la frecuencia requerida, los criterios de aceptación (qué resultado confirma que el dispositivo es funcional) y la acción de restauración si se encuentra el dispositivo fallado.

Aplicar el IDF en la práctica

Clases de activos comunes que requieren tareas IDF

Cualquier sistema cuyo único propósito es responder a una condición de demanda anormal es candidato para la gestión por IDF. Los ejemplos más comunes son:

  • Sistemas de detección de fuego y gas. Los detectores de humo, calor, gas combustible y llama están dormidos hasta que ocurre un incendio o una liberación de gas. Su tasa de falla oculta y las consecuencias de la no disponibilidad durante un incendio impulsan el cálculo del IDF.
  • Sistemas de supresión de incendios. Los sistemas de rociadores, diluvio y supresión gaseosa deben accionarse o inspeccionarse periódicamente para confirmar que operarán correctamente ante una demanda.
  • Sistemas de paro de emergencia (ESD/ESDV). Estas válvulas y sistemas lógicos están diseñados para cerrarse ante una excursión del proceso. Pueden estar dormidos durante meses o años. Las tasas de disparo espurio deben equilibrarse contra el riesgo de no cerrarse cuando se demanda, lo que determina tanto el IDF como la probabilidad de falla aceptable.
  • Equipos de respaldo. Las bombas de respaldo, generadores de respaldo y sistemas HVAC de respaldo requieren pruebas de marcha regulares para verificar que arrancarán y funcionarán según especificaciones cuando el sistema primario falle. El IDF rige con qué frecuencia deben ocurrir estas pruebas de marcha.
  • Válvulas de alivio de presión. Las válvulas de alivio que protegen los recipientes de la sobrepresión son una función oculta clásica. Se prueban levantándolas para confirmar que la presión de ajuste no se ha desviado y que la válvula se abrirá libremente cuando se requiera.
  • Relés de protección e interruptores de circuito. En los sistemas eléctricos, los relés de protección detectan condiciones de falla y ordenan a los interruptores de circuito que abran. Si el relé o el interruptor han fallado silenciosamente, una falla no será interrumpida. Las pruebas de IDF implican inyectar una señal de prueba para verificar la captación del relé y la operación del interruptor.

Establecer el objetivo de no disponibilidad aceptable

La probabilidad de no disponibilidad P(no disponibilidad) usada en la fórmula del IDF no es arbitraria. Debe determinarse mediante una evaluación de riesgos que considere:

  • La severidad de la consecuencia de la falla múltiple (seguridad, ambiental, operativa)
  • Los estándares regulatorios e industriales que especifican niveles mínimos de integridad (por ejemplo, los Niveles de Integridad de Seguridad de la IEC 61511 para sistemas de seguridad de procesos)
  • La frecuencia con la que se espera que ocurra la falla primaria, o la demanda sobre la función protectora
  • Si existen otras capas protectoras que reduzcan el riesgo neto

Para funciones críticas de seguridad, los objetivos de no disponibilidad típicamente están en el rango de entre 1% y 10%, dependiendo de la severidad de las consecuencias y el Nivel de Integridad de Seguridad (SIL) asignado a la función. Para funciones protectoras menos críticas, puede ser aceptable una mayor no disponibilidad. El marco de probabilidad condicional de falla usado en los programas de mantenimiento basado en riesgos proporciona una base estructurada para estas decisiones.

Qué sucede cuando se encuentra un dispositivo fallado

Una prueba funcional que revela un estado de falla no es un fallo de mantenimiento: es el sistema funcionando exactamente como fue diseñado. El propósito del IDF es encontrar fallas ocultas antes de que ocurra una demanda. Cuando se encuentra una falla:

  1. El dispositivo se restaura a un estado funcional inmediatamente (reparación o reemplazo).
  2. La falla se registra con la fecha de la última prueba exitosa. Esto proporciona un límite superior del tiempo que el dispositivo estuvo no disponible.
  3. El evento de falla se añade al registro histórico del dispositivo. A medida que este registro se acumula, el MTBF real puede estimarse y compararse con el valor usado en el cálculo del IDF.
  4. Si se encuentran fallas a una tasa que sugiere que el MTBF real es significativamente más corto de lo asumido, el IDF debe acortarse para mantener la no disponibilidad objetivo.

Este ciclo de retroalimentación de probar, encontrar, registrar, analizar y ajustar es lo que hace de la gestión del IDF un programa vivo en lugar de un calendario estático. También es lo que separa un programa maduro de mantenimiento basado en riesgos de uno donde los intervalos se establecen una vez y nunca se revisan.

Integrar el IDF en el calendario de mantenimiento

Las tareas de IDF se programan en el mismo sistema de gestión de mantenimiento que todas las demás órdenes de trabajo. Sin embargo, algunas consideraciones prácticas son específicas de las tareas de detección de fallas:

La tarea debe ser una prueba funcional genuina. Una inspección visual de un cabezal de rociador no es una prueba funcional del sistema de rociadores. La prueba debe verificar realmente que la función protectora operará correctamente bajo sus condiciones requeridas. Las pruebas parciales o las medidas indirectas que no confirman la funcionalidad completa no satisfacen el requisito del IDF.

Acceso y seguridad durante las pruebas. Muchas pruebas funcionales implican deshabilitar o desviar temporalmente la función protectora para probarla. Esto crea una ventana de no disponibilidad. La buena práctica de mantenimiento minimiza esta ventana, la documenta y garantiza que otras capas protectoras estén en su lugar durante el período de prueba.

Mantenimiento de registros. Las auditorías regulatorias y los casos de seguridad requieren evidencia de que las tareas de IDF se han llevado a cabo a la frecuencia requerida y que los resultados se han registrado. Las órdenes de trabajo deben capturar el procedimiento de prueba seguido, el resultado (aprobado o reprobado) y cualquier acción correctiva tomada.

El IDF y el monitoreo moderno de condición

Para algunos dispositivos protectores, las técnicas continuas o periódicas de mantenimiento basado en condición pueden complementar o reemplazar las pruebas funcionales tradicionales. Las características de autodiagnóstico en los sistemas instrumentados de seguridad modernos, por ejemplo, detectan algunos modos de falla de forma continua, lo que efectivamente reduce la tasa de falla detectable y puede apoyar un IDF más largo sin aumentar la no disponibilidad.

Las pruebas de carrera parcial en línea de las válvulas de paro de emergencia permiten probar una porción del recorrido de la válvula durante la operación normal sin cerrar completamente el proceso. Esto prueba algunos modos de falla (trabe mecánico, falla del actuador) mientras evita la interrupción operativa de una prueba de carrera completa, y puede apoyar frecuencias de prueba más altas que de otro modo serían operativamente impracticables.

Las tecnologías de mantenimiento predictivo, incluyendo el análisis de vibración, el análisis de la firma de corriente eléctrica y la termografía, pueden detectar degradación en equipos de respaldo que una prueba funcional de aprobado/reprobado binaria no captaría. Integrar estas señales junto con las tareas de IDF programadas da un panorama más completo de la salud del sistema protector.

El principio clave es que cualquier técnica de monitoreo utilizada para reducir o reemplazar una tarea de IDF debe ser demostrablemente efectiva para detectar los modos de falla específicos que el IDF fue diseñado para encontrar. La lógica es la misma; solo cambia la tecnología.

Errores comunes en la gestión del IDF

Usar un calendario fijo sin cálculo. Muchos programas de mantenimiento asignan intervalos de prueba a equipos protectores basándose en las recomendaciones del fabricante, los mínimos regulatorios o la costumbre, en lugar de calcularlos a partir del MTBF y los objetivos de no disponibilidad. Esto puede resultar en intervalos mucho más largos de lo que justifica el perfil de riesgo.

Tratar el IDF como un máximo en lugar de un objetivo. El IDF define el intervalo máximo permitido consistente con la no disponibilidad objetivo. Probar con más frecuencia siempre es permisible y puede ser apropiado cuando el acceso operativo lo facilita. Probar con menos frecuencia viola el objetivo de seguridad o riesgo.

No registrar los resultados de las pruebas de manera consistente. El valor del programa de detección de fallas depende completamente de la calidad de los registros de fallas. Si los dispositivos fallados se restauran sin documentación, la estimación del MTBF nunca se corrige y el IDF permanece basado en supuestos en lugar de evidencia.

Confundir la tarea de IDF con la tarea de restauración. La tarea de IDF es la prueba. Si la prueba revela una falla, debe levantarse una orden de trabajo de mantenimiento correctivo separada para restaurar el dispositivo. Mezclar estas dos actividades en la misma orden de trabajo dificulta el seguimiento preciso de las ocurrencias de fallas.

Ignorar las fallas de causa común. Cuando se instalan múltiples dispositivos protectores idénticos en paralelo (lazos de seguridad redundantes, por ejemplo), una sola causa puede fallar a todos simultáneamente. Los cálculos de IDF que suponen modos de falla independientes subestimarán la verdadera no disponibilidad del sistema. Escalonar las pruebas de los dispositivos redundantes ayuda a detectar las fallas de causa común que las pruebas sincronizadas pasarían por alto.

Preguntas frecuentes

¿El IDF es lo mismo que una prueba de comprobación?

Los términos se usan frecuentemente de forma intercambiable en la práctica. En la IEC 61511 y la literatura de seguridad de procesos, el término "prueba de comprobación" se usa para las pruebas funcionales de los componentes del sistema instrumentado de seguridad. El IDF es el intervalo derivado del MCC con el que debe realizarse la prueba de comprobación. El método de cálculo, el objetivo y los requisitos de documentación son los mismos.

¿Qué pasa si no hay datos de MTBF disponibles para el dispositivo protector?

Cuando los datos de MTBF no están disponibles, los ingenieros usan bases de datos genéricas del sector (OREDA, EXIDA, IEEE 493), datos de confiabilidad del fabricante o estimaciones conservadoras de clases de dispositivos similares. El IDF inicial debe inclinarse hacia pruebas más frecuentes, con el intervalo extendido a medida que se acumulan datos reales del sitio. Un análisis de sensibilidad, que recalcula el IDF en un rango de supuestos de MTBF, ayuda a cuantificar la incertidumbre y establecer un punto de partida conservador.

¿El IDF se aplica de manera diferente a los sistemas redundantes?

Sí. Cuando se instalan canales protectores redundantes (por ejemplo, una configuración de votación 2 de 3), la no disponibilidad del sistema general es menor que la no disponibilidad de cualquier canal individual. La fórmula de no disponibilidad del sistema considera la configuración de redundancia. Esto significa que cada canal individual puede probarse con menos frecuencia de lo que requeriría un sistema de un solo canal, mientras se mantiene el mismo objetivo de no disponibilidad del sistema general. El cálculo debe hacerse a nivel del sistema, no del componente individual.

¿Cómo se relaciona el IDF con la disponibilidad de activos?

El IDF se calcula para controlar la no disponibilidad de la función protectora, que es un tipo específico de preocupación de disponibilidad de activos. Sin embargo, las propias pruebas introducen un breve período de no disponibilidad planificada. Para los sistemas protectores que deben sacarse de línea para ser probados, el tiempo que el sistema está fuera de servicio para las pruebas debe incluirse en el cálculo de disponibilidad general de la capa de seguridad. Esta es una razón por la que los métodos de prueba en línea modernos (prueba de carrera parcial, autodiagnósticos) son preferidos para las aplicaciones críticas.

¿Se usa el IDF fuera de los programas de MCC?

Los cálculos de IDF se usan siempre que los intervalos de mantenimiento para equipos protectores o de respaldo necesiten justificarse formalmente. Los marcos regulatorios para la seguridad de procesos, la energía nuclear, el mantenimiento de aviación y los sistemas de defensa requieren evidencia de que las frecuencias de prueba de equipos protectores se fundamentan en una evaluación cuantitativa del riesgo. La fórmula del IDF es la herramienta estándar para proporcionar esa evidencia, independientemente de si el programa de mantenimiento general está estructurado formalmente como MCC.

La conclusión

El intervalo de detección de fallas es la base cuantitativa para probar los equipos de respaldo y protección con la frecuencia correcta. Reemplaza las conjeturas con un cálculo fundamentado en el riesgo y defendible que equilibra el costo de la inspección contra la probabilidad de que la falla oculta pase desapercibida y contribuya a un evento peligroso o con impacto en la producción.

En industrias reguladas como el sector energético, la energía nuclear y la aviación, los cálculos de IDF no son opcionales: son requisitos de auditoría vinculados a casos de seguridad formales. Para los equipos de mantenimiento en entornos menos estrictamente regulados, aplicar la metodología del IDF a las pruebas de funciones ocultas mejora la calidad del programa y proporciona la documentación necesaria para justificar los intervalos de inspección ante ingenieros, gerentes y reguladores por igual.

Detecta fallas ocultas antes de que ocurra una demanda

La gestión del IDF requiere datos de fallas precisos, registros de pruebas consistentes y la capacidad de actuar rápidamente cuando se encuentra un dispositivo protector fallado. La plataforma de monitoreo de condición de Tractian monitorea continuamente la salud de los activos críticos y de respaldo, genera órdenes de trabajo automáticamente en el intervalo de IDF requerido y registra cada resultado de prueba en un solo lugar, dando a tu equipo de confiabilidad los datos necesarios para validar y refinar tus intervalos a lo largo del tiempo.

Ver monitoreo de condición

Términos relacionados