Tasa de falla

Definición: La tasa de falla es la frecuencia con la que un activo o componente falla dentro de un período de operación determinado. Se expresa como el número de fallas por unidad de tiempo (típicamente fallas por hora) y es la métrica fundamental de la ingeniería de confiabilidad. Una tasa de falla más baja indica un activo más confiable.

¿Qué es la tasa de falla?

La tasa de falla mide con qué frecuencia falla un equipo durante la operación normal. Responde una pregunta directa: en promedio, ¿cuántas veces por unidad de tiempo fallará este activo?

Los equipos de mantenimiento utilizan la tasa de falla para comprender la confiabilidad del activo, establecer intervalos de mantenimiento y priorizar dónde invertir en monitoreo o mejoras. Es uno de los insumos fundamentales en el mantenimiento centrado en confiabilidad (RCM), el FMEA y los programas de mantenimiento basado en riesgos.

La tasa de falla se denota típicamente con la letra griega lambda (λ) y está matemáticamente relacionada con el tiempo medio entre fallas (MTBF), el tiempo medio hasta la falla (MTTF) y la confiabilidad general del activo.

Fórmula y cálculo de la tasa de falla

La fórmula estándar de la tasa de falla es:

λ = Número de fallas / Tiempo total de operación

El resultado se expresa en fallas por unidad de tiempo. Las unidades comunes incluyen fallas por hora, fallas por año o fallas por ciclo de operación, según el tipo de activo.

Ejemplo paso a paso

Supongamos que una bomba centrífuga opera de forma continua durante 12 meses. Durante ese período experimenta 3 fallas. El tiempo de operación (asumiendo operación continua) es de 8,760 horas por año.

  • Número de fallas: 3
  • Tiempo total de operación: 8,760 horas
  • Tasa de falla (λ): 3 / 8,760 = 0.000342 fallas por hora

Esto significa que la bomba falla aproximadamente 0.000342 veces por hora de operación, o aproximadamente una vez cada 2,920 horas bajo condiciones normales.

FIT: fallas en el tiempo

Para componentes con tasas de falla muy bajas (como partes electrónicas o sistemas de seguridad), la tasa de falla frecuentemente se expresa en FIT (fallas en el tiempo), donde:

1 FIT = 1 falla por 1,000,000,000 (10⁹) horas de dispositivo

FIT es común en el análisis de confiabilidad de semiconductores, automotriz y aeroespacial donde las tasas de falla son extremadamente pequeñas.

Tasa de falla vs MTBF

La tasa de falla y el MTBF describen la misma característica de confiabilidad desde diferentes perspectivas. El MTBF pregunta cuánto tiempo opera normalmente un activo entre fallas. La tasa de falla pregunta con qué frecuencia ocurren las fallas por unidad de tiempo. Son inversos matemáticos.

Métrica Fórmula Unidad Qué responde
Tasa de falla (λ) Fallas / Tiempo de operación Fallas por hora ¿Con qué frecuencia falla este activo?
MTBF 1 / λ (o Tiempo de operación / Fallas) Horas entre fallas ¿Cuánto tiempo transcurre entre fallas, en promedio?
MTTF Tiempo total de operación / Fallas (artículos no reparables) Horas hasta la primera falla ¿Cuánto tiempo pasa antes de que un componente nuevo falle por primera vez?
MTTR Tiempo total de reparación / Número de reparaciones Horas por reparación ¿Cuánto tiempo lleva restaurar el activo?

El MTBF es la forma más común de comunicar la confiabilidad a gerentes de mantenimiento y líderes de operaciones porque se expresa en unidades de tiempo familiares. La tasa de falla es preferida por los ingenieros de confiabilidad y estadísticos porque se integra directamente en los modelos de confiabilidad y cálculos de probabilidad.

Un punto importante: tanto el MTBF como la tasa de falla asumen una tasa de falla constante. Este supuesto solo es válido durante la fase de vida útil del activo. En las fases de mortalidad infantil y desgaste, la tasa de falla cambia y se necesitan modelos estadísticos más avanzados (como la distribución de Weibull).

La curva de bañera: cómo cambia la tasa de falla durante la vida de un activo

La curva de bañera es el modelo estándar utilizado en ingeniería de confiabilidad para describir cómo evoluciona la tasa de falla a lo largo de la vida operativa de un activo. La curva tiene forma de bañera al graficarse, con tasas de falla altas al inicio y al final de la vida y una tasa de falla baja y estable en el medio.

Las tres fases son:

Fase 1: Mortalidad infantil (tasa de falla decreciente)

Los activos recién comisionados tienen una tasa de falla elevada que decrece con el tiempo. Las fallas en esta fase son causadas por defectos de fabricación, errores de instalación, componentes deficientes y procedimientos de comisionamiento incorrectos.

Esta fase también se denomina "falla de vida temprana" o "falla de burn-in". Los fabricantes de componentes electrónicos a veces prueban los nuevos productos a niveles de estrés completos antes del envío para eliminar unidades defectuosas y reducir la tasa de falla efectiva que experimentan los usuarios finales.

Para los equipos de mantenimiento, la fase de mortalidad infantil significa que el equipo nuevo debe monitorearse más de cerca después de la instalación. Las tasas de falla tempranas altas no predicen la confiabilidad a largo plazo.

Fase 2: Vida útil (tasa de falla constante)

Durante la vida operativa normal, la tasa de falla se estabiliza en un nivel relativamente bajo y constante. Las fallas en esta fase son aleatorias e impredecibles. Son causadas por sobrecargas repentinas, errores de operadores, alteraciones inesperadas del proceso o variación aleatoria de componentes, no por desgaste sistemático.

Esta es la fase donde la planificación basada en MTBF es más precisa. Un activo en su fase de vida útil con un MTBF de 5,000 horas tiene una tasa de falla de 0.0002 fallas por hora, y esa tasa permanece aproximadamente constante hasta que el activo comienza a envejecer.

El mantenimiento preventivo basado en tiempo, cuando se aplica durante la fase de vida útil, puede no reducir las fallas aleatorias. El mantenimiento basado en condición y el monitoreo continuo frecuentemente son estrategias más rentables para esta fase.

Fase 3: Desgaste (tasa de falla creciente)

A medida que los componentes alcanzan el final de su vida de diseño, el desgaste, la corrosión, la fatiga y la degradación del material hacen que la tasa de falla aumente. Las fallas se vuelven más predecibles y frecuentes. Esta es la fase donde las tareas de reemplazo y revisión programadas son más valiosas.

Identificar cuándo un activo hace la transición a la fase de desgaste es una de las tareas más importantes en un programa de mantenimiento centrado en confiabilidad. Las tecnologías de monitoreo de condición como el análisis de vibraciones, el análisis de aceite y la termografía ayudan a detectar señales tempranas de degradación antes de que la tasa de falla se acelere.

Cómo cambia la tasa de falla con el tiempo

La curva de bañera muestra la forma general de la tasa de falla durante una vida útil, pero los activos individuales pueden exhibir diferentes patrones. Los ingenieros de confiabilidad utilizan la distribución de Weibull para modelar la tasa de falla con mayor precisión porque puede representar tasas de falla decrecientes, constantes o crecientes según el parámetro de forma (beta, β):

Forma de Weibull (β) Comportamiento de la tasa de falla Fase del ciclo de vida
β menor que 1 Tasa de falla decreciente Mortalidad infantil
β igual a 1 Tasa de falla constante Vida útil
β mayor que 1 Tasa de falla creciente Desgaste

Comprender el parámetro de forma de Weibull para una clase de activo determinada indica a los ingenieros de confiabilidad qué estrategia de mantenimiento es más apropiada y cuándo está justificada la intervención proactiva.

Cuando la tasa de falla observada de un activo comienza a superar su línea base histórica, esa es una señal clave para investigar las causas raíz, inspeccionar el desgaste y considerar si se aproxima el reemplazo o la revisión. Los modelos de vida útil restante utilizan las tendencias de tasa de falla para predecir exactamente cuándo es probable que falle un activo.

Cómo se usa la tasa de falla en la planificación de mantenimiento

La tasa de falla no es solo una métrica histórica. Es una herramienta de planificación activa. Los equipos de mantenimiento utilizan los datos de tasa de falla de las siguientes maneras:

Establecimiento de intervalos de mantenimiento preventivo

Los intervalos de mantenimiento preventivo deben ser menores que el tiempo esperado hasta la falla, calculado a partir de los datos de tasa de falla. Si un rodamiento tiene un MTBF de 4,000 horas (tasa de falla de 0.00025 fallas por hora), un intervalo de mantenimiento preventivo de entre 2,000 y 3,000 horas es generalmente apropiado. Establecer intervalos sin datos de tasa de falla lleva a exceso de mantenimiento (costo desperdiciado) o deficiencia de mantenimiento (fallas no planificadas).

Abastecimiento de refacciones

La tasa de falla determina con qué frecuencia deberá reemplazarse una refacción. Una tasa de falla más alta significa una tasa de consumo más rápida y un nivel de inventario recomendado más alto. Los equipos de gestión de inventario utilizan la tasa de falla junto con el tiempo de entrega para calcular los puntos de reorden y los niveles de inventario de seguridad para componentes críticos.

Priorización del monitoreo predictivo

Los activos con tasas de falla altas, o cuya tasa de falla está en tendencia ascendente, son los candidatos de mayor prioridad para el monitoreo continuo de condición. Desplegar sensores en estos activos primero ofrece la mayor reducción en tiempo de paro no planificado.

Priorización de mantenimiento basado en riesgos

En el mantenimiento basado en riesgos, el riesgo se calcula como el producto de la probabilidad de falla (derivada de la tasa de falla) y la consecuencia de la falla. Los activos con alta tasa de falla y alta consecuencia de falla se clasifican primero para recursos e inversión de mantenimiento.

Análisis de mantenimiento centrado en confiabilidad

El RCM utiliza datos de tasa de falla de registros históricos, especificaciones del fabricante y bases de datos de la industria para evaluar los modos de falla y seleccionar la tarea de mantenimiento más efectiva para cada uno. Sin datos precisos de tasa de falla, el análisis RCM se basa en supuestos en lugar de evidencia.

Tasa de falla en aplicaciones industriales

Las diferentes industrias aplican el análisis de tasa de falla en diferentes contextos. La fórmula subyacente es la misma, pero las fuentes de datos, los umbrales aceptables y las consecuencias de mantenimiento varían significativamente.

Industria Aplicación común Fuentes de datos típicas
Manufactura Establecimiento de intervalos de mantenimiento preventivo, análisis de OEE Historial de órdenes de trabajo en CMMS, datos del fabricante
Sector energético Pruebas de sistemas de seguridad (FFI), inspección de recipientes a presión Base de datos OREDA, historial de planta
Química Confiabilidad de procesos, sistemas instrumentados de seguridad Datos CCPS, registros del sitio
Alimentos y bebidas Confiabilidad de líneas de empaque, rendimiento de equipos higiénicos Registros internos de mantenimiento, especificaciones del fabricante
Minería Confiabilidad de equipos rotativos, componentes de camiones de acarreo Registros de flota, sistemas de seguimiento de componentes

En todas las industrias, la calidad del análisis de tasa de falla depende de la calidad de los datos de falla registrados. Los códigos de falla estandarizados en un CMMS hacen posible contar con precisión las fallas por modo, clase de activo y período de tiempo, lo que mejora la precisión de las tasas de falla calculadas.

Tasa de falla y confiabilidad: la relación matemática

Para un activo con tasa de falla constante (la fase de vida útil), la función de confiabilidad R(t) da la probabilidad de que el activo opere sin falla durante un período de tiempo t:

R(t) = e-λt

Donde e es el número de Euler (aproximadamente 2.718), λ es la tasa de falla y t es el tiempo de interés.

Por ejemplo, si un motor tiene una tasa de falla de 0.0001 fallas por hora, su confiabilidad en 1,000 horas es:

R(1000) = e-(0.0001 x 1000) = e-0.1 = aproximadamente 0.905, o 90.5% de confiabilidad.

Esto significa que el motor tiene una probabilidad del 90.5% de sobrevivir 1,000 horas sin falla. Los ingenieros de confiabilidad utilizan este cálculo para diseñar intervalos de mantenimiento que alcancen un nivel de confiabilidad objetivo, como 90%, 95% o 99.9%, según la criticidad del activo.

Cómo reducir la tasa de falla

Reducir la tasa de falla requiere abordar las causas raíz de la falla en lugar de simplemente responder a las fallas después de que ocurren. Los enfoques más efectivos son:

  • Monitoreo de condición: Detectar la degradación de forma temprana mediante análisis de vibraciones, análisis de aceite, termografía y ultrasonido permite a los equipos intervenir antes de que ocurran las fallas.
  • Análisis de causa raíz: Cada evento de falla debe activar un análisis de causa raíz para prevenir la recurrencia. Reparar repetidamente el mismo síntoma sin abordar la causa mantiene una tasa de falla alta.
  • Mantenimiento de precisión: El desalineamiento, el desequilibrio, la lubricación incorrecta y el torque inadecuado de sujetadores son causas principales de desgaste temprano y tasas de falla elevadas. Las prácticas precisas de instalación y mantenimiento reducen las fallas aleatorias durante la fase de vida útil.
  • Comisionamiento adecuado: Las fallas de mortalidad infantil frecuentemente son prevenibles. Las verificaciones de instalación minuciosas, la verificación de alineamiento y los procedimientos de rodaje reducen la tasa de falla en la fase de vida temprana.
  • Análisis de modos de falla y efectos: Identificar proactivamente los modos de falla de alto riesgo mediante FMEA permite a los equipos diseñar controles y tareas de mantenimiento antes de que se desarrollen tasas de falla altas.

Preguntas frecuentes

¿Qué significa una tasa de falla de 0?

Una tasa de falla de cero significa que el activo no experimentó fallas durante el período de observación. No significa que el activo nunca fallará. La tasa de falla es una medida estadística, y un período de observación corto sin fallas no predice de manera confiable el comportamiento a largo plazo.

¿Una tasa de falla más baja es siempre mejor?

En la mayoría de los casos, sí. Una tasa de falla más baja significa menos fallas, lo que implica menos tiempo de paro no planificado y menores costos de mantenimiento. Sin embargo, alcanzar una tasa de falla muy baja puede requerir inversión significativa en monitoreo, refacciones o mantenimiento más frecuente. La tasa de falla óptima es aquella que equilibra la confiabilidad con el costo total de mantenimiento.

¿Cómo se relaciona la tasa de falla con la disponibilidad del activo?

La tasa de falla afecta directamente la disponibilidad del activo. Las tasas de falla más altas significan eventos de tiempo de paro más frecuentes, lo que reduce la proporción de tiempo en que el activo está disponible para producir. La disponibilidad se calcula a partir del MTBF y el MTTR: Disponibilidad = MTBF / (MTBF + MTTR). Reducir la tasa de falla (y aumentar el MTBF) aumenta la disponibilidad sin requerir reparaciones más rápidas.

¿Se puede predecir la tasa de falla antes de instalar un activo?

Sí, hasta cierto punto. Las especificaciones de confiabilidad del fabricante, las bases de datos de la industria (como MIL-HDBK-217 para electrónica, OREDA para equipos de sector energético) y los datos históricos de activos similares pueden proporcionar estimaciones iniciales de la tasa de falla. Estas estimaciones se actualizan con el tiempo a medida que se recopilan datos operativos reales.

¿Cuál es la diferencia entre la tasa de falla y la probabilidad de falla?

La tasa de falla (λ) es la frecuencia de fallas por unidad de tiempo. La probabilidad de falla es la probabilidad de que ocurra una falla dentro de una ventana de tiempo especificada y se calcula a partir de la tasa de falla usando la función de confiabilidad R(t) = e-λt. La probabilidad condicional de falla extiende esto para tener en cuenta la edad: dado que un activo ha sobrevivido hasta el tiempo t, ¿cuál es la probabilidad de que falle en el siguiente pequeño intervalo?

¿Qué datos necesito para calcular la tasa de falla?

Necesitas dos datos: el número de fallas durante un período definido y el tiempo total de operación del activo durante ese período. Ambos datos deben estar disponibles en el historial de órdenes de trabajo de tu CMMS y en los registros de tiempo de operación del equipo. El registro preciso de códigos de falla en el CMMS es esencial para separar las fallas por modo y clase de activo.

La conclusión

La tasa de falla es uno de los conceptos más fundamentales en la ingeniería de confiabilidad y la planificación de mantenimiento. Cuantifica la frecuencia con que falla el equipo, se conecta directamente con los cálculos de MTBF y confiabilidad, y cambia durante la vida de un activo en patrones predecibles descritos por la curva de bañera.

Los equipos que miden la tasa de falla con precisión pueden establecer intervalos de mantenimiento preventivo basados en evidencia, abastecer las refacciones correctas, priorizar las inversiones en monitoreo de condición y detectar señales tempranas de desgaste antes de que ocurra una avería costosa. Los equipos que no rastrean la tasa de falla se ven obligados a tomar decisiones de mantenimiento basadas en intuición en lugar de datos.

El punto de partida son datos de falla confiables capturados en un CMMS con códigos de falla estandarizados. A partir de ahí, la tasa de falla se convierte en una herramienta activa para reducir el tiempo de paro no planificado y mejorar la confiabilidad de activos en cada clase de equipo.

Detecta tasas de falla en aumento antes de que se conviertan en averías

La solución de monitoreo de condición de TRACTIAN rastrea continuamente vibración, temperatura y corriente en tus activos críticos. Cuando la tasa de falla tiende al alza, lo ves primero y actúas antes de que ocurra la falla.

Explorar monitoreo de condición

Términos relacionados