Análisis de fallas

Definición: El análisis de fallas es la investigación sistemática de por qué un activo, componente o sistema no pudo realizar su función prevista. Identifica el modo de falla, el mecanismo físico y la causa raíz subyacente para que se puedan tomar acciones correctivas y prevenir que la falla se repita.

¿Qué es el análisis de fallas?

El análisis de fallas es el proceso estructurado de examinar un activo o componente fallado, entender cómo y por qué falló, y usar esos hallazgos para orientar las acciones correctivas y preventivas.

Se utiliza en manufactura, energía, aeroespacial, producción de alimentos y cualquier industria donde la falla de equipo crea riesgos de seguridad, pérdidas de producción o costos de reparación significativos.

Una investigación de análisis de fallas responde tres preguntas:

  • ¿Qué falló y cómo falló (el modo de falla y el mecanismo)?
  • ¿Por qué falló (la causa raíz)?
  • ¿Qué cambios evitarán que falle de nuevo?

Sin respuestas a las tres, los equipos de mantenimiento se quedan reparando síntomas en lugar de eliminar causas.

Por qué importa el análisis de fallas en el mantenimiento

La mayoría de las fallas no planificadas no son aleatorias. Siguen patrones identificables, desencadenados por condiciones específicas como desalineación, contaminación, lubricación inadecuada o limitaciones de diseño.

El mantenimiento no planificado es entre dos y cinco veces más caro que el trabajo programado, al considerar la mano de obra de emergencia, las refacciones aceleradas y la producción perdida.

El análisis de fallas convierte los eventos reactivos en conocimiento de confiabilidad. Cada investigación produce hallazgos que pueden reducir la tasa de falla de una clase de activo similar, ajustar los intervalos de mantenimiento preventivo o justificar un cambio de diseño que elimine permanentemente el modo de falla.

Con el tiempo, un programa estructurado de análisis de fallas eleva el Tiempo Medio Entre Fallas (MTBF), reduce el costo de mantenimiento por unidad de producción y genera el conocimiento institucional que respalda la toma de decisiones centrada en la confiabilidad.

Tipos de análisis de fallas

Los diferentes métodos de análisis de fallas sirven para diferentes propósitos. Algunos son reactivos (aplicados después de que ocurre una falla); otros son proactivos (usados durante el diseño o para anticipar fallas futuras).

Análisis de causa raíz (ACR)

El análisis de causa raíz es un método estructurado para rastrear una falla hasta su causa originaria. Es la forma más común de análisis de fallas aplicada después de un evento no planificado.

El ACR usa herramientas como los 5 Por Qués, los diagramas de espina de pescado (Ishikawa) y los árboles de fallas para eliminar sistemáticamente los factores contribuyentes y aislar la causa raíz real.

El resultado es un plan de acción correctiva que aborda la causa en lugar del síntoma.

Análisis de modos y efectos de falla (AMEF)

El AMEF es un método proactivo que identifica los modos de falla potenciales antes de que ocurran y evalúa sus efectos sobre el sistema. Cada modo de falla se califica en severidad, probabilidad de ocurrencia y detectabilidad para producir un Número de Prioridad de Riesgo (NPR).

El AMEF se usa durante el diseño de equipos, el diseño de procesos y la planificación del mantenimiento para priorizar los esfuerzos de reducción de riesgos. Dos variantes comunes son el AMEF de diseño (aplicado en la etapa de diseño) y el AMEF de proceso (aplicado a los procesos de manufactura).

Análisis de criticidad y modos y efectos de falla (AMECA)

El AMECA amplía el AMEF añadiendo una clasificación de criticidad, que pondera cada modo de falla tanto por la probabilidad de ocurrencia como por la severidad de las consecuencias. Esto produce una lista priorizada de modos de falla que requieren más atención en la planificación del mantenimiento.

El AMECA se usa ampliamente en las industrias aeroespacial, de defensa y de procesos donde ciertos modos de falla conllevan consecuencias catastróficas o críticas para la seguridad.

Análisis de árbol de fallas (AAF)

El análisis de árbol de fallas es un método deductivo de arriba hacia abajo. Comienza con un evento no deseado definido (como una bomba que se detiene) y trabaja hacia atrás a través de un diagrama lógico para identificar todas las combinaciones de eventos y condiciones que podrían causarlo.

El AAF es particularmente útil para sistemas complejos donde múltiples rutas de falla pueden llevar al mismo resultado. Es común en las industrias nuclear, química y de aviación.

Sistema de reporte, análisis y acción correctiva de fallas (FRACAS)

El FRACAS es un proceso de ciclo cerrado para capturar datos de fallas, analizarlos y verificar que las acciones correctivas sean efectivas. A diferencia de una investigación de un solo evento, el FRACAS opera continuamente en todos los activos y eventos de falla.

El FRACAS alimenta datos en los programas de confiabilidad y permite el análisis de tendencias en poblaciones de activos similares, convirtiéndolo en uno de los marcos de análisis de fallas de largo plazo más poderosos.

Análisis de fallas en campo

El análisis de fallas en campo investiga las fallas que ocurren en entornos operativos en lugar de en condiciones de prueba controladas. Se usa cuando un componente falla en servicio y la falla debe analizarse en contexto, incorporando las condiciones operativas reales, los ciclos de carga y los factores ambientales.

Análisis físico de fallas

El análisis físico de fallas examina el componente fallado directamente usando técnicas de ciencia de materiales: análisis metalúrgico, microscopía electrónica de barrido, espectroscopía y pruebas de dureza.

Este método identifica el mecanismo físico (corrosión, fatiga, desgaste, fractura, sobrecalentamiento) y apoya la investigación más amplia de causa raíz al confirmar qué le sucedió al material.

Proceso de análisis de fallas: paso a paso

El proceso de análisis de fallas sigue una secuencia consistente independientemente del método específico utilizado.

Paso 1: Definir el problema

Describe qué falló, cuándo, bajo qué condiciones operativas y cuáles fueron las consecuencias. Un planteamiento preciso del problema previene la dispersión del alcance y enfoca la investigación en la evidencia correcta.

Paso 2: Recopilar evidencia

Reúne el componente fallado, los registros de mantenimiento, los datos de sensores, los registros del operador y cualquier fotografía tomada en el momento de la falla. Preserva la evidencia física antes de que el sitio sea limpiado o el componente sea descartado.

El historial de mantenimiento de un CMMS y los datos de monitoreo de condición son fuentes de evidencia primarias que revelan tendencias previas a la falla.

Paso 3: Examinar el componente fallado

Aplica primero la inspección visual, luego las pruebas no destructivas y finalmente el examen destructivo donde sea necesario. Documenta lo que se encuentra en cada etapa antes de proceder a la siguiente.

Las técnicas incluyen análisis de vibración, análisis de aceite, termografía, inspección ultrasónica y examen metalúrgico según el tipo de activo y el mecanismo de falla.

Paso 4: Identificar el modo de falla y el mecanismo

El modo de falla es la forma en que el activo dejó de realizar su función (fractura, desgaste excesivo, pérdida de sello, cortocircuito eléctrico). El mecanismo de falla es el proceso físico o químico que causó el modo de falla (fatiga, corrosión, erosión, degradación térmica).

Estos dos elementos describen qué sucedió, pero aún no por qué.

Paso 5: Determinar la causa raíz

Rastrea el modo de falla y el mecanismo hasta su causa originaria usando un método estructurado como los 5 Por Qués, el diagrama de espina de pescado o el árbol de fallas.

Las causas raíz generalmente caen en tres categorías:

  • Causas físicas: defecto de material, especificación incorrecta, falla de fabricación
  • Causas humanas: instalación incorrecta, lubricación inadecuada, operación inapropiada
  • Causas latentes u organizacionales: procedimientos inadecuados, falta de capacitación, intervalos de inspección deficientes

Paso 6: Desarrollar e implementar acciones correctivas

Define acciones específicas que aborden la causa raíz, asigna responsables y establece fechas de cumplimiento. Las acciones correctivas pueden incluir cambios de diseño, procedimientos actualizados, nuevas tareas de inspección, ajustes de refacciones o capacitación de operadores.

Verifica la efectividad después de la implementación monitoreando el activo y comprobando si la falla se repite.

Análisis de fallas vs análisis de causa raíz

Estos términos se usan frecuentemente de forma intercambiable, pero tienen significados distintos en un programa de mantenimiento riguroso.

Aspecto Análisis de fallas Análisis de causa raíz (ACR)
Alcance Amplio: cubre inspección física, identificación del mecanismo y causa raíz Enfocado: rastrea síntomas hasta su causa originaria
Momento de aplicación Reactivo (post-falla) o proactivo (AMEF, FRACAS) Principalmente reactivo, aplicado después de un evento
Resultado Modo de falla, mecanismo, causa raíz, acción correctiva Causa raíz y acción correctiva
Relación Contiene el ACR como una fase Es un componente del análisis de fallas
Herramientas Inspección física, análisis de laboratorio, AMEF, FRACAS, AAF, ACR 5 Por Qués, diagrama de espina de pescado, árbol de fallas
Quién lo usa Ingenieros de confiabilidad, metalurgistas, equipos de mantenimiento Gerentes de mantenimiento, equipos de calidad, líderes de operaciones

En la práctica: el análisis de fallas es la investigación completa; el ACR es la fase analítica que identifica la causa originaria dentro de esa investigación.

Cómo el análisis de fallas mejora la estrategia de mantenimiento

Los hallazgos del análisis de fallas tienen aplicaciones directas en cómo se diseñan y ejecutan los programas de mantenimiento.

Alimentar el mantenimiento centrado en la confiabilidad

El mantenimiento centrado en la confiabilidad (MCC) depende de conocer qué modos de falla son más probables, más importantes y más detectables. Los datos del análisis de fallas alimentan estos insumos, haciendo que las decisiones del MCC se basen en evidencia en lugar de suposiciones.

Ajustar los intervalos de mantenimiento preventivo

Cuando el análisis de fallas revela que un activo falla consistentemente entre los ciclos de PM programados, el intervalo está mal. Cuando los activos se reemplazan consistentemente mucho antes de mostrar cualquier signo de degradación, el intervalo es demasiado corto. El análisis de fallas impulsa los datos que justifican los ajustes de intervalos.

Esto mejora directamente la eficiencia del mantenimiento preventivo y reduce los costos innecesarios de mano de obra y refacciones.

Habilitar el mantenimiento predictivo

Entender qué mecanismos físicos preceden a la falla permite a los equipos seleccionar los sensores y técnicas de monitoreo correctos. Si el análisis de fallas muestra que la degradación de rodamientos precede a la falla del motor, el monitoreo de vibración y temperatura puede detectar esa degradación tempranamente, habilitando la intervención de mantenimiento predictivo antes de que el activo falle.

La curva P-F formaliza esta relación: la brecha entre la falla potencial (cuando un defecto se vuelve detectable) y la falla funcional (cuando el activo deja de funcionar) define cuánto tiempo está disponible para la intervención basada en condición.

Reducir las fallas repetidas

Sin análisis de fallas, los equipos corrigen la misma falla repetidamente. Con él, identifican si la causa es un problema de diseño, una brecha en los procedimientos o una condición operativa, y la abordan en la fuente. Este es el mecanismo por el cual el MTBF aumenta con el tiempo.

Mejorar las decisiones de refacciones

El análisis de fallas revela qué componentes fallan con más frecuencia y bajo qué condiciones. Estos datos respaldan una planificación del inventario de refacciones más precisa, reduciendo tanto los desabastecimientos como el exceso de inventario.

Apoyar el análisis de criticidad

El análisis de criticidad clasifica los activos según las consecuencias de su falla. El análisis de fallas proporciona los datos de tasa de falla y severidad que hacen precisas las clasificaciones de criticidad.

El análisis de fallas en el contexto de la salud de activos

El análisis de fallas es más efectivo cuando se integra con el monitoreo continuo de la salud de activos. Los datos de sensores en tiempo real capturan las condiciones operativas en el momento de la falla, proporcionando un contexto que una inspección post-falla sola no puede recuperar.

Las plataformas de monitoreo de condición que registran vibración, temperatura, presión y firmas eléctricas crean un rastro de datos previo a la falla. Cuando ocurre una falla, los analistas pueden revisar ese rastro para identificar el inicio de la degradación y correlacionarlo con eventos operativos específicos.

Esta integración acorta el tiempo de investigación, mejora la precisión y facilita la detección de la misma firma en activos similares antes de que fallen.

Los flujos de trabajo de mantenimiento correctivo también se benefician de esta integración: las órdenes de trabajo de mantenimiento correctivo pueden vincularse a los hallazgos del análisis de fallas, asegurando que la reparación aborde la causa confirmada en lugar de simplemente restaurar la función.

Herramientas y software usados en el análisis de fallas

Instrumentos de diagnóstico

  • Analizadores de vibración: detectan desequilibrio mecánico, desalineación, defectos en rodamientos y resonancia
  • Cámaras termográficas: identifican puntos calientes por fallas eléctricas o fricción
  • Detectores ultrasónicos: detectan fugas, descarga eléctrica y fallas incipientes en rodamientos
  • Kits de análisis de aceite: identifican contaminación, partículas de desgaste y degradación del lubricante
  • Equipos de pruebas no destructivas: incluyen calibradores de espesor ultrasónicos, pruebas de partículas magnéticas e instrumentos de corriente de Foucault

Plataformas de software

  • Software de monitoreo de condición: agrega datos de sensores, detecta anomalías y activa alertas cuando las firmas indican fallas en desarrollo
  • CMMS (Sistema Computarizado de Gestión de Mantenimiento): almacena el historial de mantenimiento, los datos de órdenes de trabajo y los registros de acciones correctivas que proporcionan el contexto operativo para las investigaciones de fallas
  • Software de AMEF: herramientas estructuradas para completar y documentar hojas de trabajo de AMEF y AMECA
  • Plataformas FRACAS: sistemas de ciclo cerrado que capturan informes de fallas, rastrean investigaciones y verifican la efectividad de las acciones correctivas
  • Software APM: plataformas de gestión del rendimiento de activos que combinan monitoreo, análisis y flujos de trabajo de confiabilidad en una sola interfaz

Las plataformas integradas que conectan los datos de condición con los flujos de trabajo de mantenimiento dan a los equipos de confiabilidad el camino más rápido desde la detección de la falla hasta la resolución verificada.

Análisis de fallas: aplicaciones reactivas vs proactivas

Tipo de aplicación Cuándo se aplica Método principal Objetivo
Investigación post-falla Después de una falla no planificada ACR, examen físico Prevenir la recurrencia
Revisión de diseño Durante el diseño del producto o equipo AMEF de diseño, AMECA Eliminar modos de falla antes de la manufactura
Revisión de proceso Durante el diseño o cambio del proceso AMEF de proceso Identificar riesgos de falla inducidos por el proceso
Mejora continua de la confiabilidad Continuo, en todos los eventos de falla FRACAS Construir base de conocimiento de fallas, rastrear tendencias
Análisis de seguridad de sistemas Para sistemas críticos para la seguridad AAF Mapear todas las rutas de falla que conducen a un evento peligroso

Errores comunes en el análisis de fallas

Saltar a la acción correctiva antes de confirmar la causa raíz. Los equipos bajo presión de producción frecuentemente reparan y reinician el equipo sin completar la investigación. La falla se repite porque la causa nunca fue abordada.

Confundir el modo de falla con la causa raíz. Una falla de rodamiento es un modo de falla. La causa raíz podría ser lubricante contaminado, instalación incorrecta o desalineación del eje. Reemplazar el rodamiento sin abordar la causa no resuelve el problema.

Descartar o contaminar la evidencia física. Una vez que el sitio es limpiado o un componente es descartado, la evidencia crítica desaparece. Preservar el componente fallado y documentar las condiciones circundantes antes de comenzar cualquier trabajo es esencial.

Investigar de forma aislada. El análisis de fallas produce el mayor valor cuando los hallazgos se comparten entre poblaciones de activos similares y se alimentan en un FRACAS o base de datos de confiabilidad. Las investigaciones que permanecen aisladas en un solo sitio o equipo no escalan.

No verificar la efectividad de la acción correctiva. Un análisis de fallas no está completo hasta que la acción correctiva se haya implementado y confirmado que funciona. Sin seguimiento, el ciclo de investigación se rompe.

Preguntas frecuentes

¿Cuándo debe realizarse un análisis de fallas?

El análisis de fallas debe realizarse después de cualquier falla no planificada que resulte en tiempo de paro significativo, riesgo de seguridad, pérdida de calidad o costo. También debe activarse cuando se identifica un patrón de falla recurrente, incluso si los eventos individuales parecen menores. Algunas organizaciones establecen umbrales basados en el costo de reparación o el impacto en la producción para determinar cuándo se justifica una investigación formal frente a una respuesta estándar de mantenimiento correctivo.

¿Quién realiza el análisis de fallas?

El investigador principal es típicamente un ingeniero de confiabilidad o un técnico de mantenimiento senior con experiencia en el tipo de activo relevante. El análisis físico de fallas que involucra ciencia de materiales o metalurgia puede requerir un especialista o laboratorio. Las revisiones de AMEF y AMECA se realizan típicamente por equipos multifuncionales que incluyen mantenimiento, operaciones, ingeniería y calidad.

¿Cuánto tiempo lleva un análisis de fallas?

Una investigación básica post-falla usando ACR puede tomar desde unas pocas horas hasta varios días, dependiendo de la disponibilidad de evidencia y la profundidad de la investigación. El análisis físico de fallas que involucra pruebas de laboratorio puede tomar semanas. Los métodos proactivos como el AMEF son típicamente actividades planificadas que se ejecutan durante días o semanas como parte de un proyecto.

¿Cuál es la diferencia entre el análisis de fallas y el análisis de modos de falla?

El análisis de modos de falla identifica y documenta las formas en que un activo puede fallar, lo cual es un componente de una investigación de análisis de fallas más amplia. El análisis de fallas abarca la investigación completa: identificar el modo de falla, determinar el mecanismo físico, rastrear la causa raíz y definir acciones correctivas.

¿El análisis de fallas es lo mismo que el Intervalo de Detección de Fallas (IDF)?

No. El análisis de fallas es el proceso de investigación aplicado después (o en anticipación) de una falla. El Intervalo de Detección de Fallas es un intervalo de tareas de mantenimiento usado para modos de falla ocultos, que especifica con qué frecuencia debe probarse un dispositivo de protección o función redundante para verificar que sigue siendo operativo. Ambos conceptos se relacionan con la gestión de fallas, pero operan en diferentes etapas del proceso de confiabilidad.

¿Puede automatizarse el análisis de fallas?

Partes del proceso pueden acelerarse con tecnología. Las plataformas de monitoreo de condición con detección de anomalías pueden señalar automáticamente las señales que se desvían y activar un flujo de trabajo de investigación. Las herramientas de diagnóstico asistidas por IA pueden sugerir causas probables de falla basadas en patrones de sensores. Sin embargo, los pasos que requieren juicio, incluyendo la determinación de la causa raíz y el desarrollo de acciones correctivas, aún requieren análisis humano especializado.

La conclusión

El análisis de fallas es la disciplina que evita que el mantenimiento se convierta en un ejercicio permanente de control de daños. Cuando cada falla significativa se analiza hasta su causa raíz y las acciones correctivas se implementan y verifican, la tasa de falla de ese modo de falla disminuye con el tiempo. La alternativa, reparar sin entender, produce las mismas fallas en el mismo calendario indefinidamente.

Los programas de análisis de fallas más efectivos están integrados con la infraestructura de CMMS y monitoreo de condición. Cuando los códigos de falla son estandarizados, los eventos de falla activan flujos de trabajo de investigación automáticamente y los hallazgos se almacenan con el registro del activo, el historial acumulado se convierte en una base de datos consultable de lecciones que mejora la planificación del mantenimiento en toda la base de activos con el tiempo.

Detecta fallas antes de que ocurran

La plataforma de monitoreo de condición de Tractian le da a tu equipo de confiabilidad los datos en tiempo real y la inteligencia de diagnóstico necesarios para investigar fallas más rápido, identificar patrones recurrentes y detener las averías antes de que lleguen a los activos críticos.

Ver cómo funciona el monitoreo de condición

Términos relacionados