PINN explicado: por qué las redes neuronales informadas por física superan al ML black-box para la RUL del inversor

Datos clave

Una Red Neuronal Informada por Física (PINN) es una red neuronal cuya función de pérdida penaliza las predicciones que violan las ecuaciones diferenciales que gobiernan el sistema.
Las PINN combinan la flexibilidad del deep learning con las garantías de extrapolación de la física de primeros principios — generalizan donde el ML black-box se rompe.
En fiabilidad de inversores los datos cubren pocos años; la predicción del fallo debe extrapolar a horizontes de décadas. Es exactamente el régimen donde las restricciones físicas son decisivas.
En InverterAI los residuos físicos vienen de las ecuaciones de Coffin-Manson, Arrhenius y transferencia de calor que gobiernan la degradación de IGBT y condensadores DC-link.
Las PINN necesitan órdenes de magnitud menos datos de fallo etiquetados que los enfoques puramente data-driven, lo cual es decisivo en un campo donde los fallos confirmados son eventos raros.
La salida es una distribución de RUL con banda de confianza por componente, no una fecha única — la forma honesta para cualquier herramienta de pronóstico.

El problema que el ML black-box no puede resolver para inversores

El deep learning moderno es espectacularmente bueno interpolando dentro de su distribución de entrenamiento. Muéstrale a un transformer cien millones de tokens de internet y producirá continuaciones coherentes. Muéstrale a un modelo de visión un millón de fotos etiquetadas y clasificará una nueva correctamente. Estos éxitos comparten una característica estructural: los casos de test viven en el mismo vecindario estadístico que los de entrenamiento.

La predicción de fiabilidad de inversores viola esa suposición de raíz. Los operadores instrumentan plantas desde el año cero, pero los fallos que realmente le importan al equipo de mantenimiento ocurren en los años 8, 12, 15. La distribución de entrenamiento cubre la curva de mortalidad infantil y el tramo plano del medio; el objetivo de predicción es la zona de desgaste que la red no ha visto nunca. Este es el problema de extrapolación, y es el régimen arquetípico donde el ML puro data-driven falla en silencio.

Peor aún, los fallos confirmados son escasos. Una cartera FV de 100 MW con 25 inversores centrales puede registrar 2-5 fallos al año. En una década, eso es menos ejemplos etiquetados que los que la mayoría de pipelines ML necesitan para un solo fold de validación cruzada. No se puede atacar por fuerza bruta con más datos porque no hay más datos.

Qué es una PINN, en términos sencillos

Una red neuronal estándar aprende minimizando una sola pérdida — típicamente el error cuadrático medio entre el valor predicho y el observado:

L_data = (1/N) · Σ (y_pred − y_obs)²

Una PINN minimiza esa misma pérdida más un término adicional que puntúa cuánto viola la predicción de la red una ley física conocida, típicamente expresada como ecuación diferencial:

L_total = λ_d · L_data + λ_p · L_physics

L_physics = (1/M) · Σ ( F[ŷ](x, t) )²

donde F[ŷ] es el residuo de la ecuación de gobierno evaluado sobre la propia salida de la red, muestreado en M puntos de colocación en el dominio de entrada. Los pesos λ_d y λ_p equilibran el ajuste a datos frente al cumplimiento de la física; ambas pérdidas son diferenciables, por lo que todo se entrena con backpropagation estándar.

El truco es que L_physics se puede evaluar en cualquier punto del dominio de entrada — incluyendo regiones donde no hay datos. Esto es lo que le da a la red algo a lo que aferrarse al extrapolar: aunque no haya fallos observados en el año 15, el residuo físico sigue diciéndole qué es y qué no es admisible termodinámicamente.

Por qué importa específicamente para fiabilidad de inversores

Las ecuaciones diferenciales que gobiernan la degradación de IGBT y condensadores no son exóticas. Están bien establecidas por sesenta años de investigación en fiabilidad de electrónica de potencia:

Coffin-Manson para fatiga de soldadura y bond wires por ciclado térmico.
Arrhenius para pérdida de electrolito y degradación química en condensadores.
EDOs de transferencia de calor para la temperatura de unión en función de la disipación y las condiciones ambientales — típicamente una red térmica Foster o Cauer.
Regla de Miner para acumulación de daño.

Estas ecuaciones codifican décadas de comprensión física que el ML black-box tiene que reaprender desde datos — y no puede, porque los datos son demasiado escasos. Una PINN parte con ese conocimiento previo ya incluido en la pérdida, y luego usa los datos existentes para calibrar las constantes y capturar los efectos residuales que las ecuaciones simples no recogen (acoplo de humedad, distorsión armónica, comportamiento de control específico del inversor).

La arquitectura PINN de InverterAI

La arquitectura es deliberadamente modesta — la investigación muestra que para aplicaciones de ingeniería, la ganancia viene de la física, no de la profundidad de la red. Una PINN típica de InverterAI para pronóstico de IGBT tiene:

Una capa de entrada que recibe tiempo, ambiente y variables derivadas del SCADA (tensión DC-link, corriente AC, temperatura de disipador, eventos de conmutación).
3-6 capas ocultas de 64-128 unidades cada una, con activaciones suaves (tanh o sin), porque los residuos físicos requieren salidas diferenciables.
Una cabeza de salida por modo de fallo, cada una emitiendo un estado de degradación en tiempo continuo y una distribución de RUL estimada.
Una pérdida compuesta con tres términos: ajuste a datos (contra telemetría observada), residuo físico (Coffin-Manson + EDO de la red Foster) y condiciones de contorno (estado inicial en puesta en marcha, monotonía del daño acumulado).

El entrenamiento usa Adam seguido de L-BFGS para convergencia fina — un patrón tomado de los artículos originales de Raissi-Perdikaris-Karniadakis sobre PINN, que ha demostrado robustez en dominios de ingeniería. La inferencia corre en milisegundos por inversor, así que toda la flota se puede reevaluar cuando llega SCADA fresco.

Qué aspecto tiene en producción

Para un equipo de O&M la salida práctica es idéntica a cualquier herramienta predictiva: un número RUL por componente, con su banda de confianza, ordenado en una cola de mantenimiento. Las diferencias solo aparecen con el tiempo:

Robustez entre marcas y climas. Como la física es la misma para cada IGBT, la red calibrada se transfiere entre familias de inversores y geografías con mucho menos re-entrenamiento del que necesitaría un modelo black-box.
Incertidumbre calibrada. La banda de confianza al 90% sobre la RUL es significativa, no decorativa. Los operadores pueden planificar con confianza en vez de apostar a predicciones puntuales.
Explicabilidad. Cuando la red marca una unidad, el desglose muestra el modo de fallo dominante y el régimen operativo que contribuye — “el daño Coffin-Manson acumulado en este IGBT está en 0,83 por un periodo de seis semanas de ciclado a carga parcial inusualmente alto en marzo-abril”.
Se comporta fuera de los datos de entrenamiento. Cuando una ola de calor empuja a una flota a un régimen operativo nunca visto, las restricciones físicas anclan la predicción. Un modelo ML puro extrapolaría ciegamente con confianza — y muy posiblemente mal.

Limitaciones y caveats honestos

Las PINN son una herramienta potente, no un almuerzo gratis. Los límites prácticos que conviene declarar:

La física tiene que ser correcta. Si las ecuaciones de gobierno están mal o incompletas, la pérdida física tira de la red hacia una respuesta equivocada con más confianza de la que tendría un modelo black-box. La calidad de una PINN está acotada por la fidelidad de la física codificada.
El balance de pérdidas es delicado. La razón λ_d / λ_p afecta materialmente a lo que la red aprende. Esquemas de ponderación adaptativos (basados en NTK, SoftAdapt, recocido de learning rate) suelen ser necesarios para entrenamiento estable.
No sustituye a la calidad de datos. Garbage in, garbage out sigue aplicando. La limpieza SCADA, la verificación de sensores y el rechazo de outliers siguen siendo precondiciones innegociables.
La validación es más difícil, no más fácil. Como la red extrapola más allá de la distribución de entrenamiento, no se puede validar cruzadamente como en un problema de interpolación. El camino honesto es un test leave-one-fleet-out contra fallos confirmados — lento y caro, pero la única demostración creíble.

Por qué es la elección correcta de ML para este problema

Para un problema como clasificación de spam — etiquetas abundantes, distribución estacionaria, régimen de interpolación — un modelo black-box es la herramienta correcta. Para pronóstico de inversores — fallos escasos, extrapolación a décadas, física de gobierno fuerte — una PINN es la herramienta correcta. Elegir la herramienta adecuada es la primera decisión de ML; todo lo demás sigue de ahí.

El punto de fondo es que el ML informado por física reordena la carga de la prueba. Un modelo black-box asume implícitamente que la próxima década se parecerá estadísticamente a la pasada — una afirmación falsa en la práctica e indemostrable en principio. Una PINN lo invierte: asume que la próxima década cumplirá la misma termodinámica que la pasada, lo cual es una afirmación mucho más débil y mucho más defendible.

Lecturas adicionales

Raissi, Perdikaris, Karniadakis, “Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations”, J. Comput. Phys., 2019.
Karniadakis et al., “Physics-informed machine learning”, Nature Reviews Physics, 2021.
Wang, Yu, Perdikaris, “When and why PINNs fail to train: A neural tangent kernel perspective”, J. Comput. Phys., 2022.
Cuomo et al., “Scientific Machine Learning Through Physics-Informed Neural Networks: Where we are and What's Next”, J. Sci. Comput., 2022.

Mira la plataforma end-to-end de InverterAI → Lee el stack técnico completo →