Gusano en el sensor ¿Qué sucede cuando los datos de IoT son malos?

Las empresas que intentan usar Internet de las cosas ya se enfrentan a una avalancha de datos y a una vertiginosa variedad de formas de analizarlos. ¿Pero qué pasa si la información es incorrecta??

Los datos incorrectos son comunes en IoT, y aunque es difícil obtener una estimación de la cantidad de información que se puede transmitir desde los dispositivos conectados, muchas personas están pensando en el problema.

Alrededor del 40 por ciento de todos los datos de los bordes de las redes IoT son "espurios", dice Harel Kodesh, vicepresidente del negocio de software Predix de GE y CTO de GE Digital. Muchos de esos datos no son incorrectos, simplemente inútiles: información duplicada que los empleados subieron accidentalmente dos veces, o mensajes repetitivos que las máquinas inactivas envían automáticamente. 

Además, construir una nueva plataforma de IoT sobre los viejos sistemas de informes industriales puede causar problemas porque las herramientas heredadas formatean los datos a su manera, dijo Kodesh. "No estás tomando los datos elementales reales, estás tomando alguna traducción de eso".

Pero a veces los dispositivos solo generan cosas falsas o engañosas.

Medir lo incorrecto

Por ejemplo, si un gusano se arrastra sobre un sensor de temperatura y humedad en un campo, el agricultor leerá qué tan cálido y húmedo está el gusano, lo que no ayuda a administrar una granja. Si un sensor queda cubierto de suciedad o mugre de fábrica, o si está dañado por vándalos, eso también puede modificar los datos que produce.

Cuanto más severas sean las condiciones del entorno y cuanto más aislado esté el dispositivo, peor será el problema de los datos erróneos. Además de la agricultura, industrias como el petróleo y el gas y la distribución de energía enfrentan esto. Pero no solo los sensores remotos tienen problemas. Incluso en un hospital, un sensor de oxígeno en la sangre sujeto al dedo de un paciente puede comenzar a dar datos incorrectos si se arroja a la posición incorrecta.

Además de eso, algunos dispositivos IoT funcionan mal por sí mismos y comienzan a arrojar datos incorrectos, o dejan de informar. En muchos otros casos, el error humano es el culpable: la configuración incorrecta arruina lo que genera el dispositivo.

Una forma de reducir los datos erróneos es asegurarse de que el equipo esté configurado correctamente.

John Deere equipa sus herramientas agrícolas gigantes con sensores que detectan si las máquinas funcionan correctamente. La sembradora ExactEmerge de la compañía, que rueda detrás de un tractor que planta semillas en un campo, tiene tres sensores por fila de cultivos para detectar cuántas semillas se están plantando y a qué velocidad. Al menos una vez al año, antes del tiempo de siembra, el agricultor o un distribuidor de Deere calibrarán manualmente esos sensores para que sean precisos, dijo Lane Arthur, director de soluciones digitales de Deere..

Más es mejor

Pero muchos sensores de IoT son demasiado difíciles de alcanzar para la calibración y el mantenimiento regulares. En esos casos, la redundancia puede ser la respuesta, aunque no es una bala de plata..

Los duplicados del mismo sensor en una máquina, en una mina o en un campo generan más entradas, lo que puede ser útil en sí mismo. Weather Underground, parte del negocio de Weather Company de IBM, crea sus informes en parte con datos de sensores no calibrados y de bajo costo en los patios traseros de los consumidores. Por poco dinero, le dan a Weather Underground más puntos de datos, pero la calidad es un gran problema. Un sensor puede funcionar mal e informar varias pulgadas de lluvia mientras que el que está al lado no detecta ninguno, dijo John Cohn, miembro de IBM para Watson IoT.

"Lo mejor es que, si tienes suficiente densidad de este tipo de sensores, puedes ... matemáticamente encontrar los valores atípicos y la razón, a partir de eso, uno requiere trabajo", dijo Cohn.

Las empresas también pueden usar diferentes dispositivos de detección, especialmente cámaras, para verificar los sensores que pueden estar teniendo problemas. Una cámara de video combinada con un software de análisis de imágenes puede detectar si un dispositivo remoto se ensució, dañó o destrozó, dijo Doug Bellin, gerente senior de industrias globales del sector privado en Cisco Systems. A veces, las cámaras de seguridad que ya están allí para algo más pueden hacer este trabajo.

Una técnica para verificar diferentes tipos de sensores entre sí se llama fusión de sensores. Pesa las entradas de dos o más sensores para llegar a una conclusión.

La fusión de sensores ahora se está implementando en hospitales, donde las falsas alarmas son rampantes, dijo Stan Schneider, presidente y CEO de la compañía de software IoT Real-Time Innovations (RTI). Por ejemplo, en lugar de activar una alarma cada vez que el sensor de oxígeno en sangre en el dedo de un paciente mostraba poco oxígeno, un sistema de fusión de sensores compararía constantemente esa lectura con la de otros sensores en el paciente, como los monitores de respiración y frecuencia cardíaca.

El sensor fantasma

Otras fuentes también pueden reemplazar un sensor que ya ni siquiera está allí. GE prueba cada motor a reacción que sale de sus fábricas para determinar la temperatura de los gases de escape, una cifra que refleja su eficiencia, dijo Kodesh. GE coloca un sensor justo en el camino del escape a pesar de que siempre se quemará después de unos minutos. Mientras tanto, los sensores en lugares más seguros alrededor del motor recopilan datos al mismo tiempo, y al comparar sus lecturas con lo que el dispositivo condenado registró antes de ser destruido, GE puede recrear el sensor directo como uno virtual, una función matemática.

Sacar conclusiones de múltiples flujos de información lleva el problema de la calidad de los datos al ámbito del aprendizaje automático. Ahí es donde están sucediendo las cosas más interesantes, dice Cohn de IBM.

Por ejemplo, IBM usa su plataforma de análisis Watson para comprender el uso de energía en las instalaciones de IBM en Irlanda. Watson no solo puede señalar una discrepancia si un aire acondicionado dice que está apagado, sino que el consumo total de energía es demasiado alto para que eso sea cierto, sino que con el tiempo puede aprender a identificar la forma particular en que ese aire acondicionado consume energía cuando se presenta. Con ese conocimiento, un sistema que dice que no está encendido puede ser atrapado con las manos en la masa.

Como verificación de datos defectuosos, el aprendizaje automático lleva tiempo para ponerse al día, a diferencia de los sensores o cámaras adicionales.

“Se vuelve más inteligente cuanto más se ejecuta. La primera vez que se ejecuta, no confiaría en él ”, dijo Bellin de Cisco. "La enésima vez que se ejecuta, es ... probablemente más inteligente que yo".

Cuanto más crítico es el sistema IoT, más importante es tratar con datos incorrectos. La fusión de sensores, por ejemplo, es necesaria para cosas como la salud del paciente y la detección de misiles porque la confiabilidad es un gran problema cuando hay mucho en juego, dijo Schneider de RTI..

Pero algunas formas de IoT probablemente pueden funcionar sin múltiples fuentes de datos, dijo. “No necesitas eso en el termostato de tu casa”.

Únase a las comunidades de Network World en Facebook y LinkedIn para comentar temas que son lo más importante.