Detectar con precisión sutil cambios en la expresión facial. ¿Para qué?

Fujitsu y la Universidad de Carnegie Mellon han desarrollado una tecnología, con inteligencia artificial, que detecta con extrema precisión las expresiones faciales. Una tecnología que podría ser de gran utilidad en, por ejemplo, la atención médica.

Desarrollar una aplicación con una tecnología como la inteligencia artificial (IA), para obtener un fin, y además que este sea en beneficio de las personas, es lo que busca la aplicación de la que voy a hablar hoy, y que en terrenos como la atención médica, o incluso la conducción, puede solucionar muchos problemas.

No, el reconocimiento facial, en este caso, no es para tenernos vigilados o controlados. Y han sido Fujitsu Laboratories, Ltd. y Fujitsu Laboratories of America, Inc, en colaboración con la Facultad de Ciencias de la Computación de la Universidad Carnegie Mellon en Estados Unidos, quienes han anunciado el desarrollo de una tecnología de reconocimiento facial que detecta cambios sutiles en la expresión de la cara con un alto grado de precisión. 

Uno de los obstáculos para el reconocimiento de expresión facial es la dificultad de proporcionar grandes cantidades de datos necesarios para entrenar modelos de detección para cada pose facial, porque las caras generalmente se capturan con una amplia variedad de poses en aplicaciones del mundo real. Para abordar el problema, Fujitsu ha desarrollado una tecnología que adapta diferentes procesos de normalización para cada imagen facial. 

Por ejemplo: cuando el ángulo de la cara del sujeto es oblicuo, se puede ajustar la imagen para que se parezca más a la imagen frontal de la cara, permitiendo que el modelo de detección sea entrenado con una cantidad relativamente pequeña de datos. La tecnología puede detectar con precisión cambios emocionales sutiles, incluidas risas incómodas o nerviosas, confusión, etc., y también cuando la cara del sujeto se mueve en un contexto del mundo real. 

La nueva tecnología se utilizará en una variedad de aplicaciones del mundo real, incluida la facilitación de la comunicación para mejorar el compromiso de los empleados y también para optimizar la seguridad para conductores y trabajadores de una fábrica. En los últimos años, las tecnologías que detectan cambios en la expresión facial a partir de imágenes y que leen las emociones humanas han estado atrayendo cada vez más interés, y en el futuro se utilizarán en una variedad de situaciones como la monitorización del paciente en la atención médica, o el análisis de las respuestas de los clientes a los productos en las campañas de marketing, por ejemplo. 

Para "leer" las emociones humanas de manera más efectiva, es fundamental capturar los sutiles cambios faciales asociados, como la comprensión, el desconcierto y el estrés. Para lograr esto, los desarrolladores han confiado cada vez más en las Unidades de Acción (AUs, siglas en inglés), que expresan las "unidades" de movimiento correspondientes a cada músculo de la cara en base a un sistema de clasificación anatómico. Por ejemplo, las AUs han sido utilizadas por profesionales en campos tan variados como la investigación psicológica y la animación. Las AUs se clasifican en aproximadamente 30 tipos según los movimientos de cada músculo facial, incluidos los de las cejas y las mejillas. 

Al integrar estas AUs en su tecnología, Fujitsu ha sido pionera en un nuevo enfoque para descubrir incluso cambios sutiles en la expresión facial. Para detectar AUs con mayor precisión, las técnicas subyacentes de aprendizaje profundo requieren grandes cantidades de datos. Sin embargo, en situaciones del mundo real, las cámaras generalmente capturan caras en varios ángulos, tamaños y posiciones, lo que dificulta la preparación de datos de aprendizaje a gran escala correspondientes a cada estado visual y espacial. Por lo tanto, las imágenes capturadas por la cámara afectan negativamente la precisión de la detección. 

Y esto es precisamente lo que han logrado la la Facultad de Ciencias de la Computación de la Universidad Carnegie Mellon, Fujitsu Laboratories, Ltd. y Fujitsu Laboratories of America Inc: detectar AUs con alta precisión, incluso con datos de entrenamiento limitados. Con la nueva tecnología las imágenes de la cara tomadas en varios ángulos, tamaños y posiciones se giran, amplían o reducen y se ajustan de otra manera para que la imagen se parezca más a la frontal del rostro. Esto hace posible detectar AUs con una pequeña cantidad de datos de entrenamiento, basados en la vista frontal de la cara del sujeto. 

En el proceso de normalización se convierten múltiples puntos característicos de la cara en la imagen para que se acerquen a las posiciones de los puntos característicos en la imagen frontal. Sin embargo, la cantidad de rotación, ampliación o reducción y ajuste cambia dependiendo de dónde se seleccionan los puntos del rostro. Por ejemplo, si los puntos característicos se seleccionan para estar alrededor de los ojos y realizar el proceso de rotación, la zona de alrededor de los ojos estará cerca de la imagen de referencia, pero partes como la boca estarán desalineadas. 

Para abordar este problema, se analizan las áreas que tienen una influencia significativa en la detección de AU de la imagen de la cara capturada y el grado de rotación, ampliación y reducción se ajustan, en consecuencia. Al utilizar diferentes procesos de normalización para cada AU individual, la tecnología desarrollada, utilizando inteligencia artificial, puede detectar AU con mayor precisión. 

Esta tecnología ha logrado ya una alta tasa de precisión de detección, del 81%, incluso con datos de entrenamiento limitados, y también es más precisa que otras existentes. Fujitsu tiene como objetivo introducir su desarrollo en aplicaciones prácticas para diversos casos de uso, incluido el soporte de teleconferencia, la medición del compromiso de los empleados o la supervisión del conductor. Y como expliqué al principio, espero que también para la atención médica.

Juan Carlos F. Galindo

Juan Carlos F. Galindo

Tras dos décadas dedicado a la comunicación de Productos y Servicios, Innovación, Tecnología, I+D, Televisión y Patrocinios de una gran empresa, me embarco en este blog que dedicaré a mi pasión, la tendencia tecnológica que va a protagonizar la 4ª Revolución Industrial: la Inteligencia Artificial.

Continúa leyendo