Aprendizaje federado, la técnica de IA para proteger la privacidad

Intel Labs y la Facultad de Medicina Perelman de la Universidad de Pennsylvania (Penn Medicine) están colaborando en un desarrollo tecnológico que permitirá a una federación internacional de 29 organismos de salud e investigación entrenar modelos de inteligencia artificial para identificar tumores cerebrales y asegurar la privacidad.

El desarrollo de Intel y Penn Medicine emplea una técnica de inteligencia artificial (IA) que permite proteger la privacidad, denominada aprendizaje federado, en inglés federating learning. La labor de la Facultad de Medicina Perleman está financiada por el programa de Tecnología Informática para Investigación de Cáncer del Instituto Nacional del Cáncer y algunos de los Institutos Nacionales de Salud mediante una subvención de tres años valorada en 1,2 millones de dólares asignada al investigador principal, Spyridon Bakas, del Centro de Computación y Analítica de Imagen Biomédica de la Universidad de Pennsylvania.

Dicen en Intel que “la inteligencia artificial tiene un gran potencial en la detección precoz de tumores cerebrales, pero para materializar todo ese potencial se requieren más datos de los que ningún centro médico puede reunir por sí solo. Empleando nuestro software y hardware, así como el apoyo de algunas de las mentes más brillantes de Intel Labs, estamos colaborando con la Universidad de Pennsylvania y una federación de 29 centros médicos para avanzar en la identificación de tumores cerebrales, al tiempo que protegemos la información personal de los pacientes”.

¿Cómo funciona?

Penn Medicine y otros 29 organismos de salud e investigación, procedentes de EE.UU., Canadá, Reino Unido, Alemania, Países Bajos, Suiza e India, emplearán el aprendizaje federado, consistente en un enfoque de aprendizaje automático distribuido que permite a las organizaciones colaborar en proyectos de aprendizaje profundo sin necesidad de compartir datos de pacientes.

La propia Penn Medicine e Intel Labs fueron los primeros en publicar un estudio de aprendizaje federado en el campo de la imagen médica, demostrando específicamente que el método de aprendizaje federado era capaz de entrenar a un modelo con una precisión equivalente al 99% de un modelo entrenado mediante el enfoque tradicional sin protección de la privacidad. Este estudio fue presentado inicialmente durante la Conferencia Internacional sobre Computación de Imagen Médica e Intervención Asistida por Ordenador celebrada en Granada en 2018. El nuevo trabajo aprovechará el software y hardware de Intel para implementar el aprendizaje federado de un modo que proporcione protección adicional de la privacidad tanto al modelo como a los datos.

Aprendizaje automático

La comunidad científica entiende que el entrenamiento del aprendizaje automático requiere conjuntos de datos amplios y diversos que ninguna institución puede reunir por sí sola. Este año se comenzarán a desarrollar algoritmos para identificar tumores cerebrales mediante una versión expandida del conjunto de datos procedente del Desafío Internacional de Segmentación de Tumores Cerebrales. Esta federación concederá a los investigadores médicos acceso a cantidades mucho mayores de datos de salud, al tiempo que protegerá la seguridad de estos datos.

Según la Asociación Americana de Tumores Cerebrales (ABTA), a casi 80.000 personas les serán diagnosticadas un tumor cerebral a lo largo de este año, de las cuales más de 4.600 serán niños. Para lograr construir y entrenar un modelo capaz de detectar un tumor cerebral que pudiese ayudar en la detección precoz y mejorar los resultados de estos pacientes, los investigadores requieren de grandes cantidades de datos médicos relevantes. Sin embargo, resulta esencial mantener la privacidad y seguridad de estos datos y ahí es donde entra en juego el aprendizaje federado mediante la tecnología de Intel. Utilizando este método, los investigadores de todas las organizaciones participantes podrán colaborar en la creación y entrenamiento de un algoritmo para detectar tumores cerebrales protegiendo al mismo tiempo los datos médicos sensibles.

En 2020, Penn y los 29 organismos internacionales de salud e investigación emplearán hardware y software de aprendizaje federado proporcionado por Intel para producir un nuevo modelo avanzado de IA entrenado mediante el mayor conjunto de datos sobre tumores cerebrales reunido hasta la fecha, y todo ello sin necesidad de que cada colaborador individual comparta sus datos sensibles de pacientes. Se espera la participación de un subconjunto de organismos en el inicio de la primera fase de esta federación, incluyendo el Hospital Universitario de Pennsylvania, la Universidad Washington de St. Louis, el Centro Médico de la Universidad de Pittsburgh, la Universidad Vanderbilt, la Queen’s University, la Universidad Técnica de Múnich, la Universidad de Berna, el King’s College de Londres y el Hospital Memorial Tata.

Juan Carlos F. Galindo

Juan Carlos F. Galindo

Tras dos décadas dedicado a la comunicación de Productos y Servicios, Innovación, Tecnología, I+D, Televisión y Patrocinios de una gran empresa, me embarco en este blog que dedicaré a mi pasión, la tendencia tecnológica que va a protagonizar la 4ª Revolución Industrial: la Inteligencia Artificial.

Continúa leyendo