Un proyecto conjunto del ISPA y la Universidad de Oviedo permite analizar de manera interactiva datos biomédicos.

El sistema utiliza nuevas técnicas de visualización de datos e inteligencia artificial.

El manejo y la interpretación de datos biomédicos es una práctica que ha cobrado importancia en el mundo de la investigación sanitaria en los últimos años, especialmente para enfermedades con fuertes componentes genéticos como el cáncer. Sin embargo, el análisis de estas grandes cantidades de información rara vez era manejado directamente por médicos o investigadores. Conocedores de este problema, María Dolores Chiara, del grupo de Cáncer de cabeza y cuello del ISPA e investigadores del grupo GSDPI, de la Universidad de Oviedo dieron comienzo en 2019 a una colaboración que todavía hoy sigue y cuyo propósito es simple: desarrollar una serie de técnicas que permitan a los profesionales de la salud analizar datos biomédicos de forma interactiva.

A la izquierda: diagrama del proceso exploratorio con el enfoque propuesto. A la derecha: Matriz de expresión génica (GEM), junto con mapas 2D de similitud de muestras (derecha) y de genes (abajo) Fuente: grupo GSDPI de UniOvi (http://isa.uniovi.es/GSDPI)

Los resultados de su trabajo se resumen en un nuevo estudio publicado en el IEEE Journal of Biomedical and Health Informatics. Los investigadores presentan una novedosa técnica para la exploración de datos de expresión génica. Su principal ventaja, explican, es que permite descubrir “relaciones significativas no evidentes entre los patrones de expresión genética de grupos de genes y diversos tipos y subtipos de cáncer”.

La investigación propone un enfoque innovador que combina la visualización de matrices de expresión génica (GEM) y la proyección, tanto de genes como de muestras, en mapas 2D, que permiten al investigador biomédico múltiples mecanismos de interacción con los datos, lo que potencia el proceso de descubrimiento de nuevo conocimiento.

Desde hace años, la doctora Chiara estudia los paragangliomas y los feocromocitomas (PPGL), tumores extremadamente raros que, en muchos casos, tienen una base genética conocida y heredada. Estos pacientes pueden desarrollar múltiples tumores, algunos de ellos incluso malignos, para los que no existe tratamiento curativo conocido a día de hoy. Además, tanto los pacientes como los familiares sanos deben someterse a revisiones de por vida. “Para mejorar la atención sanitaria de estos pacientes es fundamental entender las características de estos tumores a nivel genético”, explica Chiara.

Con este objetivo, el grupo de la doctora Chiara propuso tres casos de estudio para ser analizados mediante estas técnicas. Los resultados mostraron una capacidad significativa para descubrir conexiones relevantes entre genes y subtipos de tumores, y demostraron la utilidad del enfoque propuesto para descubrir conocimiento valioso a partir de datos genómicos.

“Para mejorar la atención sanitaria de estos pacientes es fundamental entender las características de estos tumores a nivel genético”

explica Chiara.

En conclusión, el trabajo presentado por los investigadores de la Universidad de Oviedo y el ISPA proporciona una herramienta útil para el análisis de datos biomédicos de alta dimensionalidad. La combinación de técnicas de aprendizaje automático y visualización interactiva permite a los usuarios explorar los datos de manera eficiente y descubrir nuevas relaciones y patrones de interés.

Se espera que esta metodología abra nuevas oportunidades para el desarrollo de herramientas más avanzadas en el futuro y contribuya al avance de la investigación en el campo de la biomedicina.

REFERENCIA: Díaz, I., Enguita, J. M., Cuadrado, A. A., García, D., González, A., Valdés, N., & Chiara, M. D. (2023). Exploratory Analysis of the Gene Expression Matrix Based on Dual Conditional Dimensionality Reduction. IEEE Journal of Biomedical and Health Informatics, 1-10. https://doi.org/10.1109/jbhi.2023.3264029

COMUNICACIÓN ISPA-FINBA