Ineco presta apoyo a la Dirección General del Dato (dependiente de la Secretaría de Estado de Digitalización e Inteligencia Artificial - SEDIA) en el impulso de un espacio de datos de salud para el tratamiento masivo de la información sanitaria. Este apoyo, iniciado en 2023 con la SGAD, Secretaría General de Administración Digital (recién convertida a la Agencia Estatal de Administración Digital), consiste en la definición, diseño lógico y físico de una infraestructura tecnológica para la creación de un Espacio Nacional de Datos de Salud o Data lake sanitario nacional, en colaboración con el Ministerio de Sanidad y comunidades autónomas.
Esta plataforma servirá para que el Ministerio de Sanidad y las comunidades autónomas– además de otros actores del Sistema Nacional de Salud como los centros sanitarios y de investigación, agencias sanitarias oficiales, sociedades científicas, profesionales, etc.- puedan compartir y consultar información, y en un futuro, ser interoperable con el Espacio de Datos Europeo.
Información técnica
Almacenamiento seguro y masivo
Un data lake o lago de datos es un sistema de almacenamiento seguro y masivo, de datos “en bruto”, sin procesar, en cualquier formato, y de todo tipo, tanto estructurados (bases de datos), como no estructurados (emails, PDFs, documentos de texto), binarios (imágenes, vídeos, audio) o semiestructurados (archivos CSV, XML, etc.). Esto presenta ventajas respecto a los almacenes de datos. Al almacenarse sin tratamiento previo, presenta una mayor flexibilidad, ya que son útiles para muchas finalidades diferentes. Además, son especialmente útiles para la aplicación de analítica avanzada mediante técnicas de Big Data y para el aprendizaje automático de plataformas de inteligencia artificial.
El Espacio Nacional de Datos de Salud tiene el objetivo de poder aplicar analítica avanzada sobre millones de datos mediante Big Data, para la detección de patrones de enfermedades o comportamiento a fármacos, entre otros casos, que de otra forma serían indetectables.
Esta infraestructura se plantea con un gobierno de datos centralizado, con estándares, normas, roles y herramientas comunes, y garantizando en todo momento la conectividad, calidad y seguridad.
En un futuro, y de forma no exclusiva, también podría ser el nodo de acceso al Espacio Europeo de Datos de Salud.