Big Data: la nueva esperanza para las enfermedades

Big Data: la nueva esperanza para las enfermedades

JOSÉ ANTONIO SÁNCHEZ MARTÍNNeuropsicólogo – Psicólogo General Sanitario

Asistimos a una revolución tecnológica que nos influye en todos los aspectos de nuestra vida. Al igual que es posible realizar una transacción monetaria desde el sillón de nuestro salón a través del móvil, también es posible controlar la temperatura de nuestra casa vacacional a cientos de kilómetros de distancia o que un cirujano pueda participar en una intervención quirúrgica a miles de kilómetros de distancia.

Las innovaciones tecnológicas y sus aplicaciones permiten el acceso a gran cantidad de información y a realizar acciones sin que sea necesario estar físicamente presente en lugar de los hechos. Quedémonos en el primer aspecto, el acceso a la información.

Hoy en día a través de internet y de los servidores se maneja una cantidad inimaginable de datos. Es posible recopilar y tratar todos estos datos y analizarlos según hipótesis o intereses determinados. Esta es la base del Big Data.

Según la directiva UIT-T Y.3.600 de la Unión Internacional de Telecomunicaciones (UIT), el Big Data sería: «Un paradigma para hacer posible la recopilación, el almacenamiento, la gestión, el análisis y la visualización, potencialmente en condiciones de tiempo real, de grandes conjuntos de datos con características heterogéneas». Y además podría concretarse en el Big Data como servicio definido como: «una categoría de servicio en la nube en la que las capacidades que se ponen a disposición del cliente del servicio en la nube le permiten recopilar, almacenar, analizar y visualizar los datos utilizando tecnologías Big Data». Resumiendo, hablamos de Big Data cuando es posible recoger, almacenar y gestionar grandes cantidades de datos y ponerlos a disposición de analistas con las herramientas necesarias para manejarlos.

¿Cómo se recogen estos datos? Pues puede haber muchas formas de recolección de datos, desde listados voluntarios (encuestas) en los que grandes cantidades de personas responden a cuestiones, hasta recopilaciones de acciones que las personas declaran a través de sus dispositivos o aplicaciones.
Esto ha sido aprovechado por las grandes multinacionales comerciales desde el momento que supieron que el análisis de grandes cantidades de información podría servirles para conocer cómo ocurría un determinado comportamiento en las masas, y rentabilizarlo – monetizarlo, a través de estrategias de marketing.

Estas técnicas también son aplicables a la investigación científica. Y más concretamente a la investigación de enfermedades neurodegenerativas. Desde principios de este siglo, ha existido una corriente de investigación que promueve la utilización de grandes cantidades de datos que puede proveer a los investigadores de una cantidad numerosa de éstos con una heterogeneidad suficiente y que a través de potentes herramientas de análisis pueden acercarnos aún más a encontrar factores que son los responsables de la aparición de la enfermedad. El número de datos y la variabilidad de las mismas hacen posible que las hipótesis estadísticas sean muy potentes, reflejen la realidad de la población de estudio y el error sea determinado con una mayor seguridad.

En la enfermedad de Alzhéimer se encuentran experiencias de investigaciones que comparten datos a gran escala ya en 2004. En 2015 la OCDE publica un informe, «El uso del Big Data en la lucha contra la demencia». En él propone que el uso de aplicaciones de e-Health para la obtención de datos (así como la recogida de datos masiva a través de estudios), puede ayudar en un futuro a estudiar los factores implicados en la demencia, aclarar sus implicaciones y favorecer la propuesta de intervenciones preventivas frente a la enfermedad.

Por otro lado, estudios como el del Hospital Neurológico y la Universidad de Montreal (Canadá) analizando 7.700 imágenes de casi 1.200 personas o el del grupo de investigación de Sistemas Informáticos y la Facultad de Biología (ambos estudios incluyendo instituciones internacionales creando redes de obtención de datos muy amplias) de la Universidad de Sevilla, analizando más de 1.300 genes; tratan de obtener conclusiones de datos a nivel médico sobre la enfermedad. El primero con el análisis de resultados de neuroimagen, y el segundo a través del estudio genético de la enfermedad. Otro importante hito es la creación del AMP-AD Knowledge Portal; un portal donde expertos que investigan en demencia, comparten datos que pueden unirse o complementarse con otros investigadores con los mismos intereses para lograr un mayor número de población muestral y de datos que puedan ser analizados de forma conjunta. Todos ellos se centran en la búsqueda de información que genere diagnósticos más precisos y tratamientos más eficaces que aumenten la calidad de vida de las personas con demencia o enfermedad de Alzhéimer.

En estos ejemplos, la investigación se basa en aspectos médicos. Pero de igual forma, se podrían establecer criterios e hipótesis, con metodologías propias, para la investigación en tratamientos no farmacológicos. En estas investigaciones sería necesario acotar con más precisión las medidas de las variables, los controles metodológicos y las perspectivas teóricas o paradigmas que se utilicen para el enfoque de la investigación. Pero de igual manera, sería posible analizar y obtener resultados potentes y novedosos en este tipo de intervenciones, ricas en aspectos psicológicos y sociales.

Como se ha comentado anteriormente, el gran volumen de datos, proporciona una mayor potencia a las conclusiones de los estudios, e incluso favorece encontrar la relación que con muestras clínicas más pequeñas serían pasadas inadvertidas, pero que verdaderamente pueden ser importantes a la hora de descubrir el complejo entramado de factores que rodean la enfermedad.

Como críticas de este paradigma de análisis se han propuesto de forma general dos vertientes. La primera alude a que el análisis de datos debe estar basado en teorías previas que mantengan un hilo de hipótesis claro de investigación (aunque esté abierto a nuevos descubrimientos). La simple búsqueda de relaciones puede llevar a conclusiones ilógicas. Como ejemplos de estos errores del Big Data pueden consultarse análisis realizados que muestran correlaciones entre hechos que no tienen un sentido lógico del contenido (http://www.tylervigen.com/spurious-correlations), como por ejemplo la relación existente entre la disminución de la cantidad de piratas en el mundo y el ascenso de la temperatura global; el número de ahogados en EE.UU. y el número de películas rodadas por Nicolas Cage; o el consumo per capita de mozzarella y el número de doctorados por año en ingeniería civil… Como puede verse, no todo lo que correlaciona es válido ni mucho menos todo lo que correlaciona implica causalidad (http://www.jotdown.es/2016/06/correlacion-no-implica-causalidad/).

Por otro lado, la segunda de las críticas hace referencia a las cuestiones éticas del manejo de la información, los consentimientos, las dificultades de colaboración entre los grandes expertos o las instituciones u organizaciones que hacen investigación en el área, que este tipo de investigación resulta de una inversión o financiación a medio – largo plazo (resultando cara) y que es una imbricación de la investigación sanitaria y tecnológica, implicando esfuerzos continuos de innovación y nuevos avances para su desarrollo.

Resumiendo, con el Big Data se abre una nueva era dentro de los paradigmas de investigación. Proporcionan una gran cantidad de información que ha de ser cuidadosamente analizada y ha de ser tratada con mucha precisión para lograr conclusiones válidas, potentes y novedosas. Todo ello exige un gran esfuerzo de control por parte de los investigadores, y un gran arrojo por parte de los organismos que apuestan por este tipo de investigación. Pero verdaderamente puede ser un gran paso a la hora de aplicar el Big Data al estudio de las demencias.

  • Comparte...
  • Compartir en Facebook
  • Compartir en Google+
  • Tweet about this on Twitter
  • Compartir en LinkedIn

Hacer una replica

Tu dirección de email no será publicada