BIG DATA DIÁLOGOS: CONCEPTOS GENERALES, BASES MATEMÁTICAS Y PATRONES DE REFERENCIA (NIVEL III)
Laboratorio de Procesado de Imagen, Universidad de Valladolid, Valladolid, Valladolid, España.
Objetivos docentes: Comprender los fundamentos y bases de lo que se conoce como Big Data y la diferencia con respecto a datos tradicionales. Analizar los problemas asociados al Big Data: captura y almacenamiento, técnicas de análisis y visualización. Big Data aplicado al ámbito sanitario y en particular al análisis de imagen médica: técnicas de aprendizaje profundo y redes neuronales convolucionales.
Discusión: La cantidad ingente de datos que existen en la actualidad ha venido a dar lugar al término conocido como Big Data. No sólo es un cambio en orden de magnitud del tamaño de los datos, sino también en su tipología, al ser datos altamente no estructurados. Esto ha dado lugar a un cambio de paradigma en cuanto a la aparición de nuevos problemas asociados a la captura, el almacenamiento y el procesado. En particular, nuevos métodos de análisis y visualización han surgido en los últimos años para poder explotar su enorme potencial. Las técnicas de Big Data se pueden aplicar a una gran cantidad de ámbitos y en particular en el sanitario. Podemos mencionar dentro de las aplicaciones clínicas la aparición de: nuevos modelos predictivos, nuevas herramientas asociadas a los ensayos clínicos, la medicina personalizada, nuevos métodos de análisis de los patrones asociadas a patologías, la monitorización remota de pacientes, etc. El Big Data tiene también un gran potencial dentro del campo de la imagen médica. Han aparecido recientemente nuevos métodos de clasificación basados en las denominadas técnicas de aprendizaje profundo y en particular las redes neuronales convolucionales. Éstas últimas tienen dos requisitos muy importantes: la necesidad de un conjunto de entrenamiento grande, que, gracias al Big Data, ahora es posible, y una gran capacidad de cálculo paralelo, que en la actualidad se logra gracias al uso de hardware dedicado como GPUs y FPGAs.
Referencias bibliográficas
- Manyika J, Chui M, Brown B, et al. Big data: The next frontier for innovation, competition, and productivity. Technical Report, McKinsey Global Institute, May 2011.
- LeCun Y, Bengio Y, Hinton G. Deep learning. Nature. 2015;521:436-44.
- Krizhevsky A, Sutskever I, Hinton GE. ImageNet Classification with Deep Convolutional Neural Networks, the 25th International Conference on Neural Information Processing Systems – NIPS 2012, Lake Tahoe, NV, USA, Dec. 2012, pp. 1097-105.
- Eklund A, Dufort P, Forsberg D, et al. Medical image processing on the GPU–Past, present and future. Medical Image Analysis. 2013;17:1073-94.
- Greenspan H, van Ginneken B, Summers RM. Deep Learning in Medical Imaging: Overview and Future Promise of an Exciting New Technique, IEEE Transactions on Medical Imaging. 2016;35, Special Issue on Deep Learning in Medical Imaging.