notistecnicas: De los datos a la inteligencia artificial

lunes, 6 de febrero de 2017

De los datos a la inteligencia artificial

Un artículo sobre los avances de Facebook en el reconocimiento de imágenes, que le permite ya establecer sistemas de búsqueda en función del contenido que aparece en ellas, me lleva a reflexionar sobre la importancia de la disponibilidad de datos de cara al desarrollo de algoritmos de machine learning e inteligencia artificial: a nadie se le escapa que la capacidad de Facebook para desarrollar estos sistemas de procesamiento y reconocimiento de patrones en imágenes tiene que ver ni más ni menos que con sus posibilidades de acceder a decenas de millones de imágenes etiquetadas y comentadas de sus usuarios en la propia red de Facebook y en la de Instagram.

A la hora de pensar en las posibilidades de la inteligencia artificial para nuestro negocio, tenemos que comenzar por las posibilidades de que disponemos para obtener datos que analizar. Datos que, además, no son todos creados iguales: no se trata solo de que el archivo en papel no vaya a servirnos de nada, sino que además, necesitamos formatos y herramientas suficientemente abiertos como para permitir su procesamiento, algo que no siempre es sencillo cuando hablamos de compañías que, durante mucho tiempo, procesaron sus datos en sistemas legacy de difícil integración.

El hecho de provenir de una etapa en la que muchas industrias se han preocupado de ponerse al día en temas relacionados con el llamado big data facilita en cierta medida esa tarea: cuando ya tienes data scientists en plantilla, lo mínimo que cabe esperar es que hayan llevado a cabo la limpieza y catalogación de las fuentes de datos con las que pretenden contar en sus analíticas y visualizaciones. Pero tras el big data, llega el siguiente paso: la inteligencia artificial. De hecho, los progresos en inteligencia artificial están llevando a los data scientists a darse cuenta de que necesitan evolucionar hacia esa disciplina, o ser considerados profesionales obsoletos.

Los datos son la auténtica gasolina que mueve la inteligencia artificial. La disponibilidad de datos nos permite desarrollar los mejores algoritmos, y sobre todo, mejorarlos a lo largo del tiempo para que vayan produciendo mejores resultados y se adapten a condiciones cambiantes. La disponibilidad de cada vez más datos en conducción autónoma a medida que sus flotas hacen más y más kilómetros es lo que permite a Tesla reducir el número de disengagements, episodios en los que el conductor se ve obligado a tomar el control, hasta los niveles actuales: tan solo entre octubre y noviembre del pasado 2016, cuatro vehículos autónomos de la compañía recorrieron 885 km en carreteras californianas, y experimentaron 182 de esos momentos, en lo que representa un punto de partida a partir del cual seguir mejorando con la experiencia acumulada. De hecho, Waymo, que cuenta con los datos acumulados por todos los experimentos en conducción autónoma de Google, consiguió a lo largo del año 2016 hacer descender el número de esos disengagements desde los 0.8 por cada mil millas, hasta los 0.2, en lo que supone una progresión impresionante alimentada, de nuevo, por la disponibilidad de datos que procesar.

El verdadero error en inteligencia artificial es pretender juzgar un algoritmo por sus resultados en el momento en que lo obtenemos, sin tener en cuenta los progresos que puede alcanzar a medida que dispone de más y mejores datos. Escribir una crítica sobre el Echo de Amazon diciendo que es poco menos que un despertador con radio un poco ilustrado es una actitud que olvida lo fundamental: que con ocho millones de dispositivos en el mercado, las posibilidades que Amazon tiene de ir mejorando la inteligencia de Echo son prácticamente ilimitadas, y que eso significa que cada vez nos entenderá mejor, que irá reduciendo progresivamente sus errores y que se convertirá, sin duda, en un aparato que terminaremos planteándonos cómo podíamos vivir sin él.

¿En qué deporte pueden plantearse primero la llegada de árbitros basados en inteligencia artificial? Por supuesto, en el fútbol americano, el ejemplo clásico de deporte en el que todo está cuantificado, analizado y procesado hasta el límite. ¿Qué compañías de seguros serán capaces primero de acceder a los ahorros y las mejoras de la peritación basada en inteligencia artificial? Aquellas que dispongan de grandes cantidades de datos correctamente almacenados y estructurados para poder procesarlos y entrenar con ellos a la máquina. ¿Qué instituciones académicas serán las primeras en extraer partido de la inteligencia artificial en el proceso educativo? Las que dispongan de archivos completos, correctamente estructurados y preparados para su tratamiento. Y puedo asegurar que eso, que parece tan básico, no lo tienen todas las instituciones que conozco.

Entender la evolución de los datos al machine learning y a la inteligencia artificial es, para cualquier directivo, cada vez más importante, y para una compañía, cada vez más estratégico. Es así como se decidirá qué compañías terminan a qué lado del nuevo digital divide.

This post is also available in English in my Medium page, “From data to artificial intelligence“

https://www.enriquedans.com/2017/02/de-los-datos-a-la-inteligencia-artificial.html