La IA de debate de IBM ya es capaz de ayudarnos a tomar decisiones
La nueva versión de Project
Debater, entrenada mediante una técnica de inteligencia artificial
llamada minería de argumentos, puede analizar muchas fuentes distintas
para encontrar frases relacionadas con un tema, decidir si están a favor
o en contra y usarlas para construir un argumento sólido.
Aunque los ordenadores nos han guiado hasta la Luna y de vuelta,
son incapaces de ayudarnos a tomar las decisiones más importantes a las
que nos enfrentamos hoy en día. ¿Debería Donald Trump ser sometido a
juicio y destituido de su cargo? ¿Debería Reino Unido abandonar la Unión
Europea? ¿Debería Australia dejar de exportar combustibles
fósiles? Aunque pueda parecerlo, este tipo de preguntas no pueden responderse con un simple sí o no.
Para tomar decisiones, sopesamos las ventajas y los inconvenientes de
todas las opciones disponibles. Y este es un proceso en el que la
inteligencia artificial (IA) podría ayudarnos con su capacidad de
analizar los montones de datos que no paran de aumentar. De hecho, si
queremos que la IA sea realmente útil, debería razonar más como lo
hacemos nosotros. El investigador del Centro de Tecnología de Argumentos
de la Universidad de Dundee (Reino Unido) Jacky Visser afirma:
"Utilizamos un lenguaje persuasivo y todo tipo de conocimientos básicos que son muy difíciles de modelar en IA. Este ha sido uno de los santos griales desde que se empezó a pensar en la IA".
La principal técnica utilizada para ayudar a las máquinas a razonar
se conoce como minería de argumentos y consiste en crear software para
analizar documentos escritos de los que extraer frases clave como
pruebas a favor o en contra de alguna afirmación. Luego, todas estas frases se pueden combinar para dar lugar a un argumento. Además
de ayudarnos a tomar mejores decisiones, estas herramientas podrían
usarse para encontrar noticias falsas (socavando las afirmaciones poco
fiables y respaldando las factuales) o para filtrar los resultados de
búsqueda online, destacando declaraciones relevantes en vez de documentos completos.
El trabajo de otros grupos en la minería de argumentos se ha centrado
en tipos específicos de textos, como documentos jurídicos o trabajos
académicos, que suelen tener una gran cantidad de argumentos
estructurados. Eso resulta útil para crear un resumen de todas las
pruebas presentes en muchos documentos diferentes en un caso judicial,
por ejemplo. Pero el objetivo final consiste en construir un sistema capaz de rastrear tantas fuentes de información como sea posible y de crear un argumento a partir de todas las pruebas encontradas.
IBM acaba
de dar un gran paso en esa dirección. El equipo de Project Debater de
la compañía ha pasado varios años desarrollando una IA capaz de generar
argumentos. El año pasado, IBM demostró su tecnología en desarrollo en un debate en directo contra el mejor participante de debates del mundo, en un enfrentamiento equivalente al del asistente Watson en el programa Jeopardy!
Estos duelos son divertidos y ofrecen una prueba de concepto. Ahora IBM
está convirtiendo su juguete en una herramienta realmente útil.
La versión del Project Debater que IBM usó en los debates en directo
contaba con las capacidades básicas, como la de buscar en cientos de
millones de artículos nuevos. Pero en los meses posteriores, el equipo
ha modificado bastante las redes neuronales que utiliza, lo que ha mejorado la calidad de las pruebas que el sistema puede descubrir. Una ampliación importante es BERT,
la red neuronal creada por Google para el procesamiento del lenguaje
natural, que puede responder preguntas. El trabajo será presentado en
febrero durante la conferencia de la Asociación para el Avance de la
Inteligencia Artificial que se celebrará en Nueva York (EE. UU.).
Para entrenar su IA, el investigador principal, Noam Slonim, y sus
colegas de IBM Research en Haifa (Israel) recurrieron a 400 millones de
documentos de artículos de periódicos y revistas tomados de la base de
datos LexisNexis. Esto les dio unos 10.000 millones de frases, es decir,
un volumen lenguaje natural aproximadamente 50 veces mayor que Wikipedia. Combinaron
este enorme conjunto de pruebas con las afirmaciones sobre varios
cientos de temas diferentes, como "Donar sangre debería ser obligatorio"
o "Deberíamos dejar de celebrar el Día de San Valentín".
Luego pidieron a los trabajadores de la plataforma Figure Eight que etiquetaran las frases en función de si proporcionaban pruebas a favor o en contra de las afirmaciones específicas. Los datos etiquetados se fueron introduciendo en un algoritmo de aprendizaje supervisado.
La red neuronal resultante es capaz de responder preguntas sobre una amplia variedad de temas, devolviendo frases que resultan más relevantes que las de los sistemas anteriores. Clasifica
las frases que encuentra de acuerdo a su calidad como prueba. Por
ejemplo, ante la afirmación "Donar sangre debería ser obligatorio", el
software encontró la frase "Un estudio publicado en The American Journal of Epidemiology encontró que los donantes de sangre tienen un 88 % menos de riesgo de sufrir un ataque cardíaco y un derrame cerebral".
El gran desafío consiste en diferenciar las frases que ofrecen
evidencias de las que no lo hacen, aunque contengan los mismos
términos. Por ejemplo, para el tema de las donaciones, Project Debater
también encontró una frase que decía: "Las estadísticas del Banco de
Sangre de Nakasero muestran que los estudiantes son los principales
donantes de sangre, contribuyendo con aproximadamente el 80 % de la
sangre donada en todo el mundo". Sin embargo, el sistema no fue capaz de
averiguar si dicha frase apoyaba el argumento o no.
Según Slonim, no está del todo claro por qué la red neuronal capta
estas frases para hacer su clasificación. Aún así, cuando se probó, Project Debater logró un 95 % de precisión para las 50 frases más importantes
en 100 temas diferentes. Para Slonim, "estos números son inauditos".
Otros sistemas solo han conseguido abordar unas pocas docenas de
temas. Las cifras también suponen un gran avance frente al sistema de
debate en directo que Slonim mostró el año pasado.
Otros investigadores con los que hablé, incluidos Visser y Oana
Cocarascu, que estudian software de argumentación y procesamiento de
lenguaje natural en el Imperial College de Londres (Reino Unido),
también quedaron impresionados con el nuevo sistema. Para
Cocarascu, lo más fascinante es su potencial para aplicarse en el mundo
real. Ningún sistema entrenado exclusivamente con documentos jurídicos
podría hacer frente a los diferentes tipos de pruebas que se encuentran online. El equipo de Slonim ha demostrado que Project Debater es capaz de manejar esta amplia gama de fuentes. "Eso es lo que lo hace genial", asegura Cocarascu.
El equipo está publicando ahora sus datos de entrenamiento para que
otros puedan usarlos. Visser quiere crear herramientas de minería de
argumentos como Project Debater capaces de evaluar la calidad de los
argumentos, buscando el sesgo cognitivo, por ejemplo. El equipo también
ha utilizado la inteligencia artificial para valorar la calidad de los argumentos en los debates presidenciales de EE. UU. en 2016.
IBM está haciendo algo similar. A través de un complemento, llamado
Speech by Crowd, Project Debater puede reunir argumentos de los
participantes a favor y en contra de una propuesta y evaluar automáticamente su calidad utilizando
una red neuronal entrenada en un conjunto de datos de alrededor de
30.000 argumentos previamente calificados por humanos.
IBM planea ofrecer Project Debater a empresas y gobiernos. El
portavoz de la compañía, Christopher Sciacca afirma: "Vemos el futuro de
Project Debater como un servicio de inteligencia artificial en la
nube". En una aplicación que sirvió como ejemplo, IBM recolectó 3.500 opiniones de ciudadanos
de Lugano (Suiza) sobre si la ciudad debería invertir en vehículos
autónomos y usó la IA para extraer y evaluar los argumentos a favor y en
contra de la propuesta. El Gobierno local podría usar esos resultados
como ayuda para tomar una decisión definitiva.
Pero para Slonim, se trata de mejorar nuestra interacción con la IA a
nivel personal. El argumento tiene un papel importante en la forma en
la que las personas se comunican: enumeramos las razones de nuestras
decisiones, pedimos consejo, persuadimos y convencemos a los
demás. Hablar con asistentes virtuales capaces de conversar a ese nivel
resultaría mucho más natural. El responsable concluye: "Lo que hacemos
es fundamental para nuestras vidas. Estamos intentando vincular las
tecnologías de comprensión del lenguaje para ayudar a las personas a tomar mejores decisiones".
-- https://www.technologyreview.es/s/11830/la-ia-de-debate-de-ibm-ya-es-capaz-de-ayudarnos-tomar-decisiones?fbclid=IwAR2LLN4eH1JpFBw871i2YZRF-H3zl-GEhhvOPaQWqnvA9mKxug5M0wdtMgo
No hay comentarios:
Publicar un comentario