fbpx
Español Interfaces Conversacionales

Historia de las interfaces conversacionales

Aunque las interfaces conversacionales pueden parecer una tecnología nueva, el deseo de poder interactuar con las máquinas usando el lenguaje natural nos ha acompañado durante muchos más años de los que puedes imaginar. Mucho antes incluso de que Fritz Lang dirigiera Metrópolis, las personas soñaban con máquinas que pudieran hablar. Repasemos la historia de las interfaces conversacionales.

Read in English

Las grandes preguntas de la Edad Media

En el año 1000 el Papa Silvestre II aseguraba haber construido una máquina que era capaz de responder preguntas afirmativa o negativamente. El nombre de este Papa antes de ser Papa era Gerbert de Aurillac, y aparece en la Wikipedia como un humanista antes del humanismo. Fue el responsable de la introducción de los numerales decimales en Europa, inspirados en los numerales árabes. Era un hombre tan avanzado a su tiempo que los rumores decían que su inteligencia y clarivisión venían de un pacto con el diablo. 

Doscientos años después otro religioso, Ramón Llull, sienta las bases de la idea de las máquinas capaces de dar respuestas en su Ars Magna. Ramón Llull piensa a lo grande y sueña una máquina capaz de responder cualquier pregunta y de probar cosas tan complicadas como la existencia de Dios. Se considera una de las primeras ideas sobre Inteligencia Artificial, estos son algunos de los diagramas con los que Ramón Llull explicaba cómo imaginaba estas máquinas pensantes.

Diagramas del Ars Magna de Ramón Llull

Robert Grosseteste fue otro religioso que hizo avances en el campo de la lógica y que intentó utilizarla para resolver el misterio de la Trinidad. Construyó en el siglo XII una cabeza de bronce a la que podía pedirle respuestas. En el siglo XIII Robert Bacon y Alberto el Grande comenzaron a construir máquinas con forma de cabeza que, según proclamaba él mismo Alberto el Grande, podían predecir el futuro. Este tipo de creaciones, en aquella época, se seguían viendo como algo demoníaco y no como trucos o invenciones, así que se dice que el mismo Tomás de Aquino destruyó la cabeza parlante de su amigo Alberto para protegerle.

Personalmente creo que había en estas cabezas mucho de truco de magia. En el libro El Quijote, publicado por el español Miguel de Cervantes en 1605, el capítulo 62 se centra en la aventura de Don Quijote con una cabeza encantada que puede responder las preguntas que se le susurran al oido. En este caso el engaño se lleva acabo a través de falsos fondos y sospecho que era el caso en muchas de las cabezas parlantes que vemos en estas historias.

Cabezas parlantes: juguetes para Reinas y filósofos

En 1650 Athanasius Kircher escribe Misurgia Universalis, un libro en el que da detalles sobre cómo crear una cabeza que parezca humana y que sea capaz no sólo de reproducir sonidos sino también de mover sus ojos y su boca y que creo que es un poco como este libro pero en aquella época. Poco después, en 1662, Descartes estudia sobre estas máquinas y escribe “Imagino el cuerpo humano como una estatua o máquina hecha de tierra… vemos relojes, fuentes artificiales, molinos y otras máquinas similares que, a pesar de estar hechas por el hombre, tiene capacidad para moverse con fuerza propia en muchas maneras”. Estos escritos motivan a Athanasius Kircher a emprender sus propios estudios sobre el tema y a escribir, en 1673, 23 años después del Misurgia Universalis, su libro Phonurgia Nova.

En el siglo XVIII la Reina Cristina de Suecia comisiona a Valentín Merbitz para construir una de estas cabezas parlantes para ella. De acuerdo con las historias de la época la cabeza parlante de la Reina Cristina podía hablar 5 idiomas y funcionaba gracias al ventrilocuismo. Al parecer este tipo de cabezas parlantes fueron populares en la época, y dejaron de ser consideradas artes oscuras para ser apreciadas como avances e invenciones científicas y tecnológicas.

Este cambio en la percepción de las interfaces conversacionales hace posibles muchos de los avances de los años siguientes. En este siglo comienzan los trabajos en interfaces conversacionales en Universidades y Academias. Abate Mical crea dos cabezas parlantes que son capaces de mantener una conversación en la Real Academia de las Ciencias de París. Este trabajo le lleva 30 años y le arruina financieramente, pero es tan relevante que inspira a Lavoisier y Laplace, dos de los científicos más relevante de la época, a escribir una descripción exhaustiva de la máquina, incluyendo el funcionamiento del mecanismo interno que hace funcionar esta máquina parlante bicéfala.

Creando voz

Wolfgang von Kempelen construyó en el siglo XIII una máquina que era capaz de reproducir diferentes acentos. No tenía apariencia humana. Iba acompañada de un libro que explicaba el mecanismo en detalle. Años después, ya en el siglo XIX, un inventor austríaco llamado Joseph Faber creó una máquina llamada Euphonia que podía generar sonidos que parecían una voz humana son un sistema de cuerdas y bolsas de aire manipulado a través de un teclado. Esta máquina no tenía forma humana, pero solía exponerse con el altavoz conectado a una máscara de mujer con un vestido.

Euphonia leaflet announcing "the wonderful talking machine of professor faber"

La Euphonia podría considerarse predecesora del Voder el siglo XX; el primer sintetizador de voz electrónica. Fue presentado por los Bell Telephone Laboratories en 1939. El Voder podía combinar diferentes sonidos para pronunciar palabras y componer frases y podía ser ajustado para producir diferentes tonos o voces. El Voder era un sistema operado de manera manual, que requería tiempo y el uso de diez dedos, dos pedales, una palanca que se activaba con la rodilla y un sistema que se usaba con el brazo para producir sonidos. A pesar e esta complejidad el Voder fue el rey durante muchos años y su calidad mejor que la de muchos sintetizadores incluso en la década de 1990.

El juego de la imitación

En los años 1950 se alcanzaron varios hitos en el campo de la Inteligencia Artificial y las interfaces conversacionales y tiene lugar un hito muy relevante en la historial de las interfaces conversacionales.

En 1950 Alan Turing propuso su test  para determinar la inteligencia de las máquinas. Turing no proponía máquinas inteligentes que aprendieran autónomamente, sino máquinas programadas con suficiente realismo como para poder engañar a una persona y hacerle creer que dialoga con otra. Es lo que él llamaba el juego de la imitación, algo similar al test de Voight-Kampff de la película Blade Runner.

Seis años después, en 1956, McCarthy organiza la Conferencia de Dortmund, el primer evento profesional sobre inteligencia artificial en el que se acuñó precisamente el término. Un año después, en 1957, Noam Chomsky introduce su teoría de la gramática generativa, clave en el estudio del procesamiento de lenguaje natural.

En la década de 1960 el mundo vive un nuevo interés en la inteligencia artificial y son creados los primeros chatbots: Joseph Weinzembaum publica Eliza en 1966. No podía entender realmente el lenguaje natural pero usaba recursos, como repetir palabras clave de las frases que decían los usuarios para crear una ilusión de diálogo. Este me parece un ejemplo perfecto de que muchas veces el diseño de las soluciones es más importante que la tecnología que tengamos realmente a nuestro alcance.

En 1970 Winograd publica su proyecto SHRDLU, un procesador de lenguaje natural que puede operar objetos en un mundo limitado de pirámides y prismas representado en una interfaz gráfica. En 1972 tiene lugar el lanzamiento de PARRY, que puede imitar a una persona con esquizofrenia paranoide. Hay una anécdota divertida sobre este chatbot: Enfrentan a PARRY a varios profesionales, camuflado entre un grupo de pacientes psiquiátricos. Se les pregunta qué diálogos son con pacientes reales y cuántos con PARRY y aciertan menos de la mitad de las veces. La ventaja de PARRY sobre Eliza es que los médicos esperan a alguien incoherente, espontáneo y un poco fuera de lo normal. PARRY se ajusta a este papel mejor que algunos esquizofrénicos. 

Hasta finales de los años 80, con el lanzamiento de Jabberwacky en 1988 (el mismo año en el que yo nací), el mundo tecnológico está demasiado ocupado con el nacimiento y la adopción en masa de Internet como para pensar en maneras innovadoras de interactuar con ellas. Discretamente, en 1995 nace ALICE, un remix de ELIZA con las tecnologías disponibles entonces, y en 1997 Jabberwacky empieza a funcionar online.

Todo llega, también la adopción masiva (si bien moderada) de las interfaces conversacionales. En 2001, con SmarterChild, se produce la primer adopción masiva de un chatbot en la historia, y este chatbot de AIM y MSN Messenger (la plataforma que hizo mainstream la mensajería instantánea en la que IRC fue pionera) llega a millones de usuarios.

El renacer de la historia de las interfaces conversacionales

Hemos tardado más de 15 años en volver a hablar con chatbots en nuestras apps de mensajería, parece que es ahora cuando los adolescentes que chateabamos divertidos entonces miramos atrás y empezamos a verlos de forma productiva. 

En 2011, con el lanzamiento de Siri, vivimos un resurgir de la voz y el lenguaje natural.Cuando Apple lanzó este asistente, que por primera vez seguía los juegos de los usuarios y les daba respuestas ocurrentes, todo cambió. Tras Siri, Alexa y Google Assistant, además de los miles de chatbots que surgieron en plataformas como Slack, Facebook Messenger o Telegram, nuestra interacción con las máquinas nunca volverá a ser la misma.

Andamos sobre los hombros de gigantes: las ideas de la edad media hicieron posibles los avances de los años 60, que son la base para las interfaces conversacionales con las que interactuamos hoy en día. Nadie dijo que la Transformación Digital fuera rápida.

¿Quieres transformar tu negocio? Hablemos sobre
interfaces conversacionales.

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.

historia-de-las-interfaces-conversacionales-bull-cristina-santamarina
%d bloggers like this: