Blog 
Crónicas Informáticas
RSS - Blog de crnicas_informticas

El autor

Blog Crónicas Informáticas - crnicas_informticas

crnicas_informticas

Los autores de este blog son profesionales de la informática, miembros de los Colegios Oficiales de Ingenieros en Informática e Ingenieros Técnicos en Informática del Principado de Asturias.

Sobre este blog de Tecnologia

En este blog, profesionales de la informática asturianos, rendiremos homenaje al escritor Ray Bradbury. No iremos a Marte, pero sí narraremos la crónica de la transformación digital de la sociedad.


Archivo

  • 15
    Febrero
    2018

    Comenta

    Comparte

    Twitea

    SOCIEDAD Oviedo

    El manuscrito Voynich y la inteligencia artificial

    El manuscrito Voynich y la inteligencia artificial

    Una de las grandes preguntas que la humanidad se plantea es si las máquinas pueden pensar o no (o si podrán hacerlo). En definitiva, eso nos lleva a definir qué es pensar para una máquina. Y la informática es, obviamente, la disciplina que más de cerca afronta esta cuestión; el cerebro es un sistema que maneja información, y no sabemos si es algo más o no. Si no fuese más (¡ni menos!) que eso, no se distinguiría cualitativamente de los sistemas que los informáticos construimos todos los días (excepto por una cuestión evidente de magnitud).

    La elusiva cuestión de qué es la consciencia se ha venido sorteando con diversas definiciones para la “inteligencia artificial” (IA), que es toda una rama de la informática. Sería largo desarrollarlo aquí, pero podemos decir que la IA tiene que ver con el razonamiento y la conducta. Que una máquina resuelva un problema para el que ha sido diseñada no se considera inteligente, por mucho que pueda impresionar.

    El término IA es ya muy antiguo. Pero en los últimos tiempos, no sé si por culpa de Spielberg, hemos visto cómo se utiliza cada vez más, a la ligera y con intención puramente enfática. Hoy en día se llama IA a cualquier sistema informático vistoso, porque resulta más aparente que llamarlo “programa”. Todos los días nos encontramos con que alguien ha resuelto algún problema “con una IA”.

    Un ejemplo reciente lo dio el manuscrito Voynich. Es un manuscrito del siglo XV, con ilustraciones y un texto cifrado, que hasta ahora no se ha podido descifrar. Hace poco saltaron a los medios titulares como este: “Una inteligencia artificial descifra el Códice Voynich, el libro más misterioso del mundo”.

    Lo bueno es que uno puede encontrar el artículo en el que al parecer se basó la noticia (Decoding Anagrammed Texts Written in an Unknown Language and Script, por Bradley Hauer y Grzegorz Kondrak, del Departamento de Informática de la Universidad de Alberta) y ver realmente qué ocurrió.

    El manuscrito Voynich resulta difícil de descifrar porque no se sabe en qué idioma está el mensaje original, ni qué alfabeto se ha usado para representarlo, ni qué transformación (cifrado) se ha utilizado sobre las palabras.

    Para empezar, los autores se basan en ciertas hipótesis. Como el texto del Voynich tiene solo unas docenas de símbolos, suponen que esos símbolos se corresponden con letras del alfabeto original. Suponen también que en las palabras las letras se han desordenado (anagramas). Y suponen (basándose en estudios de otros autores) que el texto se ha escrito con un sistema abyad, es decir, que se escriben solo las consonantes y no las vocales (esto último ocurre con muchas lenguas semíticas; el alfabeto hebreo, por ejemplo, no representa las vocales). Nótese que esto son ya tres suposiciones, más o menos verosímiles pero nunca demostradas; una hipótesis igualmente válida es que el manuscrito no signifique nada.

    La primera tarea de los investigadores es averiguar en qué lengua está escrito. Proponen tres métodos; por ejemplo, el primero es la frecuencia con que aparece cada carácter. Una medida puramente estadística, pero que a veces permite detectar una lengua. El segundo método es igualmente estadístico, y el tercero es un algoritmo un tanto más sofisticado. En todo caso, los tres son algoritmos clásicos, como los empleados desde los primeros días de la informática.

    Para desarrollar y probar sus métodos, utilizan una muestra de textos, desarrollada por otros investigadores en 2014, y que consiste en una traducción de la Declaración Universal de Derechos Humanos (un texto de unas 1700 palabras) a 380 idiomas. Luego refinan sus métodos con textos de la Wikipedia en solo 5 lenguas.

    Cuando aplican los métodos a muestras del Voynich, según el primer método la lengua más probable es... una lengua precolombina (cosa imposible a principios del siglo XV). Según el segundo método, sería el hebreo, seguida de malayo y árabe. Y con el tercer método, que ellos han desarrollado y ajustado, los candidatos serían hebreo y esperanto (que no existía en el siglo XV).

    Los autores no afirman, en modo alguno, haber descifrado el manuscrito. Han aplicado ciertas técnicas para dar el paso de... simplemente, identificar el idioma en el que está escrito, y como un mero caso de estudio. En sus conclusiones finales mencionan el Voynich casi de pasada.

    Y no hay absolutamente nada de inteligencia artificial. Hay mucha inteligencia, sí, pero de los autores. Han estudiado muchos trabajos anteriores, han interpretado los resultados y ajustado sus programas, han sacado conclusiones. Y han aprendido algo sobre cómo se podría identificar el idioma en el que está escrito un texto cifrado (aquí en Oviedo conozco a algún que otro experto en lingüística computacional, materia ciertamente fascinante). No han llegado más allá. No es poca cosa, pero el manuscrito está más o menos donde estaba antes.

    Y por cierto, deberíamos dejar de decir “inteligencia artificial” y de adornar las historias.

     

    Agustín Cernuda del Río

    Colegio de Ingenieros en Informática del Principado de Asturias

     

    Compartir en Twitter
    Compartir en Facebook