lunes, 2 octubre 2023

La incoherencia en las respuestas es uno de los puntos débiles de los programas de “inteligencia artificial”

Al azar

Es comprensible que los programas que llamamos de “inteligencia artificial” no sean perfectos y cometan errores. Si la base de datos que consultan para dar respuestas a los usuarios tiene errores, el programa los trasladará. Lo que ma perece menos admisible es que cometan errores básicos de coherencia interna de la información.

Me refiero a que es bastante habitual que en una respuesta dada a la consulta de un usuario haya dos o más frases o párrafos que se contradicen entre sí. No tengo la menor duda de que en el futuro los programadores van a paliar o resolver este defecto, pero lo que quiero decir es que a día de hoy existe. Pondré tres ejemplos reales de consultas hechas a uno de los más populares sistemas de “inteligencia artificial” para demostrar que incurre en graves inconsistencias en sus respuestas.

Ejemplo 1: Juliane Koepcke

Pregunté al programa quién es Juliane Koepcke. Me dio una respuesta aparentemente bien documentada de la que extraigo estas frases:

Juliane Koepcke es una sobreviviente de un accidente aéreo notorio que ocurrió en la selva amazónica en 1971 (…). Su madre, María Koepcke, era una ornitóloga alemana, y su padre, Hans-Wilhelm Koepcke, era un zoólogo alemán (…). A los 17 años, el 24 de diciembre de 1971, Juliane y su madre abordaron un vuelo de LANSA Airlines con destino a la ciudad de Pucallpa, en la selva amazónica peruana.
Trágicamente, el vuelo LANSA Flight 508 se encontró con una tormenta eléctrica violenta en pleno vuelo, y el avión fue alcanzado por un rayo (…). Juliane Koepcke, milagrosamente, sobrevivió a la caída del avión. Aunque sufrió múltiples heridas, incluyendo una fractura en el brazo, una cortada en la pierna y una lesión en los ojos, logró abrir su paracaídas que se había activado durante la caída (…). Finalmente, después de caminar sola en la selva durante nueve días, fue encontrada por miembros de una tribu local (…). Juliane Koepcke se reunió con su padre, quien también había sobrevivido al accidente, pero lamentablemente su madre no sobrevivió al impacto inicial.

No quiero criticar que el programa me informara de que Juliane fue “una superviviente” del accidente en vez de la única superviviente, como así sucedió. Ni me preocupa no entender qué es eso de la “cortada en la pierna” (no sé si es que la pierna resultó amputada traumáticamente o simplemente que Juliane se hizo uno o varios cortes al caer en la selva). Lo que me desconcierta es que el programa diga en un párrafo que Juliane subió al avión con su madre y en otro que su padre también sobrevivió al accidente (insisto en que solo sobrevivió ella).

Para salir de dudas le pregunté de nuevo al programa: “Me dice que “Juliane y su madre tomaron un vuelo”, lo que me hace deducir que no lo tomó su padre. Sin embargo, en otro párrafo me dice que su padre sobrevivió.

Y el programa me respondió:

Mis disculpas por la confusión en mi respuesta anterior. Cometí un error en la narración. Juliane Koepcke y su madre, María Koepcke, efectivamente tomaron el vuelo juntas. El padre de Juliane, Hans-Wilhelm Koepcke, no estaba en ese vuelo y, por lo tanto, no fue una de las víctimas del accidente. Gracias por señalar la discrepancia, y lamento la confusión.

Por otra parte, la frase “logró abrir su paracaídas que se había activado durante la caída” también me pareció que albergaba una incongruencia. Si el paracaídas se había activado, ¿no implica que se abrió? Entonces, ¿cómo me dice el programa que lo abrió ella? Así que le pregunté: “¿qué quiere decir con que “logró abrir su paracaídas que se había activado durante la caída”? Si se había activado, ¿eso no implica que se había abierto?“. Me contestó:

Tienes razón, mi explicación fue redundante y confusa. Cuando mencioné que el paracaídas de Juliane Koepcke “se había activado durante la caída”, quería decir que el paracaídas se había abierto automáticamente como resultado del impacto o de alguna forma durante la caída del avión. En otras palabras, el paracaídas se desplegó sin que Juliane tuviera que hacerlo manualmente. Lamento la falta de claridad en mi respuesta anterior.

Pero estas contradicciones me hicieron sospechar de que la información que me estaba dando era errónea. Y lo es, porque Juliane no dispuso de ningún paracaídas. Le dije al programa: “Acabo de consultar tres fuentes que me parecen fidedignas y ninguna de ellas dice que Juliane dispusiera de un paracaídas. Es decir, que cayó sin paracaídas. ¿Es correcto?“. Me contestó:

Mis disculpas nuevamente por la información incorrecta proporcionada anteriormente. Tienes razón, Juliane Koepcke no disponía de un paracaídas cuando cayó del avión, y mi afirmación anterior fue errónea. La supervivencia de Juliane se debió a la caída del avión y su posterior lucha por sobrevivir en la selva sin el uso de un paracaídas. Agradezco tu corrección y lamento la confusión.

La respuesta me creó nuevas dudas. ¿La supervivencia de Juliane se debiera a la caída del avión (!) y a su lucha por sobrevivir en la selva sin paracaídas? ¿Quiere decir que el paracaídas le habría venido bien para construirse una tienda de campaña?

En fin, di por inútil continuar preguntando a la “inteligencia artificial” y por imposible sacar algo en claro. Cada pregunta mía hacía que el programa desbarrara más.


Cristales de cobre (James St John, Flickr).

Ejemplo 2: propiedades del cobre

En otra ocasión le pregunté al programa: “¿Qué consecuencias tiene para el cobre tener una configuración electrónica anómala?

Me respondió:

La configuración electrónica anómala del cobre se refiere a la forma en que los electrones se distribuyen en sus diferentes niveles y subniveles de energía. El cobre tiene una configuración electrónica anómala en su estructura de electrones debido a que un electrón del subnivel 4s se desplaza al subnivel 3d, resultando en una configuración 3d10 4s1 en lugar de lo que podríamos esperar intuitivamente, que sería 3d9 4s2. Esta anomalía tiene algunas consecuencias notables en las propiedades del cobre.

Las propiedades del cobre que resultan de esta configuración electrónica anómala incluyen: (…) : Propiedades magnéticas: La configuración electrónica anómala en el cobre también contribuye a su débil magnetismo. Los electrones desapareados en el subnivel 3d permiten una interacción magnética débil (…).

(…) Debido a la disponibilidad de electrones en diferentes subniveles, el cobre puede tener múltiples estados de oxidación, lo que le permite formar una variedad de compuestos químicos

Le planteé al programa este reparo básico: “Me dice que “los electrones desapareados en el subnivel 3d permiten una interacción magnética”. ¿El cobre tiene electrones desapareados en el nivel 3d? Que yo sepa, todos están apareados y usted mismo me lo ha confirmado diciéndome correctamente que la configuración es tipo d10“.

Me respondió:

Mis disculpas por la confusión. Tienes razón, en su estado fundamental, todos los electrones en el cobre están apareados en el subnivel 3d. La configuración electrónica anómala del cobre se refiere al hecho de que un electrón del subnivel 4s se desplaza al subnivel 3d, pero no resulta en electrones desapareados en el subnivel 3d. Los electrones en el subnivel 3d están apareados en pares en lugar de estar desapareados (…). Lamento el error y agradezco la corrección.

Además le señalé otro aspecto que en este caso no es un problema de incongruencia, sino simplemente un error: “También me dice que el cobre puede tener múltiples estados de oxidación. Que yo sepa, básicamente solo tiene estados de oxidación +1 y +2″. Me contestó:

Tienes razón nuevamente, y te agradezco por señalar estas inexactitudes. El cobre tiene principalmente dos estados de oxidación comunes: +1 y +2. El estado de oxidación +1 es más común en compuestos como el óxido de cobre (I) y los compuestos de coordinación, mientras que el estado de oxidación +2 se encuentra en compuestos como el óxido de cobre (II) y muchas sales de cobre. Lamento los errores anteriores y agradezco tu paciencia al aclarar estos puntos.


Ejemplo 3: supercarguero Blue Marlin

En una tercera consulta quise conocer las características de los barcos semisumergibles Blue Marlin y Black Marlin. Me respondió entre otras cosas:

El Blue Marlin, construido en 2000, tiene una longitud de 217 metros y una capacidad de carga de hasta 76.000 toneladas métricas. Tiene una cubierta abierta de carga de 63 metros de ancho, que puede acomodar cargas extremadamente grandes. El Black Marlin, construido en 2012, es ligeramente más pequeño, con una longitud de 217 metros y una capacidad de carga de hasta 76.311 toneladas métricas.

Me resultó extraño que si los dos barcos tienen igual longitud y el segundo tiene una capacidad de carga algo superior se pueda decir que este segundo sea “ligeramente más pequeño” que el primero.

Por otra parte, en dos párrafos distintos el programa da estas informaciones:

El Blue Marlin, construido en 2000, tiene una longitud de 217 metros y una capacidad de carga de hasta 76.000 toneladas métricas.

MV Blue Marlin (anterior): Antes de la construcción del barco Blue Marlin mencionado anteriormente, existía otro barco con el mismo nombre. Construido en 2000, era un buque semisumergible de carga pesada similar en función al actual Blue Marlin, aunque de menor tamaño y capacidad de carga.

Si ambos navíos (Blue Marlin y MV Blue Marlin (anterior)) se construyeron en 2000 me resultó extraño que el programa señalara que uno era “anterior” al otro. Incluso si fueron botados con una diferencia de meses en el año 2000, no creo que esa diferencia sea suficientemente significativa como para indicar que uno es “anterior”. En temas de dos barcos con características parecidas (e inusuales) y del mismo nombre yo entendería que el calificativo “anterior” sea aplicable a un barco que estuvo navegando años antes de construirse el segundo y que ya dejó de prestar servicio. Eso sin mencionar lo chocante que me resulta que se haya bautizado con el mismo nombre a dos barcos tan especiales (¡son supercargueros semisumergibles!) construidos el mismo año (2000).

Todo esto me hizo sospechar que la información podía ser errónea. Indagué y no encontré que existieran dos supercargueros semisumergibles llamados Blue Marlin construidos el mismo año. Por otra parte, y aunque no es mi propósito señalar errores de estos programas, sino incoherencias, traslado aquí los datos que encuentro en la Wikipedia sobre los buques Blue Marlin y Black Marlin:

  • Blue Marlin: 224,8 m de eslora, 63,1 m de manga, 76061 Tm de capacidad de carga, construido en el año 2000.
  • Black Marlin: 217,8 m de eslora, 42 m de manga, 56500 Tm de carga, construido en 1999.

¿Habría confundido el programa al Black Marlin con el “anterior” MV Blue Marlin del que me habló?


Comentarios finales

Comprendo perfectamente que dotar de total coherencia a un programa que da elaboradas respuestas a dudas pueda ser difícil. Yo no trato de criticar que estos programas incurran en tales incoherencias (aunque me cuesta creer que sea difícil programar la respuesta a la pregunta “¿qué barco es más grande?” a partir de las dimensiones de dos barcos). Lo único que quiero es transmitir mi experiencia a los usuarios de estos sistemas de “inteligencia artificial” para advertirles de que tengan cuidado con las respuestas que reciben y para animarlos a que las lean con mucho espíritu crítico.

Para mí, estos programas actualmente hacen gala de una gran “erudición” gracias a que los programadores han sabido darles muy buena de capacidad de consulta en bases de datos. Además, los programas expresan esta “erudición” de manera que parece que son “inteligentes”. Pero la incapacidad de reparar en algunas inconsistencias demuestra que actualmente esa “inteligencia” es muy limitada. Eso no quiere decir que sea imposible resolver el problema; de hecho, en los próximos años el problema seguro que lo resuelven en alto grado. Hace años los programas de traducciones de idiomas eran también muy primitivos y hoy día traducen asombrosamente bien, en general. Pues lo mismo ocurrirá con los de consultas de dudas.

- Publicidad -

Relacionados

Dejar un comentario

- Publicidad -

Últimos artículos