Víctor Gómez Pin
“Los animales no humanos viven reducidos a imágenes y recuerdos y la experiencia es para ellos poco fructífera, mientras que (por intermediación de la experiencia), los hombres acceden a la técnica y al razonamiento” (Aristóteles, Metafísica 980 b, 25-28).
La forma de aprender de entidades artificiales como una red neuronal, por su similitud (cuando menos aparente) con el aprendizaje humano, incluidas las maneras de superar momentos de atasco, es motivo de estupefacción. Empezaré con un símil.
Supongamos que un boxeador de éxito tiene a su disposición en el gimnasio un excelente sparring. Ante este, el boxeador se enfrenta de manera menos agresiva que ante un verdadero rival, pero de manera no huera, es decir: tras el entrenamiento sabrá cómo reaccionar eficazmente ante ciertas actitudes o posiciones adoptadas por el partenaire, y en el próximo entrenamiento dejará de cometer fallos que se apreciaron en el primero. Podemos decir que ha aprendido a reconocer características de aquello a lo que se confronta, que en este caso no es un contrincante sino un cómplice.
Cabe pensar que, si en el gimnasio cuenta con más de un sparring, pongamos diez, este aprendizaje será mayor; tendrá un espectro más rico de potenciales ataques por parte del contrario o dispositivos de defensa ante los ataques propios y, reconociéndolos a la hora de enfrentarse a adversarios reales, ello le será de gran utilidad. Pues bien, supongamos ahora la situación siguiente:
Al enfrentarse de nuevo a los diferentes sparring con los que ya había entrenado, efectivamente da muestra de gran acuidad, reconociendo todas las técnicas y tics de manera que se percibe una superioridad que no se manifestaba en el primer entreno. Sin embargo, a la hora de enfrentarse a verdaderos rivales, es decir, a boxeadores con los que no se había entrenado, se revela torpe y, para sorpresa de los que habían apostado a sus grandes facultades pierde los sucesivos combates. La pregunta que se impone es: ¿de dónde este contraste entre eficacia en los entrenamientos y torpeza en los combates en los que realmente se la juega? Un esbozo de explicación es el siguiente:
Nuestro hombre retiene los movimientos, técnicas, actitudes y en general rasgos característicos de cada uno de los púgiles con los que se entrena, pero no capaz de generalizarlos, es decir, de extenderlos a una clase de seres humanos marcados por características análogas. En términos aristotélicos: en nuestro hombre se inscriben los rasgos de comportamiento de individuos, pero no extiende tales rasgos a los representantes de un colectivo. Si la cosa no mejorara, su manager podría incluso empezar a considerar que seguir con los entrenamientos es inútil e incluso perjudicial, pues no tendrá otro resultado que reiterar reacciones inadecuadas, encelarse en los vicios.
Pues bien, sirva este símil para entender uno de los problemas que plantean las redes neuronales ocupadas en el reconocimiento de dígitos manuscritos. De hecho, hoy se muestran capaces de catalogar con precisión aspectos del rostro -una nariz, una boca-o un rostro por entero, distinguiendo, si es el de un animal o el de una persona, pero aquí me atengo al reconocimiento de números del 0 al 9. Pues bien, en ocasiones se da el siguiente caso:
Funcionan muy bien cuando se trata de clasificar dígitos de un conjunto destinado al entrenamiento, pero pierden su acuidad cuando se les enfrenta a un conjunto con el cual no se habían adiestrado. Y (utilizando una terminología proyectada desde el comportamiento humano) se conjetura entonces que tales artefactos están quizás sobre-entrenados (overtraining), o también sobre-ajustados (overfitting), señalando así que han quedado excesivamente marcados por datos contingentes, vinculados quizás exclusivamente a los dígitos individuales confrontados y no a lo que en cada uno de estos es representativo de algo general. Podríamos decir que captan el rasgo superfluo de un siete algo mal trazado y se le escapa aquello que en el seno de los diez dígitos (0, 1, 2 3…) caracteriza a la forma 7. El asunto es tan preocupante que hay técnicas para superar esta deficiencia, para evitar el sobre-entrenamiento o paliar sus consecuencias. Para referirme a una de estas técnicas vuelvo al símil de los sparrings:
Supongamos que estos (eventualmente uno sólo) han sido a su vez preparados para introducir nuevas respuestas a los gestos o ataques del púgil, sesgando, torciendo o encubriendo las reacciones originarias. En este caso, para familiarizarse con mayor variedad de comportamientos en el entrenamiento no se necesitará recurrir a nuevos sparring. Pues bien, si se trata de hacer más eficaz el entrenamiento de una red neuronal a la hora de reconocer dígitos manuscritos, sin necesidad de recurrir a un conjunto diferente de aquellos con los que ya se ha entrenado, una modalidad es, por ejemplo, hacer que estos giren en un determinado grado. La red neuronal entrenada para reconocer un 6, se entrenará asimismo para reconocer ese mismo 6 algo inclinado a izquierda o derecha, en el bien entendido de que si la inclinación es excesiva corre el peligro de confundirlo con un 9.
Sentado lo anterior, supongamos ahora que estas técnicas de corrección de errores han sido exitosas, y que ante un conjunto de dígitos manuscritos con los que aún no se había entrenado, la red neuronal reconoce prácticamente el cien por cien. Cabe decir que a través del entrenamiento la máquina se ha hecho sensible a la presencia de un rasgo (o de una conjunción de rasgos) que se repite, y reacciona ante el mismo, mientras que permanece indiferente a rasgos contingentes que pueden acompañar al primero. Así, la presencia de un círculo restringe las posibilidades a que se trate de un 0, de un 6 o de un 9, excluido por ejemplo que pueda tratarse de un 7 o un 2. Y es variable menor el que la línea que completa el 6 este eventualmente algo inclinada. Cabe decir que en esa reiteración que constituyen los entrenamientos la máquina ha alcanzado experiencia.
Y surge aquí una segunda pregunta. De esta máquina que emula a los humanos en experiencia ¿cabe decir que también emula a los humanos en lo referente a técnica? Necesario es naturalmente precisar qué entendemos por experiencia y qué entendemos por técnica. De ello me ocuparé en la próxima columna. Por el momento me limito a citar un texto por así decir canónico.
“Surge la técnica cuando una pluralidad de recuerdos experimentales es ocasión de un juicio universal, aplicable a todos los casos semejantes. En efecto, juzgar que tal remedio ha sido efectivo para Calias, afectado por tal enfermedad, luego a Sócrates, y después a otros tomados individualmente, es asunto de experiencia. Pero juzgar que tal remedio ha aliviado a todos los individuos de una forma (eidos) determinada que se hallan afectados por tal o tal mal (biliosos o flemáticos, por ejemplo), esto es asunto de técnica” (Aristóteles Metafísica 981, b 5-12).