En la serie estadounidense `Person of Interest`, creada por Jonathan Nolan —el hermano de Christopher Nolan, director de la película `Interestelar`—, un pequeño grupo de individuos usa la clarividencia de una supercomputadora `buena` para prevenir crímenes antes de que ocurran. Estos crímenes están relacionados con individuos que tanto pueden ser los perpetradores como las víctimas de acciones que no afectan a la sociedad a gran escala. La computadora, en realidad, está programada para seguir a toda la sociedad, violando así la privacidad de los ciudadanos con una omnipotencia orwelliana.
Pero no `actúa` o informa sobre crímenes menores, aquellos que afectan a individuos aislados. El objetivo es prevenir ataques terroristas o cataclismos sociales, en estos casos sí a gran escala. No obstante, el inventor de la computadora, el señor Finch, introduce instrucciones para que en esos casos el ordenador le avise con anticipación. De esta forma, él y sus compañeros, John Reese (exagente de la CIA experto en artes marciales) y una `hacker` sumamente inteligente llamada Root (nombre habitual de la cuenta asignada al administrador en ciertos sistemas operativos de las computadoras), más un agente de la policía de Nueva York rescatado de la corrupción, pueden impedir el crimen, salvar a la víctima o castigar al perpetrador. Lea más: ¿Humanos obsoletos? El futuro según Elon Musk Pero esta máquina omnipresente como un Dios tiene un enemigo mortal: otra computadora que fue copiada de la original por especuladores y agentes totalitarios, y que actúa como un cancerbero sobre toda la sociedad. Esta otra máquina se llama Samaritan (o Samaritano en español). ¿Cuán cerca de la realidad están estas computadoras todopoderosas?
A fines de la década de los 90, el FBI había desarrollado un sistema con capacidad para `husmear` (`sniffing`, en inglés) internet a gran escala, que recibió el nombre de Carnívoro. El sistema, de acuerdo con Wikipedia, ha evolucionado y ahora tiene el anodino nombre de DCS1000 (DCS son las siglas en inglés de Sistema de Recolección Digital). Lo real es que la evolución de los sistemas de computación no tiene límite, cada vez pueden hacer más cálculos, más complejos y más rápido. Y hace un tiempo que los científicos se han dedicado a enseñarlas a aprender. En ciertas áreas, éstas lo hacen mejor y a mayor velocidad que nosotros, los humanos. Ya hace varios años que los motores de búsqueda en internet han sido usados para optimizar las búsquedas de datos. Un ejemplo de las características que tienen estos algoritmos son los filtros para descartar basura en los lectores de correo electrónico. Cuando se activa en el programa para leer el `email`, cada vez que identificamos un correo como `spam` y lo marcamos como basura, el filtro registra su contenido y lo compara con todos los que sufren el mismo destino.
Eventualmente, este operativo aprende a detectar una secuencia de palabras clave para discriminar los correos indeseados, como por ejemplo `aumente el tamaño de su pene` o `artículos de farmacia con gran descuento`, y automáticamente los descarta. Los métodos de Machine Learning (aprendizaje de máquinas) se han empezado a utilizar en ciencia cada vez más: por ejemplo, los detectores de ondas gravitacionales como los de LIGO deben medir variaciones más pequeñas que el tamaño de un protón en la distancia entre dos espejos, que es 1.000 veces aún más pequeña que el diámetro de un núcleo atómico). Las vibraciones del suelo sobre el cual el sistema está construido, la agitación de las moléculas y átomos de todos los materiales involucrados en los espejos y sus suspensiones, el viento y las variaciones en la presión de aire en la atmósfera, centenares de disturbios ambientales, afectan a esa distancia tanto o más que una onda gravitacional.
Todos esos factores son de hecho lo que se denomina ruido instrumental, y en la jerga interna de quienes trabajamos con ellos han recibido un nombre en inglés, `glitch`, que resulta muy difícil de traducir al español, pero que se utiliza precisamente para nombrar esos `ruiditos instrumentales`. Poder clasificarlos e identificarlos automáticamente es muy importante para poder eliminarlos de los datos a investigar en búsqueda de una onda gravitacional real. Una manera de poder hacerlo es entrenar a una computadora para que pueda reconocerlos automáticamente entre una cantidad enorme de datos ambientales, imposible de inspeccionar `a ojo` por un humano (con más de 1.000 detectores o sensores adicionales al detector principal).
Otro ejemplo de aplicación de aprendizaje de máquinas en la ciencia es la astronomía. Con un grupo de mis estudiantes intentamos seguir la contrapartida óptica de ciertos cataclismos cósmicos que producen ondas gravitacionales. Esta contrapartida óptica es parte de la emisión electromagnética asociada a la explosión que se produce cuando dos objetos compactos como estrellas de neutrones y agujeros negros chocan y sacuden el espacio tiempo produciendo ondulaciones en su tejido que se propagan como ondas en el espacio cósmico. Utilizando estos detectores de ondas gravitacionales, los científicos mandan una alarma a grupos de astrónomos interesados cuando se detecta una posible señal. Éstos apuntan sus instrumentos a las áreas del cielo en las que existe una alta probabilidad de localización de la fuente.
En el caso de los telescopios ópticos, éstos inmediatamente obtienen fotografías de esas regiones del cielo. Luego se utilizan imágenes existentes con el mismo telescopio, de las mismas regiones del cielo tomadas como referencia antes (o después) del evento, y se sustrae un imagen de la otra. Si lo único que hay en esa región del cielo son las mismas estrellas, esa sustracción arrojará un resultado nulo… pura oscuridad. Pero si existe alguna fuente óptica transitoria —cuyo brillo no es permanente como el de una estrella común— en una de las imágenes pero no en la otra, por débil que sea, se podrá detectar en la imagen que resulta de esa diferencia.
Una posibilidad de que aparezcan falsos positivos es porque es muy difícil que las sustracciones de imágenes sean perfectas (la alineación de una de las fotografías debería corresponderse exactamente con la otra, por ejemplo). ¿Cómo distinguir todos esos falsos positivos de transitorios reales como los que uno busca? Ahí entra en juego el aprendizaje de las máquinas. El `machine learning` se efectúa con observadores humanos que, detectando transitorios reales y transitorios falsos, entrenan a una computadora, y la computadora aprende y puede efectuar la tarea con mucha precisión.
Sputnik
Etiquetas: