“Shape without form, shade without colour,
Paralysed force, gesture without motion”
The Hollow Men, T. S. Elliot
Algunas vistas del valle inquietante
El año es 1957 y hay algo ominoso en una de las primeras imágenes digitales de las que se tenga registro: la fotografía de un bebé cruzada por líneas verticales transparentes en un intervalo regular. Es el escaneado de un retrato de Walden, hijo de Russell Kirsch, coordinador del proyecto de desarrollo del scanner. La imagen es espectral y remite, al mismo tiempo, a los primeros retratos en daguerrotipo y a una imagen por venir: el rostro de Billy, el bebé que aterroriza a los juguetes en Tin Toy, el tercer corto de Pixar de 1988.
Como Billy, Walden produce incomodidad por efecto de una similitud insuficiente, cercano a aquel que, al teorizar sobre lo que nos suscitan los robots antropomórficos, Masashiro Mori denominó “el valle inquietante”. Pero hay algo más importante detrás la imagen del hijo de Kirsch. Su equipo de investigación estaba desarrollando una tecnología computacional que, entre otras aplicaciones, permitiera automatizar la percepción visual mediante una tecnología de procesamiento capaz de extraer líneas de dibujos, contar objetos y reconocer caracteres. Walden simboliza así la primera infancia de la naciente visión algorítmica. Es decir, la iteración específica de la visión maquínica 1El concepto de visión maquínica es un término propuesto recientemente por Claudio Célis Bueno que refiere a la “percepción” e “interpretación” de imágenes por parte de máquinas sin mediación de agentes humanos. El concepto se nutre de ideas previas de Trevor Paglen, Paul Virilio y de Harun Farocki, entre otros. Para una discusión en extenso, véase del propio Celis Bueno (2019) que codifica en valores discretos y abstrae la imagen en un código para luego poder operar sobre ella. Tanto para actualizarla en un monitor o una cola de impresión, como para procesarla y establecer correlaciones: es decir, estimar que esa letra en un texto escaneado es una “a” o una “b”, o que esas facciones corresponden al ciudadano X, prófugo de la justicia.
If “X”…: Estética de las imágenes potenciales
La movilidad de las imágenes inmóviles no suele recibir suficiente atención. La pintura rupestre, el mural y el street art pertenecen al espacio en el que fueron pintadas. Son inescindibles de los avatares del territorio. El cuadro gana la movilidad que le permite el marco, una primera liberación: separa el taller del artista del palacio y, luego, de los salones burgueses (e inaugura las posibilidades de la falsificación, el robo y el saqueo). La trabajosa ilustración de libros previos al desarrollo de las distintas técnicas del grabado en papel, permitía una circulación restringida, pero circulación al fin. Con el desarrollo del grabado, esta movilidad se exacerba al multiplicarse las copias, que se separan del ejemplar único y comienzan a acompañar el ritmo del libro impreso. El periódico ilustrado las devalúa aún más: las imágenes pasan a acompañar las noticias de la semana y, así, envejecen rápido. Sin embargo, esta relación entre imagen, tiempo y territorio está atravesada por el valor del trabajo, 2Para una discusión sobre la relación entre tecnologías de la comunicación y las vastas entidades territoriales modernas, especialmente a partir de la segunda mitad del siglo XIX, cfr. Bennedict Anderson (1997) por las marcas subjetivas de artistas y artesanos, por las destrezas y sensibilidades necesarias para crearlas. Y aquí cabe una observación: la mecanización de la reproducción de imágenes no es siempre paralela a la de su producción.
Algo no muy sabido es que las primeras fotografías eran objetos únicos, el daguerrotipo imprimía el rebote de la luz en placas de cobre cubiertas de plata pulida, obtenidas, además, por un tiempo de exposición prolongada. No eran, en modo alguno, la captura de un instante, eran la lenta inscripción de un largo momento de pose paciente. Recién hacia fines de siglo XIX y comienzos del XX las imágenes comienzan a ganar velocidad al escalar su reproductibilidad cuando los rollos de film fotosensible empiezan a estandarizarse y producirse de modo industrial. El ritmo mecánico de los engranajes de la palanca de arrastre de la cámara, el troquelado del film y los procesos físico-químicos contribuyeron a acortar los tiempos de exposición y a acelerar las imágenes.
La imagen televisiva supuso su trasformación en ondas electromagnéticas. Este salto es muy importante, ya no se trata sólo de la aceleración de su replicación, si no de la posibilidad de su irradiación en el espacio. 3A propósito de esta irradiación, Ezequiel Gatto señala la necesidad de pensar también la especificidad de las imágenes acústicas de la radio. Acaso algunas intuiciones en esa dirección puedan esbozarse a partir de la poesía tecnogénica comentada por Rubén Gallo (2010) Las antenas televisivas transmiten las imágenes sobre su área de cobertura. Son así imágenes de rango territorial que sincronizan espacios y subjetividades, pero que dependerán de una infraestructura de repetidoras que amplíen su radio.
La imagen digital supone un nuevo salto de escala: al codificarse, el sustrato material se vuelve contingente y al volverse contingente, la imagen se torna abstracta, pasible de infinitas actualizaciones (pero no inmaterial como postula el sentido común de los corifeos del capitalismo utópico de Silicon Valley). Al digitalizarse, la imagen sí puede viajar a la velocidad de la luz en las intermitencias de los cables de fibra óptica: copiarse aquí y copiarse allá, en servidores, pen drives y discos rígidos, en inscripciones láser o en alteraciones de voltajes, en cualquier lugar, en cualquier instante, siempre que el código sea recuperable de la memoria portátil, de la memoria interna del dispositivo, o de la nube (que en realidad es un servidor que a la velocidad de la luz transmite por fibra óptica u ondas de radiofrecuencia, los bits que componen la codificación de la imagen).
Cada tipo de imagen lleva inscrita en sí una temporalidad y, lo que no es tan obvio, una espacialidad. Ambos rasgos están vinculados a su materialidad específica. Una fotografía no es exactamente lo mismo que un fotograma, ni que un videograma, mucho menos que una pintura o un instante del barrido de una antigua emisión televisiva. Cada tipo de imagen, entonces, espacializa el volumen en el plano de modo diferente y arrastra en su factura las huellas de su propia producción: una química, una física, una matemática, un trabajo humano y otro maquínico. Así, las imágenes están íntimamente vinculadas con el lugar y el tiempo de los cuerpos que registran y que las producen. A propósito del videoarte, Carmen Crouzeilles señala que,
remite a un tiempo presente: el “yo veo” del video (una afirmación, un posicionamiento poético y también político) se distingue del “yo he visto” de la fotografía (en su función de registro de hechos del pasado), del “yo creo ver” del cine (la ficción, la ilusión) y del “yo estoy viendo” de la televisión, siempre relacionado con el flujo continuo de la actualidad en directo.” (2012: 242-243)
En otras palabras, la fotografía es registro indicial 4Por registro indicial me refiero a aquellas inscripciones (en este caso a partir de la luz) que permiten inferir una relación de contigüidad entre el registro y lo registrado, y que por ello guardan una relación de privilegio con lo real de acuerdo a la ontología de la imagen fotográfica baziniana que discutiré en las siguientes secciones de una materia cuyo rebote de la luz capturó el lente. En cambio, el cine es, gracias al montaje, ilusión. El video es testimonio personal de quien sostiene la cámara, en tanto que la transmisión televisiva es puro flujo del ahora. 5Esta esquematización evidentemente no agota la complejidad de la producción técnica de imágenes en el siglo XX. Las fotografías intervenidas, los fotomontajes y las filmaciones hogareñas no se corresponden plenamente a estos tiempos y ameritan un estudio por separado de sus especificidades
¿Cuál sería, entonces, el tiempo verbal de la imagen digital? Esto es, antes que nada, una pregunta tramposa, ya que hay que distinguir en diferentes tipos de imágenes digitales: hay imágenes indiciales que traducen el rebote de la luz en píxeles (aunque al codificarse la verificación de esa indicialidad pierda confiabilidad), hay imágenes puramente sintéticas, más empáticas que Billy de Tin Toy, y una vasta gama al medio, como las que ilustran los rostros retocados de las revistas de chimentos o los travellings imposibles de las escenas de acción de las películas de Marvel. El polo puramente sintético de la imagen digital, como apunta Lev Manovich (2008), se vincula más a la pintura que de la fotografía.
Retomando las temporalidades propuestas por Crouzeilles (2012), podríamos decir que las imágenes sintéticas, generadas por computadora, son el modo condicional de la imagen: “si X, yo vería Y”: si yo pongo el ángulo de la cámara ficticia aquí, veré esto, si yo activo la ropa del personaje, lo veré vestido, y así sucesivamente, en una trabajosa acumulación de variables modulares: si “X”, entonces “Y”; donde cada elemento del plano se corresponde a un estado particular de la variable. La imagen digital en tres dimensiones, donde la actualización en pantalla es apenas una entre las distintas posibilidades contenidas en la codificación, es aún más amplia, incluso, que la imagen animada convencional sujeta a la destreza de quien ilustra (y a la relación tiempo/trabajo implicada). La animación digital en tres dimensiones supone un cambio en la ontología de la imagen. La cámara cinematográfica capturaba el espacio en la temporalidad lineal del film. La mesa de montaje permitía manipular ese tiempo. La animación en tres dimensiones supone salto radical: espacializa la imagen. Acaso el ejemplo más elocuente de este cambio lo ilustre el videoclip de Splitting the Atom de Massive Attack dirigido por Edouard Salier (2009): un largo plano secuencia de más de cinco minutos que recorren un extenso render urbano estilizado de un modelo 3D durante un lago instante congelado, casi una exacerbación del célebre bullet time (tiempo bala) de les Warchovski en Matrix (1999-2003). La “cámara” de Salier parte de las montañas en las afueras de una ciudad y la recorre hasta llegar al centro. Lo que parece un recorrido voyerista (con un breve paneo de una pareja teniendo sexo en su habitación) comienza a complicarse cuando la “cámara” llega a lo que parecen escenas confusas de una batalla (restos de edificios, aviones disparando misiles, un helicóptero en caída, los vidrios estallados de los rascacielos), hasta que comienza a recorrer las partes inabarcables y confusas de la gigantesca forma monstruosa de un kaiju, una suerte de conejo gigante mutante, que estaba atacando la ciudad y que ha sido malherida por los aviones, tanques y soldados y se contorsiona en el aire, con las vísceras expuestas y en las que la cámara se sumerge.
Narrar ese travelling desquiciado sobre un render 3D es una operación trivial e inútil por lo que se remite al video. Lo que interesa de este ejemplo es que el arte visual implicado se corresponde primero a la construcción de un espacio y posteriormente a establecer la trayectoria de la cámara. El recurso innovador, adecuado para el videoclip de una banda experimental como Massive Attack, pocos años más tarde devendría la norma de las producciones infantiles, como las de Pixar y muy pronto, chroma key mediante, de las superproducciones de superhéroes que han hegemonizado la taquilla cinematográfica en la última década. Tal vez el mejor exponente de este giro conceptual sean los créditos de apertura de Guardianes de la Galaxia Vol. 2 (James Gunn, 2017) (que comparte un inesperado leit motiv lovecraftiano con el video-clip de Salier), y donde el plano secuencia es de todo menos una cuestión de moral. La animación 3D combinada con el registro indicial de los actores hace que la preceptiva del montaje prohibido propuesto por Bazin devenga obsoleta:
Cuando lo esencial de un suceso depende de la presencia simultánea de dos o más factores de la acción el montaje está prohibido. Y vuelve a recuperar sus derechos cada vez que el sentido de la acción no depende de la contigüidad física, aunque esté implicada (Bazin, 2008, p.77)
La “densidad de lo real” baziniana se ha deflacionado. Como señala Manovich, el registro fotográfico es apenas una de las posibilidades de composición, una más de las variables a programar. Y como lo demuestra el foco puesto sobre Groot que baila en medio de la batahola superheroica contra un monstruo interdimensional. Los actores en escena sirven apenas de reparto para el arbolito sintético danzante.
… then “Y”: Economía de las imágenes potenciales
Recuperando muy libremente la relectura de conceptos de la geografía llevado adelante por Deleuze y Guattari, entiendo el concepto de reterritorialización como parte de una dinámica que implica además a la territorialización y la desterritorialización como procesos concomitantes, fundamentales para comprender las prácticas humanas entre las que se inscribe, de manera privilegiada y transversal, la técnica. Si la desterritorialización se refiere a la pérdida de territorio, donde se rompe la relación con la historia y la memoria de los lugares, la reterritorialización es una instancia posterior donde se ponen en juego nuevos agenciamientos. En este sentido, en este ensayo me interesa pensar a las inscripciones digitales de memorias flash o discos rígidos como ejemplos de esas dinámicas. Espacializar la imagen en movimiento en una codificación es un modo de reterritorializar el tiempo mediante su inscripción física en un dispositivo de almacenamiento (sea éste personal como un pen-drive, interno como un disco de estado sólido, o en la nube de algún servidor remoto). Dicho de otro modo, el tiempo necesariamente lineal del celuloide se abstrae en el código y luego se espacializa en estas inscripciones digitales que habilitan múltiples accesos posibles simultáneos. El tiempo espacializado es un tiempo potencial. Hasta que deja de serlo cuando incorpora variables del “tiempo real”: es decir, cuando acota las posibilidades de sus infinitas X a las contadas ocurrencias finitas del mundo real, no arbitrarias ni aleatorias, si no contingentes. La cámara de vigilancia que reconoce algunos valores dados en un rostro, los coteja con los de una base de datos asociada a una serie de identidades definidas y, al obtener un valor verdadero, activa una secuencia de acciones automáticas, como abrir una puerta, o dar aviso para iniciar un protocolo de acción: notificar a las fuerzas de seguridad sobre la presencia de la persona X en el espacio Z, o desatar un bombardeo sobre una aldea afgana desde un dron.
Éste es otro tipo de imágenes. Las denominaré “imágenes condicionantes”, es decir, aquellas que cumplen la condición requerida para el “entonces…”, son las imágenes que gatillan una operación técnica. En la época de las máquinas sensibles, estas imágenes, invisibles, hechas por máquinas para ser “vistas” por máquinas, constituyen el objeto de la percepción maquínica. Y la percepción maquínica es una secuencia lógica; las variables no previstas de algún modo en su operatoria, no pueden ser “vistas” por la máquina. El devenir imagen visible para la máquina es el incorporarse al mundo como input procesable. De allí que ciertas oposiciones que en el marco del distanciamiento social por la pandemia parecen ponerse sobre el tapete, sean en realidad falsas dicotomías que se licúan en la nueva reticularidad inaugurada por el régimen de las imágenes invisibles. 6Para una discusión sobre las imágenes invisibles, además del trabajo ya mencionado de Célis Bueno, véase el ensayo “Imágenes invisibles” del artista Trevor Paglen (2019)
En el terreno de las imágenes visibles, destinadas (también) a la visión humana, hay una falsa dicotomía: la confusión entre lo remoto y lo virtual. Una imagen de video conferencia y un avatar no se oponen, se complementan para sostener la interconexión que articula y organiza las subjetividades, cualquiera sea el modo en el que se manifiesten en la red. Dos tipos de imagen digital capturan el Zeitgesit del annus horribilis de 2020: 1) la imagen-grilla que distribuye caras, letras y fotos de perfil en cualquier software de video conferencia y, 2) la proliferación de avatares. Entre estos se destaca la idea de la start-up Loom.ai, una empresa que ofrece un servicio de avatares personalizados. Hasta allí no hay mayor diferencia con cualquier otro servicio de skins digitales. Desde el inicio de Internet, todos podemos pretender ser otrx, como el famoso chiste de Peter Steiner (luego meme), publicado en The New Yorker el 5 de julio 1993, en el que un perro sentado a la computadora le dice a otro a su lado: “En Internet, nadie sabe que sos un perro”.
Pero el tejido que trama Loom.ai (que, en realidad, es una .com) va más allá. Esa tela enmascara el ámbito social, lubricando así las trabajosas transiciones entre lo público y lo privado que caracterizan la continuidad de las relaciones laborales en la precarización de los home-offices del mundo. Es la incomodidad de lo real, de lo indicial, que insiste en colarse en la pantalla de la oficina ficticia, como el niño que se sube al escritorio de la madre, o los incidentes de quienes olvidan apagar la cámara o cerrar el micrófono cuando van al baño durante una reunión. El mundo material sigue allí, persistente, iluminando las desigualdades de hábitat, de género, de etnia, de clase, de país, de conectividad. Allí, persiste “la presencia simultánea de dos o más factores de la acción” (Bazin, 2008), sólo que ahora como problema a ser evitado. La virtualización de sí que propone Loom.ai es plenamente consciente de que el capital 24/7 opera mejor en las imágenes límpidas.
William Gibson, hablando de cómo acuño el término “ciberespacio” a comienzos de la década del ochenta, señaló, que en relación a los imaginarios presentados por la ciencia ficción del periodo,
(t)he technology depicted was so slick and clean that it was practically invisible. What any given SF would look like if we could crank up the resolution? As it was then, much of it was like video games before the invention of fractal dirt. I wanted to see dirt in the corners. (Gibson, 2011) 7“(L)a tecnología descripta era tan pulida y limpia que era prácticamente invisible. ¿Cómo sería cualquier clásico de la ciencia ficción si le aumentáramos la resolución? Así como estaban las cosas entonces, una gran parte era como los videojuegos antes de la invención de mugre fractal. Yo quería ver la mugre en los rincones.”
De algún modo, Loom.ai recoge para el capital corporativo el guante arrojado por el padre del cyberpunk. La ausencia de “mugre fractal” puede llevarnos directo al valle inquietante, y allí la economía dopamínica no puede funcionar bien. El capital 24/7 necesita sortear ese valle minimizando “la presencia simultánea de dos o más factores de la acción” (Bazin, 2008) propia del incontrolable mundo real, que por suceder en el puro presente es impredecible. En el régimen televisivo, la generación controlada de acontecimientos habilitada por los estudios, la sala de monitores, los formatos y los agentes mediáticos (conductores, noteros en los móviles) entrenados en el arte de acotar y direccionar el acontecimiento, casi todo ruido puede ser eliminado. O, dicho de otro modo, se elimina toda información, en tanto novedad que haga una diferencia. Pero la estructura televisiva es demasiado onerosa para implementar en el minuto a minuto del home-sourcing. 8Por home-sourcing nos referimos a la tendencia a reducir costos laborales propiciando el trabajo hogareño on-line, fenómeno que supone una radicalización de la precarización implicada en movimientos como la tercerización o outsourcing y la relocalización de actividades mano de obra intensiva en países con normas laborales más laxas para las empresas Para mediatizar el trabajo en tiempo real, el capital recurre a recursos de un arte de lo real, el cine. No es casual que la experticia de la empresa venga del mundo de los anacrónicamente llamados “efectos especiales” de los estudios cinematográficos:
The Loom.ai team brings their visual effects expertise from LucasFilm and DreamWorks, where the founders worked on creating CGI models that captured the personalities of the actors and voice actors behind them. The company’s CTO Kiran Bhat was the R&D facial lead on films like The Avengers, where he had to tackle problems like making the Hulk. 9“El equipo de Loom.ai trae su experticia de efectos visuales de LucasFilm y DreamWorks, donde sus fundadores trabajaron en la creación de modelos CGI que capturaron las personalidades de los actores y actores de voz detrás de ellos. El CTO de la compañía CTO Kiran Bhat fue el director de I+D de rostros en películas como Los vengadores, donde debió lidiar con problemas hacer al Hulk.”
La historia de la visión maquínica tiene otro capítulo central en el desarrollo de la captura de movimientos. No se trata ya de capturar las apariencias, como en la fotografía, o el tiempo como en el cine, o de reconocer elementos discretos, como en el Reconocimiento Óptico de Caracteres que luego utilizaría Google para digitalizar todos los libros del mundo, o el reconocimiento facial que operan las cámaras de vigilancia. Se trata de capturar y modelizar la gestualidad distintiva de cada individuo.
La trilogía de films El señor de los anillos (2001-2003) dirigida por Peter Jackson acaso haya sido una de las últimas obras cinematográficas propiamente dichas de la tradición hollywoodense. Allí residen su gran éxito y sus méritos estéticos: grandes planos abiertos de paisajes majestuosos para justificar la concurrencia masiva a las salas, multitudes de extras que no se veían quizá desde los tiempos de épicos del peplum, 10El péplum es un género fílmico de “cine histórico de aventuras”, situadas en la antigüedad clásica. El nombre se deriva de las túnicas sin mangas abrochadas al hombro que vestían los actores de esas películas que caracterizaban a los personajes griegos y romanos y actuaciones adecuadas a la vara shakesperiana anglosajona. Se destaca, en especial, la de una criatura sintética, el Gollum compuesto por Andy Serkis, que, mediante la sensorialización de su cuerpo (o motion capture), logró digitalizar su desempeño actoral. Luego, repetiría la proeza con la fallida King Kong (2005) de Jackson y con el César del remake de la mejor lograda saga El planeta de los simios (Rupert Wyatt, 2011; Matt Reeves, 2014, 2017), y otra larga serie de seres imaginarios, como el supremo líder Snoke de la tercera trilogía de La Guerra de las Galaxias (J.J. Abrams, 2015; Rian Johnson, 2017). En la trilogía del Señor de los anillos, en particular, el mérito de Jackson y de Serkis es sortear el valle inquietante: Gollum enternece, aterroriza y mueve a la piedad. La ilusión cinematográfica prevalece. 11Precisamente, la carencia de indicialidad explica el fracaso tanto artístico como comercial de la segunda trilogía de Jackson frente a la primera. El exceso de digitalidad se conjuga con la prolongación innecesaria de la trama, y la segunda trilogía visualmente tan plástica y artificial como Tron. No sólo Légolas y Tauriel, disparando sus arcos mientras saltan sobre barriles río abajo, parecen una innecesaria versión medieval de Neo y Trinity, sus toscos orcos parecen sacados de un video juego, listos para ser masacrados por los jugadores
El énfasis puesto en la experticia cinematográfica dentro de Loom.ai no es un dato menor. Si pudieron humanizar al Hulk, pueden humanizar al precariato angustiado que dicta clases on-line desde sus monoambientes hacinados. Este tipo de tecnologías es indicativo de la convergencia de la cinematografía, la animación 3D y las telecomunicaciones. Hoy todos podemos ser Andy Serkis, nuestro nuevo uniforme para la home-office, para garantizar que las rondas de negocios sigan funcionando, para que no se interrumpa aquello que aún no ha podido ser automatizado y que requiere de reuniones donde fluya el intercambio creativo o la construcción de confianza y consensos. Lo que en falló en el ambicioso proyecto de red social virtual de Second Life (incluso aunque el mismísimo William Gibson haya realizado una lectura de sus obras allí), aquí podría llegar a funcionar. Precisamente porque procura tender una autopista (de la información) que cruce por arriba el valle inquietante de las imágenes artificiales. Humanizar los avatares solucionando el problema de la verosimilitud, mientras lleva adelante el extractivismo de datos que le permite entrenar mejor a sus algoritmos de aprendizaje maquínico y mejorar sus conjuntos de datos. Loom.ai está tecnológicamente un paso más adelante, pero en la misma sintonía que FaceApp y demás aplicaciones que apuntan a datificar el rostro, uno de los reductos aún no suficientemente explotados. El rostro humano esconde una de las claves para ampliar la productividad en un contexto donde la atención se vuelve el recurso escaso, y estas aplicaciones ofrecen la posibilidad de capturarla un rato más, para capturar más datos, para capturar más atención… Virtual, remoto y presencial son apenas diferentes inputs del flujo de comunicación.
Esta vía posible de sostener la productividad del capital puede rastrearse, no sólo en Walden y el proyecto de digitalización de imágenes del National Bureau of Standards de los Estados Unidos, sino también en Pixar, nuestra educación sentimental para las imágenes artificiales. Las parábolas de los personajes de Toy Story, ilustran este derrotero. Woody, el juguete “artesanal” (cosido, de tela), luego objeto de colección, y Buzz, el producto industrial que se redime al abandonar el universo narrativo de su franquicia y abrazar la heterogeneidad caprichosa de los juguetes de Andy, se contraponen a Forky, el juguete contrahecho por la mano infantil a partir de materiales descartables en la última película de la saga (Toy Story 4, Josh Cooley, 2019).
Gollum, y los demás inquietantes juguetes sensorializados del otro Andy, terminan de tender el puente para que todos seamos Buzz, y podamos trabajar hasta el infinito y más allá, al margen de cualquier apocalipsis en curso. Lo remoto, lo presencial y lo virtual son apenas variables que la reticularidad admite. Lo indicial y lo potencial son epifenómenos accesorios siempre y cuando se obtenga la validación por cualquier otra de las vías disponibles, sea la firma digital, el escaneo de huellas digitales o de retina, la autentificación por reconocimiento de voz o facial. 12La oposición entre indicial y potencial estriba en la diferencia entre un registro de un fenómeno del mundo del cual la imagen indicial resulta huella, frente a la imagen potencial que está limitada sólo por las posibilidades del procesamiento matemático de su código
Ya sabemos que la interfaz de Netflix nos mira mirar, como lo hacen las demás plataformas que se disputan nuestro tiempo siempre escaso en el ámbito de la economía de la atención (Célis Bueno, 2017). Así aprenden para recomendarnos de modo más eficiente qué mirar (o qué leer, o qué comprar, o a quién seguir) para así poder sostener el feedback en el loop de seguir mirándonos mirar. La novedad de Loom.ai es que la interfaz no reconoce patrones supra y subindividuales mediante la correlación bruta de datos, sino que procura capturar lo específicamente individual para suplirlo. El avatar se confunde con la interfaz que se confunde con el dispositivo de captura de datos. O, dicho de otro modo, es un universo de imágenes invisibles que hacen tolerable lo visible para el humano del otro lado de la videollamada o, incluso, dentro del espacio inmersivo de la reunión vía realidad virtual. Y del valle inquietante llegamos así a los salones amigables.
Instrucciones para violar chanchos: Realpolitik de las imágenes potenciales
Hay otro ángulo más por explorar en relación a la política del plano secuencia. En The National Anthem (Otto Bathurst, 2011), acaso el más sutil de los capítulos de la apocalíptica Black Mirror, un artista-terrorista vuelve a poner de relieve el valor estético y epistémico del travelling: si el primer ministro del Reino Unido no viola a un chancho en vivo por cadena nacional, matará a una integrante de la casa real británica. La viralización de la demanda y los sondeos de opinión acaban por convencer a los asesores del mandatario de que no avenirse a la exigencia supondrá un suicidio político. Se evalúa la opción de delegar la tarea infame en un actor porno y reemplazar su cara por la del primer ministro, pero la demanda incluye una preceptiva baziniana que desmonta la previsible operación goebelssiana: el acto sexual debe ser un plano secuencia en una cámara en mano oscilante que se mueva circundando al ministro y la cerda. Es un procedimiento en las antípodas éticas y estéticas del ya comentado bullet time introducido en Matrix, ese Black Mirror previo a las sensibilidades centennial.
Tal previsión en la demanda impide la manipulación digital de la imagen en vivo que preservaría a la vez el honor del político y la vida de la princesa. (En esta fábula antropocéntrica el animal hubiera sido ultrajado en cualquiera de los escenarios). El montaje prohibido resulta una forma radical de artivismo antisistema y el plano secuencia gana aquí valor táctico: es una técnica de preservación de la indicialidad para combatir la capacidad de generar un deep fake al que tienen acceso los grandes jugadores mediáticos (como el Estado o las corporaciones).
Pero como dice el Indio Solari, “el futuro llegó / hace rato”. Este año, anticipando la polarización y algoritmización en las elecciones presidenciales de Estados Unidos, desde el corazón de Silicon Valley, una de las mayores corporaciones tecnológicas movía sus fichas: Microsoft anunciaba a mediados de año que brindaría herramientas para combatir los “medios sintéticos” (lo que se conoce informalmente como deep fakes) (Lomas, 2020). Si la primera campaña de Trump tuvo éxito mediante el user profiling y la publicidad mediante envío de imágenes personalizadas, era previsible que, con el avance de la animación de imágenes sintéticas ultrarrealistas, esta segunda campaña se trasladase al terreno de la indicialidad. Y que, por ello, la disputa de la hora sea por la recuperación de las certezas de la captura de lo real –y de paso, con esas credenciales liberales, la empresa de Bill Gates podría recuperar terreno ante los otros grandes jugadores corporativos de las tecnologías de la información que estaban envueltos en escándalos por favorecer las fake news, como Facebook o por trabajar para el complejo industrial-militar estadounidense como Alphabet, la propietaria de Google–. En ese lodo fractal, parafraseando la precisa observación de Gibson, se dirime la Realpolitik contemporánea.
Una apostilla final
No deja de resultar cuanto menos sintomático que una de las operaciones mediáticas más comentadas de las últimas elecciones estadounidenses haya sido la “cámara oculta” que le hicieron al abogado de Trump, Rudy Giuliani, en la secuela de la película Borat (Larry Charles, 2020), donde, siguiendo la preceptiva baziniana, la actriz y el político compartían un plano sumamente incómodo (e indicial). La relación de lo real con la ficción se sostiene por el registro de la actuación de la falsa “periodista” que engaña al “auténtico” político acerca de la realidad de sus intenciones en el plano que comparten en la habitación de un hotel. En la época del deep fake, la oposición a Trump recurre a un engaño que poco tiene de algorítmico (aunque luego sea estrenada por Amazon que, como Microsoft, también mueve sus fichas en el tablero de la concentración mediática). Y como ilustra este ejemplo, el plano secuencia vuelve a ser una cuestión de moral, pero en un sentido radicalmente diferente al planteado por Godard. Casi tan grotesco, el episodio Giuliani funciona como espejo documental de la escena de la cerda en Black Mirror en lo que a los usos tácticos del plano secuencia (y su dudosa moralidad) se refiere.
Referencias
Anderson, B. (1997). Comunidades imaginadas: Reflexiones sobre el origen y la
difusión del nacionalismo. México: Fondo de Cultura Económica.
Bazin, A. (2008). El montaje prohibido. En ¿Qué es el cine? Madrid: Rialp, pp. 67-80.
Celis Bueno, C. (2017). The Attention Economy: Labour, Time and Power in Cognitive Capitalism. London Rowman & Littlefield International
Celis Bueno, C. (2019), “Notas sobre el estatuto político de la imagen en la era de la visión artificial”, Barda, 5, núm. 8, pp. 89-106.
Crouzeilles, C. (2012). Videoarte. En Claudia Kozak (ed.). Tecnopoéticas argentinas: Archivo blando de Arte y Tecnología. Buenos Aires: Caja Negra, pp. 239-252.
Gallo, R. (2010) Mexican Modernity: The Avant-Garde and the Technological Revolution. Cambridge, Mass: MIT Press.
Gibson, W. (2011). The Art of Fiction No. 211. Interview by David Wallace-Wells. Paris Review, 197, Summer. Consulta 30 de septiembre de 2020. http://www.theparisreview.org/interviews/6089/the-art-of-fiction-no-211-william-gibson.
Lomas, N. Microsoft launches a deepfake detector tool ahead of US election. TechCrunch, September 2, 2020 https://techcrunch.com/2020/09/02/microsoft-launches-a-deepfake-detector-tool-ahead-of-us-election/
Manovich, L. (2008). El cine, arte del índex. En La Ferla, J. Artes y medios audiovisuales: Un estado de situación de las practicas mediáticas pre digitales y post analógicas. Buenos Aires: Aurelia Rivera, pp. 73-79.
Matney, L. Loom.ai is building an avatar that can capture your personality. En TechCrunch, 13 de diciembre 2016. Consulta 30 de septiembre de 2020. https://techcrunch.com/2016/12/13/loom-ai-is-building-an-avatar-that-can-capture-your-personality/
Paglen, T. (2020) Imágenes invisibles, laFuga, 22. 13Fecha de consulta: 2020-12-03. Disponible en: http://2016.lafuga.cl/imagenes-invisibles/944
Berti, A. (2021). Imagen condicional: Cálculo y percepción, laFuga, 25. [Fecha de consulta: 2024-11-21] Disponible en: http://2016.lafuga.cl/imagen-condicional-calculo-y-percepcion/1054