Desde que Ron Gilbert acuñó el término “cutscene” nos hemos acostumbrado a la hibridación de medios. Pasamos de un ambiente lúdico e interactivo a una secuencia audiovisual narrativa. Con el paso del tiempo hemos visto la evolución de los cutscenes en Maniac Mansion, Ninja Gaiden y Out of This World para llegar a otras más elaboradas en Metal Gear Solid, Final Fantasy VII o el más reciente Heavy Rain.
Éste no es un análisis de las tomas y el lenguaje utilizado en las secuencias, ya que aunque para muchos esto sea una “experiencia cinematográfica”, en realidad es un conjunto de recursos utilizados por otros medios desde antes de que existiera el cine. Y sin pretender imponer una postura, espero expresarles mi reflexión sobre lo que hace único al cine, es decir, lo “cinematográfico” y luego demostrar cómo afecta a los videojuegos.
Varios teóricos han intentado definir el paradigma de la esencia del cine. Sergei Einsenstein, el cineasta ruso, decía que era el montaje: la habilidad de yuxtaponer la toma A y la toma B para que en nuestra cabeza se creara la toma o idea C. Esto viene de las demostraciones de otro ruso, Lev Kuleshov:
En cierto punto, el cine puede alterar nuestra percepción gracias al orden y yuxtaposición de elementos visuales. Pero también lo pudo hacer esta imagen de Hitchcock, que no es cine.
Durante mucho tiempo se tomó como punto de partida la teoría de Einsenstein, así como los impresionistas franceses habían dicho que el cine era una sinfonía de luz. En 1914, David W. Griffith realiza The birth of a nation y con ella, se considera que establece el lenguaje cinematográfico, esa serie de reglas de cómo escribir a través de encuadres, posición y movimientos de cámara.
Este lenguaje tampoco es inherente al cine, puesto que cuando el medio fue creado por los hermanos Lumière, en 1895, no existían estas reglas. Es hasta un siglo después, en 1986, que otro cineasta ruso, Andrei Tarkovsky, expone en su libro Esculpir el tiempo lo que hoy varios consideramos la esencia del cine: “el cine captura y reproduce el tiempo”, y agregaría de manera visual, ya que el cine nace sin sonido. Si lo pensamos bien, el cine como medio, no requiere de actores, historia, iluminación, sonido, encuadre, etc. Todo esto son cosas que ya habían establecido otros medio con anterioridad: la pintura, la fotografía, el teatro, la música, y más.
El hecho de que tomara prestados estos elementos le ha permitido al cine volverse multidisciplinario, pero en esencia hace lo que Tarkovsky menciona: captura una porción del tiempo mediante un dispositivo (como la cámara) y lo reproduce. Se pueden decir cosas similares de la fotografía pero más adelante explicaré la diferencia fundamental entre ésta y el cine.
Ahora me gustaría comentar algo de mi visión personal: de todo ese tiempo que nos persigue, lo más hermoso que una cámara puede capturar es el rostro humano. Y esto se debe a que el verdadero lenguaje del cine es el de las emociones, el lenguaje universal.
Pensemos en el común denominador que tenemos los seres humanos: aunque no hablemos el mismo idioma podemos entender a lo lejos si alguien está feliz, triste, o molesto. ¿Alguna vez han visto de reojo una película durante un viaje? El personaje A le sonríe al personaje B. Minutos después, al ver la pantalla uno descubre que A se enoja con B. Sin escuchar los diálogos de la película, podemos entender un conflicto humano entre dos personajes.
El cine nos hace testigos de dichas peripecias en otras personas, sean ficticias o reales. Con esta cualidad, el cine es el mejor agente de la hermenéutica y el medio más sobresaliente para crear empatía, es decir, la habilidad de sentir lo que otro ser humano siente.
Ahora, es importante establecer que esta cualidad para capturar y reproducir las emociones de alguien en un momento determinado no hace menos a todas aquellas disciplinas que se han sumado al cine. Pero aun con historia, actores, iluminación y música, hay grandes obras en donde la mayor catarsis es detonada por la transición de una emoción a otra en un rostro.
Se ha dicho que lo poético en el cine está en el close up. Karl Dreyer filmó una de las más grandes películas de todos los tiempos: La passion de Jeanne d’Arc. En ella se hace un uso magistral de los planos cerrados para acercarnos y sentir los estados de ánimo de Juana.
Otro excelente ejemplo lo encontramos en M, (también conocida como El Vampiro de Dusseldorf) de Fritz Lang. En la escena cumbre de la película hay una vuelta de tuerca al descubrir las razones por las que alguien asesina a niñas pequeñas: su necesidad. Es emocionante y desgarradora la actuación de Peter Lorre en esa parte de historia de la que una cámara fue testigo. Nos sensibiliza y confronta. Después de este punto, la audiencia tiene que decidir de qué lado está: ¿es el villano culpable o sólo una víctima?
Semejante transición de emociones —la posibilidad de pasar de una a otra— es la gran diferencia entre el cine y la fotografía. La fotografía es una imagen de la realidad sin tiempo. Si vemos un solo fotograma de cualquiera de las escenas anteriores, es posible que nos afecte. Si vemos todos los fotogramas impresos, uno tras otro, podríamos imaginarnos cómo se vería su movimiento. Pero si lo vemos en movimiento, en cine, nuestro cerebro percibe de una manera distinta: la verosimilitud de la persistencia retiniana hace que olvidemos que hay 24 fotogramas sin tiempo reproduciéndose cada segundo.
Ahora volvamos a los videojuegos. ¿Cuáles serían los casos en donde hay una fracción del tiempo capturada y reproducida en su narrativa? Omitiré obviamente los cutscenes pre grabados (mejor conocidos como full motion video) porque eso es —en términos llanos— cine.
La respuesta la encontramos en el motion capture: hay cámaras que registran el movimiento de puntos de referencia y los reproducen en un render. Sí, suena a trampa porque es imposible meter el mundo real dentro de un panorama virtual e interactivo, pero con este argumento muchos no podríamos defender a Peter Jackson y la actuación de Andy Serkis como Gollum.
Desafortunadamente, en muchos casos la tecnología motion capture sigue siendo utilizada solamente en el movimiento corporal, o con muy pocos puntos de referencia en los rostros. Esto introduce otro elemento importante: los animadores, los artistas que arreglan, aumentan y cambian el movimiento.
La animación consiste en “darle alma o vida” a algo que no lo tiene. Es un medio que se casó perfectamente con el cine, pero considerando la esencia de éste, no es cine. La animación existe desde antes del cine. Así también, la animación ha formado una simbiosis inseparable con los videojuegos.
Hablemos de David Cage. Este desarrollador francés, conocido por su trabajo en el estudio Quantic Dream, ha mencionado en varias ocasiones que desea casar lo cinematográfico con los videojuegos. Me parece fascinante la interacción en la narrativa de Heavy Rain, pero pienso que no cuenta con esencia cinematográfica porque el motion capture realizado a los actores fue posteriormente modificado, por animadores. Esta fracción de tiempo ya no se reproduce de la misma forma. Lo mismo sucede con Uncharted.
En cambio, hablemos por fin del videojuego que mejor utiliza —a mi parecer— lo cinematográfico: LA Noire. La tecnología usada es única en su medio, hasta el momento, y no se ha vuelto a repetir. Exactamente lo que realizaron los actores frente a las cámaras es lo que vemos en los rostros de los personajes virtuales. Recordemos que esto es totalmente independiente del estilo film noir que tiene, de sus encuadres, del uso de la luz, de su soundtrack, de su historia, etc.
¿Por qué invertir en esa tecnología si es tan costosa? ¿Por qué no la hemos vuelto a ver en otro videojuego? Porque el uso de esta captura y reproducción del tiempo en LA Noire no es gratuita. Éste es el único videojuego que ha mezclado perfectamente lo que hace único al cine y también a los videojuegos.
En una de sus mecánicas fundamentales, el usuario de LA Noire debe interactuar con el sistema y decidir, por medio de su intuición, si el personaje virtual en la pantalla le está mintiendo. Esta manera de actuar del personaje no es producto de un animador, sino el resultado de las emociones de un actor en frente de varias cámaras, y siguiendo las órdenes de un director. Es exactamente lo que le pasó a su rostro en un momento determinado del tiempo, y se reproduce fielmente en su rostro virtual para que tomemos una decisión. Me gusta pensar que el motion capture y los personajes virtuales consisten en otra faceta del maquillaje y vestuario que tiene un actor.
Si ya vemos actores de la fama de Willem Dafoe y Ellen Page en un videojuego, qué interesante sería que en un futuro más actores —e incluso directores— mostraran interés de participar en este medio porque la tecnología ya lo permite. Si sucede espero no sea solamente para contar una historia, sino que tenga un peso verdadero en las mecánicas interactivas como en LA Noire.
El cine me ha llevado a pensar en él no como un simple movimiento de imágenes, sino como un movimiento de emociones. Todos los demás medios logran en mí eso, incluyendo los videojuegos. Pero creo firmemente que el que mejor logra ponernos en los zapatos del otro es el cine. Y digo “otro” porque los videojuegos logran perfectamente ponernos en “nuestros” propios zapatos. Somos el protagonista que interactúa con otra realidad y que, dentro de las limitaciones que nos impone la narrativa del videojuego, proyecta una parte de nuestro ser.
Imagino —con cierto optimismo— un futuro en el que mis dos medios preferidos se combinan. Jugar para entendernos, para sentirnos. Imaginemos un Skyrim o un Mass Effect con la tecnología de LA Noire. Imaginemos que hay que juzgar a un asesino de niñas. Independientemente de qué tanto te afecten los puntos narrativos que te hicieron llegar ahí, te encuentras con algo nuevo: las emociones reales de un ser humano en ese personaje virtual. Al igual que en la secuencia de M, el sufrimiento y la necesidad te confrontan: ¿lo matarás?