CGI – Motion – Capture: Accenni storici

Quando noi sorridiamo, sorridere è un atto cosciente, noi possiamo imporre di sorridere e possiamo fingere di sorridere, attivando tutta una serie di meccanismi e di muscoli facciali in un certo numero, ma la differenza di quando noi fingiamo di sorridere e di quando noi sorridiamo veramente noi attiviamo una serie di muscoli facciali che si attivano autonomamente, legati ad un espressività inconscia e il numero di muscoli facciali che si attivano è molto superiore a quelli che si attivano quando noi facciamo finta di sorridere. Qui si aprirebbe una parentesi troppo lunga sulle teorie dell’attore e sul rapporto tra l’immedesimazione e la simulazione, che sono i due grandi filoni teorici delle teorie dell’interpretazione, al di là di questo è interessante che tutti questi sensori e meccanismi per cogliere le espressioni del volto ambiscono anche a cogliere quelle espressioni del volto che vanno oltre la parte cosciente della recitazione e si spinge fino a riuscire anche a cogliere i movimenti muscolari involontari. L’efficacia di questa tecnologia si basa ad una serie di dati collegati al nostro corpo e alla nostra fisicità, sia volontari che involontari.

Storia per Tappe Fondamentali di questa tecnologia, fondamentale per ridurre quello scarto tra reale e virtuale che può salvare tutti i meccanismi di empatia su cui si basa il rapporto tra il film e lo spettatore

Il film pionieristico della Motion – Capture è Il Signore degli Anelli (2001 – 2003) in cui il personaggio di Gollum è stato creato a partire da un attore in carne ed ossa i cui movimenti sono stati rilevati, digitalizzati e rielaborati a partire da 25 telecamere. Siamo partiti da un’immagine di un attore reale per creare poi il personaggio virtuale. Abbiamo utilizzato il principio del Foto – Realismo, non si è partiti dalla realtà ma si è mediata questa realtà da un’immagine ripresa dalle telecamere, e poi questa realtà già trasformata in immagine è stata a sua volta ritrasformata in una serie di immagini virtuali   

King Kong, sempre di Peter Jackson (2005) ha ulteriormente perfezionato questa tecnica, moltiplicando il numero di telecamere: 52 per cogliere e per poter riprodurre i movimenti del corpo, e addirittura 22 per studiare i movimenti del volto. Per poter far muovere il mostro King Kong in maniera realistica e credibile sono state utilizzate più di 70 telecamere, ben ventidue sono state concentrate sul volto proprio perché la restituzione del volto e della sua espressività è assolutamente determinante per i processi di comunicazione delle emozioni allo spettatore, e anche nei processi di empatia e di emozionalità cinematografica che ci permettono poi di seguire un film con interesse. La tecnologia virtuale poteva anche essere una minaccia che rischiava di distruggere tutti questi effetti empatici, ma che attraverso il motion – capture e il performance – capture si è tentato di trovare una forma di compromesso, una sorta di negoziazione tra il falso totale della virtualità e il realismo dell’orizzonte fotografico.

Dalla motion capture siamo poi passati alla performance capture che permette la cattura contemporanea sia dei dati corporei sia dei dati facciali, in due film successivi di Robert Zemeckis, The Polar Express e Beowulf è stata introdotta la nuova tecnologia di marker, di elettrodi applicati sul corpo degli attori, e anche qui dal numero di marker che sono stati utilizzati notiamo come l’espressività del volto ha assunto un ruolo sempre più preponderante per perfezionare questa tecnica. In Polar Express sono stati utilizzati 80 Marker e 8 Videocamere per il corpo, e un numero quasi doppio di marker per il volto e addirittura 56 telecamere per studiare e registrare e ricostruire le espressioni facciali. Nel film successivo è stata adottata una nuova tecnologia per addirittura mettere dei rivelatori intorno agli occhi per poter studiare e cogliere lo spostamento dei globi oculari, quindi un qualcosa che è al confine del controllo cosciente dell’attore e l’automatismo prodotto direttamente dal corpo al di fuori del proprio controllo. Quindi la performance capture ai livelli di perfezionamento raggiunge la volontà di riprodurre anche quegli automatismi che il corpo dell’attore genera autonomamente al di fuori del proprio controllo, del proprio mestiere, per avvicinare la performance virtuale del corpo ai meccanismi e al funzionamento non solo cosciente dell’attore, ma anche al funzionamento corporeo, si va oltre la volontà di riprendere la performance, di riprodurre una tecnica di recitazione costituita dall’attore; si vuole cogliere la tecnica, ma anche il corpo stesso e gli automatismi che il corpo produce indipendentemente dalla volontà stessa dell’attore. In questo caso abbiamo 70 espressioni facciali e una serie di dettagli del volto dell’attore (occhi, narici, bocca etc.) che vanno sempre di più nella dimensione del Foto – Realismo sempre più marcato.

La tappa successiva di questo sviluppo della Performance Capture è stato il film di Benjamin Button di David Fincher, del 2008, in cui per invecchiare verosimilmente il volto dell’attore protagonista è stato creato un volto sintetico, virtuale, artificiale ricavato dal volto reale dell’attore, e poi questo volto è stato innescato sul corpo di una controfigura più bassa di statura rispetto a quella del protagonista, molto più magra, che potesse rendere verosimilmente il personaggio da vecchio. E qui addirittura si è passati dalla rilevazione puntuale delle parti del volto dell’attore alla possibilità di catturare l’intera superficie corporea del volto dell’attore cospargendoci nel volto stesso una sorta di crema invisibile all’occhio, ma visibile a un dispositivo tecnologico utilizzato per studiare i movimenti del volto di Brad Pitt, portando alla creazione di 180 micro – espressioni facciali che poi sono state alla base dell’espressività del personaggio di Brad Pitt invecchiato virtualmente    

In Avatar siamo giunti ad un passo successivo, che lo possiamo definire come il trionfo del foto – realismo perché per creare l’espressività del volto degli Avatar si è partiti direttamente dall’espressività del volto degli attori che interpretavano gli avatar, che a partire dalla loro performance sono state poi ricreate digitalmente le performance degli avatar. Per partire dall’espressività fotografica del volto degli attori si sono messe delle micro – camere davanti ai loro volti, a pochi centimetri, per consentire costantemente sul set le espressioni facciali dell’attore in tutti i momenti della scena e delle riprese dei film. Il dispositivo a pochi centimetri dal volto altro non è che una micro – videocamera, un obiettivo quadrangolare che permette di filmare e di tenere costantemente nell’immagine tutto il volto dell’attore. L’espressività reale dell’attore è stata tramutata in immagine attraverso le telecamere, e attraverso la rielaborazione digitale dell’espressività reale dell’attore è stata poi creata l’espressività dei personaggi avatar. E’ una virtualità che tiene in piedi in modo molto pesante la performatività dell’attore, è egli stesso sul set finto, spazio vuoto in cui non c’è più una scenografia, e questa performance attorica è sempre alla base degli avatar. E’ il meccanismo della Motion – Capture.  La Uncanny valley è un meccanismo usato nella robotica; Non è necessario che noi percepiamo questi personaggi come al cento per cento reali e verosimili, ma bisogna percepirli come personaggi dotati della capacità di vivere e di poterci trasmettere delle emozioni. James Cameron spiega che il caschetto per l’attore è fatto su misura su ciascun attore e attraverso questa camera situata a pochi centimetri dal volto e grazie a questo dispositivo garantisce di avere tutte le espressioni del volto durante tutti i suoi movimenti all’interno del set. Ogni movimento dell’Avatar, attraverso ad es. delle funi/ cavi, svuotati di ogni scenografia, aggiunta solo digitalmente, è stato veramente attuato dagli attori in carne ed ossa sul set, attraverso movimenti acrobatici con dispositivi sicuri. Per il regista la recitazione degli attori confluita poi digitalmente nell’avatar è del 110 per cento, perché grazie a questo dispositivo di catturare le espressioni del volto ho potuto tradurre nel film anche l’elemento aggiuntivo dell’emozione che non è direttamente visibile dentro l’attore. A un certo punto il regista ha spiegato questo meccanismo dell’Uncanny Valley, la valle del perturbante, elaborato dagli studiosi di robotica per cercare di capire in che modo la nostra percezione e la nostra emotività reagiscono di fronte a dei personaggi robotici, che simulano la consistenza fisica e dei movimenti dell’essere umano. Quando questi robot assumono sempre più sembianze umane, queste creature robotiche assumono sempre più un carattere perturbante, avvicinandoci troppo a noi ci inquietano, ci spaventano, e allora arriviamo all’uncanny valley, all’avvallamento del perturbante, c’è un crollo totale della familiarità, arrivando alla simulazione di un cadavere o addirittura a quella di uno zombie che è un qualcosa che assume un aspetto fortemente realistico ma che ci inquieta, dandoci un effetto perturbante. Quando l’obiettivo della robotica ci porta alla persona in salute, riproducendo un doppione identico all’essere umano; se dobbiamo collocare i replicanti di Blade Runner in questo grafico è la vetta dell’umanità e della familiarità.

Nei cartoni animati di solito quello che produce empatia è che sono dei cartoni animati con animali antropomorfizzati. Quando si parla poi di bambini si entra poi in un sistema cognitivo emozionale che è diverso da quello dell’adulto. Lo stesso James Cameron quando spiega le tecniche utilizzate per la realizzazione degli Avatar fa riferimento a questa teoria applicata nel campo della robotica. Gli Avatar non sono degli umani, non sono i replicanti di blade runner interpretati dagli attori in carne ed ossa ma sono figure che si distanziano in maniera significativa dall’essere umano, ma sono personaggi che almeno nelle intenzioni del regista prevengono alla caduta di questo tipo di familiarità che è determinato da questa teoria. Hanno cercato di costruire negli avatar il punto più alto di interesse e di familiarità.

Performance ed emozione

• Performance capture permette di lavorare su molteplici livelli della rappresentazione: 

  • L’espressione dell’attore – Uno dei fattori fondamentali della comunicazione dell’emozione cinematografica
  • ll primo piano  – Il tipo di inquadratura che evidenzia e sottolinea il volto dell’attore e la sua espressività, assumendo rispetto a tutte le altre inquadrature un ruolo emozionale diverso
  • Simulazione dei fattori fisiologici dell’emozione (muscoli facciali, postura, sistema muscolare), fattori fisiologici in cui noi proviamo, viviamo e comunichiamo le nostre emozioni all’esterno.