La progettazione del suono nei videogiochi

Il ruolo e le principali tecniche di Sound Design e l'analisi di un caso specifico

Speciale di Iacopo Risi

Che grado d’importanza attribuireste al comparto sonoro nel giudicare un videogioco? Di solito possiamo definire un titolo indimenticabile quando esso si distingue per il gamemplay, il comparto tecnico e, in alcuni casi, l’impianto narrativo.

Tuttavia, quando ricordiamo un’esperienza videoludica la mente ci riporta immediatamente ad un particolare brano della colonna sonora. Il ricordo auditivo risulta spesso più immediato ed emotivamente più coinvolgente di un’immagine o una sequenza video. Possibile che il nostro sistema percettivo abbia priorità diverse rispetto al nostro spirito critico?

Psicologia del suono

Per tentare di rispondere al quesito è necessario fare alcune considerazioni legate allo studio della psicologia del suono, anche noto come psicoacustica. Ci sono molte similitudini tra fenomeni ottici ed acustici. Le prime osservazioni interessanti risalgono al XVII secolo quando Isaac Newton, durante lo studio dello spettro della luce, riscontrò diverse analogie tra i sette colori primari dell’arcobaleno e le sette note della scala musicale diatonica: la combinazione dei suoni, come l’uso di pennello e tavolozza, è in grado di generare pensieri che riconducono ad immagini nella nostra mente.

Esiste però una differenza sostanziale tra suono e immagine. Il primo non è confinato alla sua sorgente, ma si propaga liberamente nell’ambiente e viene colto dall’orecchio, che è in costante esplorazione dello spazio. Questa natura gli conferisce la possibilità di fornire dettagli che cesserebbero di esistere in sua assenza. Ad esempio, un rumore al di là di una parete: l’apparato uditivo riceve informazioni per accedere ad un’area che ci è preclusa visivamente. Il comparto sonoro non è quindi un elemento derivativo dell’immagine in un’opera multimediale, ma un’esperienza in grado di fornire informazioni primarie e raccontare una storia al di fuori dei contorni.

Lo studio della musica cognitiva ha inoltre osservato un rapporto privilegiato tra il suono e l’organo responsabile della gestione delle nostre emozioni, l’amigdala. I dati di input sonori percorrono una corsia preferenziale ed entrano in contatto con il nostro stato emotivo prima che qualsiasi informazione venga elaborata dalla corteccia cerebrale.

Musica per organi emozionali

Abbiamo dunque motivato l’importanza del comparto audio e del suo ruolo, tutt’altro che subordinato alle immagini in movimento. In ambito multimediale esso necessita quindi di una specifica progettazione, che prende il nome di Sound Design. In particolare nei videogiochi, è l’arte di descrivere l’ambiente ed informare il giocatore circa lo svolgersi di alcuni eventi attraverso un uso sistematico di effetti sonori.  Tali effetti possono essere rumori ambientali ma anche semplici passaggi musicali. Pensate al suono delle monete raccolte da Mario o dell’apertura di uno scrigno in un episodio della serie di Legend of Zelda.

Cos’hanno in comune tutti i motivetti che descrivono una conquista o il raggiungimento di un obiettivo? Risposta semplice: richiamano tutti una situazione particolarmente allegra. Vero, ma per quale motivo? Risposta complessa: tutte queste semplici composizioni si basano sull’utilizzo di una scala pentatonica. Cinque semplici note in grado di fornire sequenze audio che conducono ad un codice comunicativo univoco: “la sorte ti è favorevole”.

La teoria della musica indica specifiche classi di tonalità da utilizzare per veicolare un certo tipo di emozioni. L’utilizzo di scale minori sono ad esempio l’ideale per riprodurre sensazioni malinconiche, mentre un approccio di tipo atonale, in cui la composizione non segue una linea armonica, è tipico dei temi horror. Ma sono solo alcuni esempi, dato che per la generazione di uno stato d’animo le strategie sonore possono essere molteplici.

Per evidenziare situazioni di angoscia o pericolo risulta particolarmente efficace l’utilizzo dei suoni non lineari, così detti perché subiscono variazioni dovute a fattori esterni durante la loro propagazione. Una eccessiva alterazione del timbro vocale, un repentino cambio di modulazione di uno “staccato” per violino o il boom sonico di un aereo sono in grado di provocare sensazioni di disagio.

La musica adattiva

Un particolare tipo di propagazione non lineare del suono è la cosiddetta musica adattiva in cui il tema musicale varia dinamicamente in relazione alla successione degli eventi. Si tratta di una tecnica centrale per i videogiochi poiché, rispetto ad altri medium, essi aggiungono la componente dell’interazione che può modificare in qualsiasi istante il corso degli eventi. Anche se particolarmente diffusa nelle moderne produzioni videoludiche, la musica adattiva è quasi contemporanea all’introduzione del sonoro nel mondo dei videogiochi. Alcuni rudimentali esempi sono infatti già riscontrabili in pietre miliari come Space Invaders e Frogger.

Un grosso passo avanti venne fatto da Lucas Arts che progettò durante gli anni ’90 un sound engine dinamico basato sulla tecnologia MIDI: iMuse. Presente in quasi tutti i suoi capolavori di quel decennio, iMuse divenne piuttosto celebre nelle serie X-Wing/Tie-Fighter, in cui la colonna sonora di Star Wars accompagnava le fasi di volo spaziale. Improvvise variazioni dello scenario, come l’arrivo di truppe nemiche, il completamento o il fallimento di una missione innescavano un sofisticato algoritmo che modificava il tema musicale. Le transizioni erano rapide ed impercettibili, come se si trattasse di un brano precedentemente registrato.

Un caso specifico: Amnesia

Nel 2010 Frictional Games, software house indipendente svedese, pubblicò un titolo destinato a diventare una pietra miliare nel mondo dei videogiochi. Amnesia:The Dark Descent non offriva alcuna rivoluzione in ambito visivo/interattivo: nessun modello per la gestione della fisica, nessuna innovazione nel campo dell’intelligenza artificiale e nessun motore grafico in grado di elevare il gioco a livelli di dettaglio mai visti. La particolarità di questo titolo era quella di essere un videogioco esplorativo in cui il suono è la principale voce narrante dell’intera esperienza.

Il gioco, in termini di gameplay, offre un approccio alquanto familiare: un survival horror in prima persona di chiara ispirazione lovecraftiana, ambientato all’interno di un castello. Il giocatore, privo di qualsiasi informazione riguardo all’ambiente, deve muoversi per le stanze in cerca di indizi per far luce sulla vicenda ed uscire incolume dall’austero edificio. Scordatevi grafica di alto livello e palette cromatiche ad hoc, espedienti come jump scares ed incontri ravvicinati con spaventose creature. Il senso di angoscia è alimentato da oggetti che cadono, porte che si aprono, voci lontane con effetti di riverbero o il semplice rumore dei propri passi.

Allucinazioni e paranoie, vero segno distintivo dei titoli ispirati dal solitario di Providence, sono arricchiti nel dettaglio dalla musica ambientale. Tutto sembra studiato per non distogliere l’attenzione da ciò che avviene a livello auditivo. Per questa ragione gli sviluppatori consigliano caldamente l’utilizzo di un paio di cuffie ed un ambiente poco illuminato.

Amnesia ha segnato la rinascita del survival horror dopo un lungo periodo di stagnazione, diventando fonte d’ispirazione per titoli del calibro di Outlast e Resident Evil 7, capitolo che ha rilanciato il brand dopo molteplici cadute di stile.

Ci sono 6 commenti

AleBrasa

Buon articolo ma ci sono degli errori, un suono ha sempre una sorgente sonora che lo produce.

AleBrasa

“Esiste però una differenza sostanziale tra suono e immagine. Il primo non è confinato alla sua sorgente”

Questa frase è tecnicamente sbagliata. 😉

iaga
iaga "Over Nine Thousand!"
Gameplay Café è il mio ritualeChiacchierone!NiubboGuardone!
21 Novembre 2022 alle 15:55

Probabilmente non hai afferrato il senso del discorso. Vedi, il video è strettamente legato alla sorgente, ovvero è confinato allo schermo. Il suono, chiaramente prodotto da una sorgente (altoparlante), è una risorsa multimediale che tuttavia si diffonde nello spazio, caratteristica che lo differenzia sensibilmente dal video e ne consegue quel che vado a spiegare successivamente

    AleBrasa

    No ho colto quello che volevi dire, il fatto è che il suono è legato alla sorgente proprio come l’immagine che di fatto è fatta di onde e fotoni, cosi come il suono rimbalza con diversi coefficienti sui vari materiali che compongono l’ambiente, anche l’immagine che si propaga nello spazio è legata anche a quest’ultima.

    Semplicemente era frase che per chi mastica il linguaggio specialistico risultava ambigua, tutto qui.

iaga
iaga "Over Nine Thousand!"
Gameplay Café è il mio ritualeChiacchierone!NiubboGuardone!
23 Novembre 2022 alle 10:34

Beh, mi sembra di capire che per te fosse necessario o perlomeno sufficiente parlare di “contenuto sonoro” e “contenuto video” anziché suono e immagine.
Posso comprendere quel che intendi, se prendi la frase che hai riportato al di fuori del contesto, cosa che non si dovrebbe mai fare, specie a corredo di un’osservazione così puntigliosa.
Lasciami comunque dire che quel che l’immagine diffonde nello spazio non è altro che un riflesso, che non fornisce alcuna informazione ulteriore al contenuto che resta comunque confinato nella sorgente. Difatti l’utente non volge lo sguardo al di fuori di essa per cogliere chissà quale dettaglio.
L’ambiguità nasce dall’aver ripreso, come ho detto, una frase al di fuori del contesto. Difatti, basta proseguire nella parte del discorso: “…ma si propaga liberamente nell’ambiente e viene colto dall’orecchio, che è in costante esplorazione dello spazio”.

Lascia un commento