LA POLITICA DELL'ASCOLTO - LA FILTER BUBBLE SONORA: COME SI ALLENA UN ORECCHIO A NON ASCOLTARE

LA POLITICA DELL'ASCOLTO - LA FILTER BUBBLE SONORA: COME SI ALLENA UN ORECCHIO A NON ASCOLTARE

19 aprile 2026

A cura di

Claudia Di Modugno

La risposta non arriva da un singolo momento di rottura, ma da una trasformazione lenta e quasi impercettibile del modo in cui la musica ci raggiunge. Non è una storia di negligenza individuale: è una storia di architetture, di come gli strumenti attraverso cui ascoltiamo abbiano progressivamente ridisegnato il tipo di attenzione che ci chiedono.

 

Per buona parte del Novecento, la radio è stata lo spazio in cui questo incontro avveniva per necessità strutturale, non per scelta. Il formato imponeva la diversità: chi accendeva la radio non poteva selezionare, poteva solo ricevere. L’American Top 40 di Casey Kasem, che debuttò il 4 luglio 1970 e raggiunse oltre mille stazioni americane nei suoi anni migliori, ne è l’esempio più chiaro. In qualsiasi settimana, il programma poteva alternare una ballad, una canzone country, una funk e una rock. Chi ascoltava incontrava musica che non avrebbe cercato, e in quell’incontro involontario accadeva qualcosa di simile a ciò che Aristotele attribuiva alla paideia: l’orecchio veniva abituato a riconoscere qualità del suono che non aveva ancora imparato a cercare.

 

La promessa del Top 40 era semplice: se avessi aspettato qualche minuto, avresti sentito la canzone che amavi, e lungo la strada avresti potuto scoprire qualcosa che non conoscevi ancora. Quella promessa era, in fondo, una promessa civica: la disponibilità a restare, ad aspettare, a essere sorpresi. Era attrito produttivo, lo stesso tipo di attrito che, nelle sezioni precedenti, abbiamo visto essere il presupposto di qualsiasi ascolto davvero politico. La sua erosione comincia prima di quanto si pensi, e prima di internet. Già nel 1979, una stazione di Cleveland tolse il programma dall’aria durante il culmine della disco, sostituendolo con una classifica filtrata che escludeva il genere. È un momento piccolo, quasi dimenticabile. Ma è il momento esatto in cui entra la logica del filtro, non come tecnologia, ma come mentalità. L’idea che l’ascoltatore debba essere protetto da ciò che non si aspetta, che il disagio dell’incontro imprevisto sia un problema da risolvere anziché una condizione da preservare.

 

L’orecchio contemporaneo non è meno capace di ascoltare: è stato progressivamente allenato a evitare ciò che non riconosce. Un decennio dopo, arriva MTV, e la trasformazione cambia natura. Non è più una questione di selezione del suono: è una questione di relazione con il suono. Con MTV la musica diventa uno spettacolo multisensoriale. Quando l’immagine entra nel suono, l’attenzione cambia oggetto: non si ascolta più una struttura, si guarda una superficie. Il corpo del musicista, il videoclip, l’estetica visiva diventano parte del messaggio, e spesso ne diventano la componente dominante. Non è un dettaglio secondario: è una ridefinizione di cosa significhi fare musica, e di conseguenza di cosa significhi ascoltarla. L’orecchio comincia ad appoggiarsi all’occhio, e in quella delega perde gradualmente l’abitudine a stare da solo con il suono.

 

Con lo streaming, il processo si compie. Eli Pariser, nel suo The Filter Bubble (2011), descrive con precisione il meccanismo: i nostri interessi passati determinano ciò a cui saremo esposti in futuro, lasciando sempre meno spazio agli incontri inaspettati. L’algoritmo non censura, non ha nulla contro la diversità in astratto. Semplicemente ottimizza: costruisce un profilo di ciò che si è già scelto e lo proietta nel futuro, rendendo ogni ascolto la conferma di un ascolto precedente. Il risultato è un paesaggio sonoro in cui la sorpresa viene sistematicamente ridotta, non per malevolenza ma per efficienza. L’intera esperienza della musica si è spostata dall’ascolto al “pascolare”: si ascolta meno, più velocemente, più superficialmente. Non è pigrizia: è il comportamento coerente di un orecchio addestrato a scorrere invece che a restare. Le piattaforme non ottimizzano per l’ascolto, ma per la permanenza: non ciò che ci trasforma, ma ciò che ci trattiene. In questo contesto, l’ascolto prolungato diventa un’eccezione più che una norma, mentre la soglia di attenzione si frammenta in unità sempre più brevi. Diversi studi sull’ascolto digitale mostrano come una quota significativa delle tracce venga interrotta entro i primi secondi, rendendo sempre più rara l’esperienza di un ascolto continuo.

 

Ciò che il testo madre chiama “eccesso di automatismo” trova qui la sua genealogia concreta. Non si tratta di una generazione meno attenta o meno curiosa: si tratta di un orecchio formato da strumenti che hanno progressivamente tolto valore all’attrito, alla pausa, all’incontro con ciò che non si è scelto. Prima la radio ha iniziato a segmentarsi in formati sempre più stretti. Poi MTV ha spostato l’attenzione dal suono all’immagine. Poi lo streaming ha personalizzato ogni esperienza fino a renderla irripetibile, e quindi difficilmente condivisibile. Dove prima l’ascolto implicava l’incontro con l’imprevisto, oggi tende a coincidere con il riconoscimento di ciò che è già familiare. Le metriche di ascolto contemporanee, dal tasso di skip alla durata media di permanenza su una traccia, confermano questa tendenza: ciò che non viene riconosciuto rapidamente viene abbandonato altrettanto rapidamente.

 

Ogni ascoltatore vive ormai in un universo sonoro leggermente diverso, e questa differenza invisibile rende sempre più difficile ascoltare insieme, che è precisamente la condizione della vita politica condivisa. La domanda che rimane aperta è se esistano ancora spazi in cui l’orecchio viene allenato diversamente, in cui la struttura stessa della musica rende di nuovo inevitabile l’attrito, la negoziazione, la presenza dell’altro. Esistono. Ed è esattamente lì che vale la pena guardare adesso.

La risposta non arriva da un singolo momento di rottura, ma da una trasformazione lenta e quasi impercettibile del modo in cui la musica ci raggiunge. Non è una storia di negligenza individuale: è una storia di architetture, di come gli strumenti attraverso cui ascoltiamo abbiano progressivamente ridisegnato il tipo di attenzione che ci chiedono.

 

Per buona parte del Novecento, la radio è stata lo spazio in cui questo incontro avveniva per necessità strutturale, non per scelta. Il formato imponeva la diversità: chi accendeva la radio non poteva selezionare, poteva solo ricevere. L’American Top 40 di Casey Kasem, che debuttò il 4 luglio 1970 e raggiunse oltre mille stazioni americane nei suoi anni migliori, ne è l’esempio più chiaro. In qualsiasi settimana, il programma poteva alternare una ballad, una canzone country, una funk e una rock. Chi ascoltava incontrava musica che non avrebbe cercato, e in quell’incontro involontario accadeva qualcosa di simile a ciò che Aristotele attribuiva alla paideia: l’orecchio veniva abituato a riconoscere qualità del suono che non aveva ancora imparato a cercare.

 

La promessa del Top 40 era semplice: se avessi aspettato qualche minuto, avresti sentito la canzone che amavi, e lungo la strada avresti potuto scoprire qualcosa che non conoscevi ancora. Quella promessa era, in fondo, una promessa civica: la disponibilità a restare, ad aspettare, a essere sorpresi. Era attrito produttivo, lo stesso tipo di attrito che, nelle sezioni precedenti, abbiamo visto essere il presupposto di qualsiasi ascolto davvero politico. La sua erosione comincia prima di quanto si pensi, e prima di internet. Già nel 1979, una stazione di Cleveland tolse il programma dall’aria durante il culmine della disco, sostituendolo con una classifica filtrata che escludeva il genere. È un momento piccolo, quasi dimenticabile. Ma è il momento esatto in cui entra la logica del filtro, non come tecnologia, ma come mentalità. L’idea che l’ascoltatore debba essere protetto da ciò che non si aspetta, che il disagio dell’incontro imprevisto sia un problema da risolvere anziché una condizione da preservare.

 

L’orecchio contemporaneo non è meno capace di ascoltare: è stato progressivamente allenato a evitare ciò che non riconosce. Un decennio dopo, arriva MTV, e la trasformazione cambia natura. Non è più una questione di selezione del suono: è una questione di relazione con il suono. Con MTV la musica diventa uno spettacolo multisensoriale. Quando l’immagine entra nel suono, l’attenzione cambia oggetto: non si ascolta più una struttura, si guarda una superficie. Il corpo del musicista, il videoclip, l’estetica visiva diventano parte del messaggio, e spesso ne diventano la componente dominante. Non è un dettaglio secondario: è una ridefinizione di cosa significhi fare musica, e di conseguenza di cosa significhi ascoltarla. L’orecchio comincia ad appoggiarsi all’occhio, e in quella delega perde gradualmente l’abitudine a stare da solo con il suono.

 

Con lo streaming, il processo si compie. Eli Pariser, nel suo The Filter Bubble (2011), descrive con precisione il meccanismo: i nostri interessi passati determinano ciò a cui saremo esposti in futuro, lasciando sempre meno spazio agli incontri inaspettati. L’algoritmo non censura, non ha nulla contro la diversità in astratto. Semplicemente ottimizza: costruisce un profilo di ciò che si è già scelto e lo proietta nel futuro, rendendo ogni ascolto la conferma di un ascolto precedente. Il risultato è un paesaggio sonoro in cui la sorpresa viene sistematicamente ridotta, non per malevolenza ma per efficienza. L’intera esperienza della musica si è spostata dall’ascolto al “pascolare”: si ascolta meno, più velocemente, più superficialmente. Non è pigrizia: è il comportamento coerente di un orecchio addestrato a scorrere invece che a restare. Le piattaforme non ottimizzano per l’ascolto, ma per la permanenza: non ciò che ci trasforma, ma ciò che ci trattiene. In questo contesto, l’ascolto prolungato diventa un’eccezione più che una norma, mentre la soglia di attenzione si frammenta in unità sempre più brevi. Diversi studi sull’ascolto digitale mostrano come una quota significativa delle tracce venga interrotta entro i primi secondi, rendendo sempre più rara l’esperienza di un ascolto continuo.

 

Ciò che il testo madre chiama “eccesso di automatismo” trova qui la sua genealogia concreta. Non si tratta di una generazione meno attenta o meno curiosa: si tratta di un orecchio formato da strumenti che hanno progressivamente tolto valore all’attrito, alla pausa, all’incontro con ciò che non si è scelto. Prima la radio ha iniziato a segmentarsi in formati sempre più stretti. Poi MTV ha spostato l’attenzione dal suono all’immagine. Poi lo streaming ha personalizzato ogni esperienza fino a renderla irripetibile, e quindi difficilmente condivisibile. Dove prima l’ascolto implicava l’incontro con l’imprevisto, oggi tende a coincidere con il riconoscimento di ciò che è già familiare. Le metriche di ascolto contemporanee, dal tasso di skip alla durata media di permanenza su una traccia, confermano questa tendenza: ciò che non viene riconosciuto rapidamente viene abbandonato altrettanto rapidamente.

 

Ogni ascoltatore vive ormai in un universo sonoro leggermente diverso, e questa differenza invisibile rende sempre più difficile ascoltare insieme, che è precisamente la condizione della vita politica condivisa. La domanda che rimane aperta è se esistano ancora spazi in cui l’orecchio viene allenato diversamente, in cui la struttura stessa della musica rende di nuovo inevitabile l’attrito, la negoziazione, la presenza dell’altro. Esistono. Ed è esattamente lì che vale la pena guardare adesso.

La risposta non arriva da un singolo momento di rottura, ma da una trasformazione lenta e quasi impercettibile del modo in cui la musica ci raggiunge. Non è una storia di negligenza individuale: è una storia di architetture, di come gli strumenti attraverso cui ascoltiamo abbiano progressivamente ridisegnato il tipo di attenzione che ci chiedono.

 

Per buona parte del Novecento, la radio è stata lo spazio in cui questo incontro avveniva per necessità strutturale, non per scelta. Il formato imponeva la diversità: chi accendeva la radio non poteva selezionare, poteva solo ricevere. L’American Top 40 di Casey Kasem, che debuttò il 4 luglio 1970 e raggiunse oltre mille stazioni americane nei suoi anni migliori, ne è l’esempio più chiaro. In qualsiasi settimana, il programma poteva alternare una ballad, una canzone country, una funk e una rock. Chi ascoltava incontrava musica che non avrebbe cercato, e in quell’incontro involontario accadeva qualcosa di simile a ciò che Aristotele attribuiva alla paideia: l’orecchio veniva abituato a riconoscere qualità del suono che non aveva ancora imparato a cercare.

 

La promessa del Top 40 era semplice: se avessi aspettato qualche minuto, avresti sentito la canzone che amavi, e lungo la strada avresti potuto scoprire qualcosa che non conoscevi ancora. Quella promessa era, in fondo, una promessa civica: la disponibilità a restare, ad aspettare, a essere sorpresi. Era attrito produttivo, lo stesso tipo di attrito che, nelle sezioni precedenti, abbiamo visto essere il presupposto di qualsiasi ascolto davvero politico. La sua erosione comincia prima di quanto si pensi, e prima di internet. Già nel 1979, una stazione di Cleveland tolse il programma dall’aria durante il culmine della disco, sostituendolo con una classifica filtrata che escludeva il genere. È un momento piccolo, quasi dimenticabile. Ma è il momento esatto in cui entra la logica del filtro, non come tecnologia, ma come mentalità. L’idea che l’ascoltatore debba essere protetto da ciò che non si aspetta, che il disagio dell’incontro imprevisto sia un problema da risolvere anziché una condizione da preservare.

 

L’orecchio contemporaneo non è meno capace di ascoltare: è stato progressivamente allenato a evitare ciò che non riconosce. Un decennio dopo, arriva MTV, e la trasformazione cambia natura. Non è più una questione di selezione del suono: è una questione di relazione con il suono. Con MTV la musica diventa uno spettacolo multisensoriale. Quando l’immagine entra nel suono, l’attenzione cambia oggetto: non si ascolta più una struttura, si guarda una superficie. Il corpo del musicista, il videoclip, l’estetica visiva diventano parte del messaggio, e spesso ne diventano la componente dominante. Non è un dettaglio secondario: è una ridefinizione di cosa significhi fare musica, e di conseguenza di cosa significhi ascoltarla. L’orecchio comincia ad appoggiarsi all’occhio, e in quella delega perde gradualmente l’abitudine a stare da solo con il suono.

 

Con lo streaming, il processo si compie. Eli Pariser, nel suo The Filter Bubble (2011), descrive con precisione il meccanismo: i nostri interessi passati determinano ciò a cui saremo esposti in futuro, lasciando sempre meno spazio agli incontri inaspettati. L’algoritmo non censura, non ha nulla contro la diversità in astratto. Semplicemente ottimizza: costruisce un profilo di ciò che si è già scelto e lo proietta nel futuro, rendendo ogni ascolto la conferma di un ascolto precedente. Il risultato è un paesaggio sonoro in cui la sorpresa viene sistematicamente ridotta, non per malevolenza ma per efficienza. L’intera esperienza della musica si è spostata dall’ascolto al “pascolare”: si ascolta meno, più velocemente, più superficialmente. Non è pigrizia: è il comportamento coerente di un orecchio addestrato a scorrere invece che a restare. Le piattaforme non ottimizzano per l’ascolto, ma per la permanenza: non ciò che ci trasforma, ma ciò che ci trattiene. In questo contesto, l’ascolto prolungato diventa un’eccezione più che una norma, mentre la soglia di attenzione si frammenta in unità sempre più brevi. Diversi studi sull’ascolto digitale mostrano come una quota significativa delle tracce venga interrotta entro i primi secondi, rendendo sempre più rara l’esperienza di un ascolto continuo.

 

Ciò che il testo madre chiama “eccesso di automatismo” trova qui la sua genealogia concreta. Non si tratta di una generazione meno attenta o meno curiosa: si tratta di un orecchio formato da strumenti che hanno progressivamente tolto valore all’attrito, alla pausa, all’incontro con ciò che non si è scelto. Prima la radio ha iniziato a segmentarsi in formati sempre più stretti. Poi MTV ha spostato l’attenzione dal suono all’immagine. Poi lo streaming ha personalizzato ogni esperienza fino a renderla irripetibile, e quindi difficilmente condivisibile. Dove prima l’ascolto implicava l’incontro con l’imprevisto, oggi tende a coincidere con il riconoscimento di ciò che è già familiare. Le metriche di ascolto contemporanee, dal tasso di skip alla durata media di permanenza su una traccia, confermano questa tendenza: ciò che non viene riconosciuto rapidamente viene abbandonato altrettanto rapidamente.

 

Ogni ascoltatore vive ormai in un universo sonoro leggermente diverso, e questa differenza invisibile rende sempre più difficile ascoltare insieme, che è precisamente la condizione della vita politica condivisa. La domanda che rimane aperta è se esistano ancora spazi in cui l’orecchio viene allenato diversamente, in cui la struttura stessa della musica rende di nuovo inevitabile l’attrito, la negoziazione, la presenza dell’altro. Esistono. Ed è esattamente lì che vale la pena guardare adesso.

19 aprile 2026

19 aprile 2026

Claudia Di Modugno

A cura di

''Dalla varietà imposta della radio alla selezione invisibile delle piattaforme, l'evoluzione dei dispositivi che hanno ridefinito la nostra attenzione musicale''

''Dalla varietà imposta della radio alla selezione invisibile delle piattaforme, l'evoluzione dei dispositivi che hanno ridefinito la nostra attenzione musicale''

''Dalla varietà imposta della radio alla selezione invisibile delle piattaforme, l'evoluzione dei dispositivi che hanno ridefinito la nostra attenzione musicale''