SE CONNECTER
1,2,3... codez ! | Le site de la Fondation La main à la pâte
Module 123 Codez | Programmer | Informatics and Digital Creation

Projet (EPI) « Synthétiseur » – Séance 3 Enregistrer le son

1, 2, 3, codez ! - Activités cycle 4 - Projet (EPI) « Synthétiseur » - Séance 3 : Enregistrer le son

Discipline dominante

Physique-chimie

Résumé

Revenant sur le fonctionnement du dictaphone et de la fonction d’enregistrement du synthétiseur, les élèves analysent les méthodes qui gouvernent la création de fichiers musicaux WAV ou MP3.

Notions

Information

  •  Un signal analogique est un ensemble continu d’informations (exemple : onde sonore)
  •  Un signal numérique est un ensemble discret (c'est-à-dire discontinu) d’informations.
  •  Pour transformer un signal analogique en signal numérique, il faut discrétiser les informations : on parle de numérisation.
  •  Le spectrogramme d'un son représente comment se combinent ses différentes fréquences au cours du temps.
  •  Le format WAV numérise la forme d'onde du son joué.
  •  Le format MP3 est un format compressé, qui numérise le spectrogramme du son joué.

Matériel

Par groupe (4 groupes différents : A, B, C et D)

  •  Image A de la Fiche 2 en autant d’exemplaires que d’élèves dans le groupe A ; idem pour les images B, C et D dans les trois autres groupes
  •  Fiche 3 imprimée ou photocopiée sur papier calque et prédécoupée en 4 grilles. Prévoir un peu plus de grilles que d’élèves.
  •  Un ordinateur avec Audacity

Situation déclenchante

Le professeur de physique reprend dans le « cahier de suivi » le tableau comparatif que les élèves avaient dressé en Séance 1. En particulier, ils avaient déjà pressenti que la méthode d’enregistrement n’était pas la même entre le dictaphone et l’enregistreur intégré du synthétiseur (ou « enregistreur »). L’enseignant leur demande s’ils se souviennent de leurs réponses.
Il faudra attendre la Séance 4 pour que les élèves puissent mettre un terme plus précis sur la méthode de l’enregistreur : il fonctionne comme en MIDI.
Le professeur demande alors s’ils connaissent des formats d’enregistrement qui pourraient correspondre au dictaphone. Les élèves citent plusieurs formats, que l’on peut classer en deux catégories (bien qu’ils ne le sachent pas encore) :

Formats non compressés Formats compressés
WAV, RAW, BWF, AIFF, CAF, PCM, CDA, OGG… MP3, FLAC, AC3, Ogg Vorbis, WMA, AU, ASF, AAC…

Les formats soulignés sont ceux que nous étudierons par la suite.

Expérimentation : comment fonctionne le format WAV ? (par groupes)

Le professeur demande aux élèves : comment pourrait-on enregistrer la forme d’onde du signal ? Les élèves repensent aux fichiers WAV qu’ils ont chargés dans Audacity : en zoomant très fortement sur l’axe du temps, ils ont peut-être remarqué que la courbe de la forme d’onde était en fait discrétisée en petites « marches ». S’ils hésitent, l’enseignant peut demander à la classe comment sont numérisées les images : les élèves pensent immédiatement aux pixels.

Le professeur propose alors une activité « débranchée » (c’est-à-dire sans ordinateur) pour saisir le fonctionnement du format WAV. Ils vont « pixelliser » un extrait sonore (on dit qu’ils vont l’« échantillonner », ou le « discrétiser »). Il scinde la classe en quatre groupes distincts, qui chacun discrétisera un des quatre signaux (A-diapason, B-guitare, C-violoncelle ou D-clarinette) de la Fiche 2. À chaque élève, il distribue :

  •  un exemplaire de l’image de son groupe ;
  •  la grille 1 de la Fiche 3, imprimée sur papier calque ;
  •  du scotch ou des trombones.

Les élèves doivent superposer l’image et la grille en faisant correspondre les repères en forme de « L », maintenir les 2 couches à l’aide de scotch ou de trombones, puis noircir intégralement, sur le calque vierge, les cases par lesquelles passe le trait de l’image en arrière-plan, avec une contrainte : il ne peut y avoir qu’un pixel noir par colonne.
Lorsque les élèves ont terminé,  ils notent la lettre du signal (A, B, C ou D) sur leur production. Chaque groupe remet à l’enseignant  un ou deux exemplaires  de l’image ainsi pixellisée avec 64 « pixels » (choisir des coloriages dont les cases coloriées sont bien sombres). L’enseignant accroche les productions en 4 colonnes (« Signal A », « Signal B », etc.) et en laissant la place pour tracer ultérieurement 4 lignes (qui seront nommées « grille 1 », « grille 2 », « grille 3 » et « grille 4 »). Les signaux pixellisés avec la grille 1 sont méconnaissables, car l’échantillonnage est trop grossier, comme illustré ci-dessous. Le professeur choisit un échantillonnage pour chaque groupe, et retrace la forme d’onde au crayon :

 
Les formes d’onde du signal C (le violoncelle) « réelle » (à gauche) et « discrétisée » (ou pixellisée, à droite).

Note scientifique :
 En toute rigueur, on parle d’échantillonnage pour la discrétisation temporelle, de pixellisation pour la discrétisation spatiale et de quantification pour discrétiser les intensités. Ici, le travail de discrétisation nécessite un échantillonnage (temps : axe des abscisses) et une quantification (intensité : axe des ordonnées). Ces subtilités n’ont pas besoin d’être connues des élèves.

L’enseignant demande alors si, malgré le caractère « grossier » de l’échantillonnage, certaines caractéristiques de l’onde peuvent néanmoins être mesurables. La périodicité du signal permet de deviner la fréquence du son enregistré, mais le timbre de l’instrument est complètement perdu. Il demande également si on peut réellement parler de pixellisation dans ce cas : évidemment, ce n’est pas le cas, car en abscisse nous avons une coordonnée temporelle, alors qu’en ordonnée nous avons une information d’amplitude. Le professeur introduit donc un vocabulaire spécifique : on utilisera les termes fréquence d’échantillonnage pour décrire la pixellisation temporelle (son unité est le Hz), et résolution pour décrire la quantification des amplitudes (son unité est le bit).

« Comment peut-on améliorer ces numérisations pour en reconnaître le contenu ? » Les élèves proposent : soit on augmente la résolution (on utilise plus de bits pour décrire l’amplitude), soit on augmente la fréquence d’échantillonnage (pour découper plus précisément le temps)… soit les deux. Le professeur annonce que dans le cadre de cette expérimentation, les élèves ont la possibilité technique d’enregistrer quatre fois plus d’information pour décrire leur échantillon. Quelle solution choisissent-ils ?

  •  s’ils décident d’augmenter la résolution d’un facteur 4 : ils reçoivent la grille 2 de la Fiche 3
  •  s’ils décident d’augmenter la fréquence d’échantillonnage d’un facteur 4 : grille 3
  •  s’ils décident d’augmenter à la fois résolution et fréquence d’échantillonnage d’un facteur 2 : grille 4

Pour gagner du temps à la mise en commun, les élèves, après avoir réalisé la numérisation, peuvent, au crayon de couleur et à main levée, reproduire la forme d’onde comme l’enseignant l’avait fait plus tôt.
 

Notes pédagogiques

  •  La distribution des nouvelles grilles se fait par élève : chaque échantillon doit idéalement être testé au moins une fois pour chaque solution.
  •  Prévoir de répéter les consignes « coloriez les cases entièrement ou pas du tout » et « ne coloriez qu’un pixel par colonne » un grand nombre de fois. Ne pas faire l’économie d’une démonstration au tableau de la façon de faire.
  • Au cycle 3, le projet "1, 2, 3... codez!" propose de nombreuses séances sur le binaire et la pixellisation (appliquée aux textes et aux images, mais les concepts sont les mêmes que pour le son).

L’enseignant récupère quelques exemplaires de chaque numérisation de chaque échantillon, afin de peupler le tableau qu’il avait préparé. Qu’en pense la classe ?
Les élèves constatent immédiatement que l’augmentation de la fréquence d’échantillonnage est bien plus efficace que l’augmentation de la résolution. Elle seule permet de repérer l’asymétrie de signaux simples (diapason vs guitare) ou d’observer le détail des signaux complexes (doubles pics du violoncelle)


Exemples d’échantillonnage du signal C : d’une colonne à l’autre, la fréquence d’échantillonnage augmente d’un facteur 2 ; d’une ligne à l’autre,  la résolution augmente d’un facteur 2.
Les grilles préconisées sont signalées par un petit chiffre (il n’est pas utile de les utiliser toutes).

Observation : différents formats WAV (par binômes)

La classe compare avec Audacity les fichiers fournis : ce sont divers enregistrements du violoncelle en La3, avec différentes résolution et différentes fréquences d’échantillonnage. En zoomant à l’échelle du centième de seconde, on peut repérer de subtiles différences : les amplitudes peuvent varier ici et là, de façon minime mais visible. Le spectrogramme change également beaucoup en fonction de la fréquence d’échantillonnage (mais assez peu, d’après Audacity, en fonction de la résolution). Les élèves peuvent enfin vérifier la taille de ces fichiers : dès qu’un des deux échantillonnages double de précision, la taille du fichier double. Ils peuvent également les écouter, pour repérer d’éventuelles différences : la perte de taille s’accompagne-t-elle d’une perte de qualité sensible ?


Comparaison de formes d’onde du violoncelle en La3, entre résolution 8 bits (bleu) et 16 bits (rouge),
pour fréquences d’échantillonnage 12kHz (haut), 24kHz (milieu), 48kHz (bas).

Aujourd’hui, concluent les élèves, les formats WAV sont tous de bonne qualité.

Observation : différents formats MP3 (par binômes)

Le professeur demande maintenant comment faire pour minimiser la taille du fichier, tout en restant capable de différencier un diapason réel d’un signal artificiel sinusoïdal de même fréquence.Les élèves se souviennent que la forme d’onde entre les deux signaux était très ressemblante. La meilleure façon de les différencier était de comparer leur spectrogramme.
Les élèves peuvent ainsi proposer de numériser non pas la forme d’onde, mais le spectrogramme du signal.

C’est donc ce qu’ils vont tester, en numérisant l’échantillon sonore de leur choix avec Audacity, en utilisant divers paramètres de compression de MP3 : dans le menu Fichier > Exporter (Ctrl+Shift+E), en choisissant le type « Fichiers MP3 », il est possible d’éditer les Options > Qualité. En particulier, les élèves peuvent essayer la fréquence par défaut (128kbps) ou des fréquences significativement plus basses, jusqu’à 8kbps.


Comparaison de spectrogrammes du violoncelle en La3 ;
formats de haut en bas : WAV, MP3 128kpbs, MP3 32kbps, MP3 8kbps

En rouvrant ces fichiers avec Audacity, ils peuvent observer l’évolution de la forme d’onde et du spectrogramme en fonction de la qualité choisie (sources disponibles ICI). En-deçà de 32kbps, le spectrogramme se dégrade visiblement : les plus hautes fréquences, souvent plus faibles, sont sacrifiées pour gagner de la place. De plus, contrairement au format WAV, le format MP3 ajoute une compression supplémentaire sur ce signal simplifié pour gagner encore plus de place : cette compression s’effectue avec pertes.

Note scientifique :
 La Transformée de Fourier est à la base de nombreuses applications numériques. L’application Shazam, qui identifie un morceau de musique à partir d’un extrait, ne compare pas directement les morceaux dans sa base de données, mais leurs signatures spectrales. Voir par exemple sur le sujet : https://questions2physique.wordpress.com/2011/02/05/application-shazam/

Conclusion et traces écrites

La classe élabore une conclusion commune que les élèves notent dans leur cahier de projet :

  •  Un signal analogique (exemple : onde sonore) est un ensemble continu d’informations.
  •  Un signal numérique est un ensemble discret (c'est-à-dire discontinu) d’informations.
  •  Pour transformer un signal analogique en signal numérique, il faut discrétiser les informations : on parle de numérisation.
  •  Le format WAV numérise la forme d'onde du son joué.
  •  Le format MP3 est un format compressé, qui numérise le spectrogramme du son joué.

Prolongement : SVT

Les élèves peuvent par la suite étudier la sensibilité de l’oreille humaine (largeur spectrale, capacité de discrimination…) et la comparer à celle d’animaux.
Cela pourrait aboutir à une sensibilisation « hygiène et santé » sur le volume de la musique dans les casques audio, dont les adolescents sont des consommateurs assidus…

Prolongement : musique et droits

Les élèves peuvent faire une étude documentaire sur les droits associés aux contenus multimédia trouvés sur le web.