Projet (EPI) « Synthétiseur » – Séance 3 Enregistrer le son
1, 2, 3, codez ! - Activités cycle 4 - Projet (EPI) « Synthétiseur » - Séance 3 : Enregistrer le son
Discipline dominante |
Physique-chimie |
Résumé |
Revenant sur le fonctionnement du dictaphone et de la fonction d’enregistrement du synthétiseur, les élèves analysent les méthodes qui gouvernent la création de fichiers musicaux WAV ou MP3. |
Notions |
Information
|
Matériel |
Par groupe (4 groupes différents : A, B, C et D) |
Situation déclenchante
Le professeur de physique reprend dans le « cahier de suivi » le tableau comparatif que les élèves avaient dressé en Séance 1.
En particulier, ils avaient déjà pressenti que la méthode
d’enregistrement n’était pas la même entre le dictaphone et
l’enregistreur intégré du synthétiseur (ou « enregistreur »).
L’enseignant leur demande s’ils se souviennent de leurs réponses.
Il faudra attendre la Séance 4 pour que les élèves puissent mettre un terme plus précis sur la méthode de l’enregistreur : il fonctionne comme en MIDI.
Le professeur demande alors s’ils connaissent des formats
d’enregistrement qui pourraient correspondre au dictaphone. Les élèves
citent plusieurs formats, que l’on peut classer en deux catégories (bien
qu’ils ne le sachent pas encore) :
Formats non compressés | Formats compressés |
---|---|
WAV, RAW, BWF, AIFF, CAF, PCM, CDA, OGG… | MP3, FLAC, AC3, Ogg Vorbis, WMA, AU, ASF, AAC… |
Les formats soulignés sont ceux que nous étudierons par la suite.
Expérimentation : comment fonctionne le format WAV ? (par groupes)
Le professeur demande aux élèves : comment pourrait-on
enregistrer la forme d’onde du signal ? Les élèves repensent aux
fichiers WAV qu’ils ont chargés dans Audacity : en zoomant très
fortement sur l’axe du temps, ils ont peut-être remarqué que la courbe
de la forme d’onde était en fait discrétisée en petites
« marches ». S’ils hésitent, l’enseignant peut demander à la
classe comment sont numérisées les images : les élèves pensent
immédiatement aux pixels.
Le professeur propose alors une activité « débranchée »
(c’est-à-dire sans ordinateur) pour saisir le fonctionnement du format
WAV. Ils vont « pixelliser » un extrait sonore (on dit qu’ils
vont l’« échantillonner », ou le « discrétiser »).
Il scinde la classe en quatre groupes distincts, qui chacun discrétisera
un des quatre signaux (A-diapason, B-guitare, C-violoncelle ou
D-clarinette) de la Fiche 2. À chaque élève, il distribue :
- un exemplaire de l’image de son groupe ;
- la grille 1 de la Fiche 3, imprimée sur papier calque ;
- du scotch ou des trombones.
Les élèves doivent superposer l’image et la grille en faisant
correspondre les repères en forme de « L », maintenir les 2
couches à l’aide de scotch ou de trombones, puis noircir intégralement,
sur le calque vierge, les cases par lesquelles passe le trait de l’image
en arrière-plan, avec une contrainte : il ne peut y avoir qu’un
pixel noir par colonne.
Lorsque les élèves ont terminé, ils notent la lettre du signal
(A, B, C ou D) sur leur production. Chaque groupe remet à
l’enseignant un ou deux exemplaires de l’image ainsi
pixellisée avec 64 « pixels » (choisir des coloriages dont les
cases coloriées sont bien sombres). L’enseignant accroche les
productions en 4 colonnes (« Signal A », « Signal
B », etc.) et en laissant la place pour tracer ultérieurement 4
lignes (qui seront nommées « grille 1 », « grille
2 », « grille 3 » et « grille 4 »). Les signaux
pixellisés avec la grille 1 sont méconnaissables, car l’échantillonnage
est trop grossier, comme illustré ci-dessous. Le professeur choisit un
échantillonnage pour chaque groupe, et retrace la forme d’onde au crayon
:
Les formes d’onde du signal C (le violoncelle) « réelle » (à
gauche) et « discrétisée » (ou pixellisée, à droite).
Note scientifique :
En toute rigueur, on parle d’échantillonnage pour la
discrétisation temporelle, de pixellisation pour la discrétisation
spatiale et de quantification pour discrétiser les intensités. Ici, le
travail de discrétisation nécessite un échantillonnage (temps : axe
des abscisses) et une quantification (intensité : axe des
ordonnées). Ces subtilités n’ont pas besoin d’être connues des élèves.
L’enseignant demande alors si, malgré le caractère
« grossier » de l’échantillonnage, certaines caractéristiques
de l’onde peuvent néanmoins être mesurables. La périodicité du
signal permet de deviner la fréquence du son enregistré, mais le timbre
de l’instrument est complètement perdu. Il demande également si on peut
réellement parler de pixellisation dans ce cas : évidemment, ce
n’est pas le cas, car en abscisse nous avons une coordonnée temporelle,
alors qu’en ordonnée nous avons une information d’amplitude. Le
professeur introduit donc un vocabulaire spécifique : on utilisera
les termes fréquence d’échantillonnage pour décrire la pixellisation temporelle (son unité est le Hz), et résolution pour décrire la quantification des amplitudes (son unité est le bit).
« Comment peut-on améliorer ces numérisations pour en reconnaître le contenu ? »
Les élèves proposent : soit on augmente la résolution (on utilise plus
de bits pour décrire l’amplitude), soit on augmente la fréquence
d’échantillonnage (pour découper plus précisément le temps)… soit les
deux. Le professeur annonce que dans le cadre de cette expérimentation,
les élèves ont la possibilité technique d’enregistrer quatre fois plus
d’information pour décrire leur échantillon. Quelle solution
choisissent-ils ?
- s’ils décident d’augmenter la résolution d’un facteur 4 : ils reçoivent la grille 2 de la Fiche 3
- s’ils décident d’augmenter la fréquence d’échantillonnage d’un facteur 4 : grille 3
- s’ils décident d’augmenter à la fois résolution et fréquence d’échantillonnage d’un facteur 2 : grille 4
Pour gagner du temps à la mise en commun, les élèves, après avoir
réalisé la numérisation, peuvent, au crayon de couleur et à main levée,
reproduire la forme d’onde comme l’enseignant l’avait fait plus tôt.
Notes pédagogiques
- La distribution des nouvelles grilles se fait par élève : chaque échantillon doit idéalement être testé au moins une fois pour chaque solution.
- Prévoir de répéter les consignes « coloriez les cases entièrement ou pas du tout » et « ne coloriez qu’un pixel par colonne » un grand nombre de fois. Ne pas faire l’économie d’une démonstration au tableau de la façon de faire.
- Au cycle 3, le projet "1, 2, 3... codez!" propose de nombreuses séances sur le binaire et la pixellisation (appliquée aux textes et aux images, mais les concepts sont les mêmes que pour le son).
L’enseignant récupère quelques exemplaires de chaque numérisation de
chaque échantillon, afin de peupler le tableau qu’il avait préparé.
Qu’en pense la classe ?
Les élèves constatent immédiatement que l’augmentation de la fréquence
d’échantillonnage est bien plus efficace que l’augmentation de la
résolution. Elle seule permet de repérer l’asymétrie de signaux simples
(diapason vs guitare) ou d’observer le détail des signaux complexes
(doubles pics du violoncelle)
Exemples d’échantillonnage du signal C : d’une colonne à l’autre,
la fréquence d’échantillonnage augmente d’un facteur 2 ; d’une
ligne à l’autre, la résolution augmente d’un facteur 2.
Les grilles préconisées sont signalées par un petit chiffre (il n’est pas utile de les utiliser toutes).
Observation : différents formats WAV (par binômes)
La classe compare avec Audacity les fichiers fournis : ce sont divers enregistrements du violoncelle en La3, avec différentes résolution et différentes fréquences d’échantillonnage. En zoomant à l’échelle du centième de seconde, on peut repérer de subtiles différences : les amplitudes peuvent varier ici et là, de façon minime mais visible. Le spectrogramme change également beaucoup en fonction de la fréquence d’échantillonnage (mais assez peu, d’après Audacity, en fonction de la résolution). Les élèves peuvent enfin vérifier la taille de ces fichiers : dès qu’un des deux échantillonnages double de précision, la taille du fichier double. Ils peuvent également les écouter, pour repérer d’éventuelles différences : la perte de taille s’accompagne-t-elle d’une perte de qualité sensible ?
Comparaison de formes d’onde du violoncelle en La3, entre résolution 8 bits (bleu) et 16 bits (rouge),
pour fréquences d’échantillonnage 12kHz (haut), 24kHz (milieu), 48kHz (bas).
Aujourd’hui, concluent les élèves, les formats WAV sont tous de bonne qualité.
Observation : différents formats MP3 (par binômes)
Le professeur demande maintenant comment faire pour minimiser la
taille du fichier, tout en restant capable de différencier un diapason
réel d’un signal artificiel sinusoïdal de même fréquence.Les élèves se
souviennent que la forme d’onde entre les deux signaux était très
ressemblante. La meilleure façon de les différencier était de comparer
leur spectrogramme.
Les élèves peuvent ainsi proposer de numériser non pas la forme d’onde, mais le spectrogramme du signal.
C’est donc ce qu’ils vont tester, en numérisant l’échantillon sonore de
leur choix avec Audacity, en utilisant divers paramètres de compression
de MP3 : dans le menu Fichier > Exporter (Ctrl+Shift+E), en
choisissant le type « Fichiers MP3 », il est possible d’éditer
les Options > Qualité. En particulier, les élèves peuvent essayer la
fréquence par défaut (128kbps) ou des fréquences significativement plus
basses, jusqu’à 8kbps.
Comparaison de spectrogrammes du violoncelle en La3 ;
formats de haut en bas : WAV, MP3 128kpbs, MP3 32kbps, MP3 8kbps
En rouvrant ces fichiers avec Audacity,
ils peuvent observer l’évolution de la forme d’onde et du spectrogramme
en fonction de la qualité choisie (sources disponibles ICI).
En-deçà de 32kbps, le spectrogramme se dégrade visiblement : les
plus hautes fréquences, souvent plus faibles, sont sacrifiées pour
gagner de la place. De plus, contrairement au format WAV, le format MP3
ajoute une compression supplémentaire sur ce signal simplifié pour
gagner encore plus de place : cette compression s’effectue avec
pertes.
Note scientifique :
La Transformée de Fourier est à la base de nombreuses
applications numériques. L’application Shazam, qui identifie un morceau
de musique à partir d’un extrait, ne compare pas directement les
morceaux dans sa base de données, mais leurs signatures spectrales. Voir
par exemple sur le sujet : https://questions2physique.wordpress.com/2011/02/05/application-shazam/
Conclusion et traces écrites
La classe élabore une conclusion commune que les élèves notent dans leur cahier de projet :
- Un signal analogique (exemple : onde sonore) est un ensemble continu d’informations.
- Un signal numérique est un ensemble discret (c'est-à-dire discontinu) d’informations.
- Pour transformer un signal analogique en signal numérique, il faut discrétiser les informations : on parle de numérisation.
- Le format WAV numérise la forme d'onde du son joué.
- Le format MP3 est un format compressé, qui numérise le spectrogramme du son joué.
Prolongement : SVT
Les élèves peuvent par la suite étudier la sensibilité de l’oreille
humaine (largeur spectrale, capacité de discrimination…) et la comparer à
celle d’animaux.
Cela pourrait aboutir à une sensibilisation « hygiène et
santé » sur le volume de la musique dans les casques audio, dont
les adolescents sont des consommateurs assidus…
Prolongement : musique et droits
Les élèves peuvent faire une étude documentaire sur les droits associés aux contenus multimédia trouvés sur le web.
Extrait de "1, 2, 3... codez !", Editions Le Pommier, 2016-2017. Publié sous licence CC by-nc-nd 3.0.