Vous êtes ici

Acoustic book

L'enregistrement du son

L'enregistrement du son

L'enregistrement du son est lié à la nécessité de convertir la vibration de l'air (qui comme nous l'avons vu atteint nos oreille, et est en réalité le stimulus sonore) en signaux électriques. A l'inverse, la reproduction est la conversion d'un signal électrique en une vibration de l'air.
Pour enregistrer un son, nous avons besoin d'un microphone dont le signal devra être stocké, enregistré, par exemple sur une bande magnétique, ou sur des sillons comme dans sur les disques vinyle. Les modes d'enregistrement d'un signal électrique sont dits analogiques.
Un microphone est un transducteur qui reçoit l'énergie des vibrations de l'air et la converti en oscillation électrique.
Il y plusieurs types de microphones:

  1. Condensateur
  2. Piézoélectrique
  3. Electromagnétique

A l'inverse, pour reproduire le son: on lit l'information analogique sur une cassette , ou sur un vinyle, cette information est envoyée au préampli, puis à l'amplificateur, et est ensuite envoyée aux baffles qui mettent l'air en vibration.

De l'analogique nous sommes passés au numérique. Le support de stockage est toujours de nature magnétique (cassettes ou disques magnétiques), ou en forme de petites encoches comme sur CD ou DVD. Comparé à l'enregistrement analogique des années passées, le stockage de l'information en numérique garde l'information sous forme de groupe de bits.
Cela veut donc dire qu'il faut pendant l'enregistrement, après le microphone et le préampli , un convertisseur de signal, de l'analogique vers le numérique; qui est généralement abrégé par les lettres A/N (analogique / numérique (A/D en anglais) ) . Le signal converti est stocké sous forme de fichier.
Pendant la phase de reproduction du son, on a besoin d'un lecteur de signal numérique et d' un convertisseur N/A (D/A), pour ensuite comme avec l'analogique, envoyer l'information à l'amplificateur et aux baffles.


Conversion Analogique / Numérique

La conversion implique deux opérations de base:

  1. L'échantillonnage du signal analogique
  2. L'encodage numérique

Pour échantillonner un signal sonore analogique vers un signal numérique, il est d'abord nécessaire de réaliser une division de la durée en petits intervalles de même longueur. A un nombre fixe d'intervalles, l'amplitude du signal correspondant est mesurée et déduite. Le nombre de divisions de la durée et les possibles valeurs de l'amplitude doivent tout deux être choisis en fonction de la fréquence et de l'amplitude du signal à échantillonner, ainsi que la plus ou moins grande précision nécessaire à la reproduction du son.
Les deux opérations citées ci-dessus peuvent être représentées dans un repère Cartésien. Sur la Figure 23, sur l'axe des x (l'axe du temps) nous avons indiqué 16 subdivisions. Sur l'axe des y , 16 divisions pour l'amplitude positive ou négative de l'amplitude. Pour chaque division du temps il y a une amplitude correspondante; une valeur qui va rester stable pendant un certain laps de temps et ne changera que quand cet intervalle de durée sera terminé.
On a sur l'onde originale plus de points de référence marqués. L'onde obtenue par échantillonnage a une forme en escalier typique, que l'on peut observer dans la figure 23.

Figure 23 Figure 23
Figure 23 Figure 23 pour impression embossée


Le choix de la fréquence d'échantillonnage

Il d'abord s'intéresser à la division du temps pour enregistrer l'amplitude de l'onde. C'est valeur est appelée la fréquence d'échantillonnage, et doit être choisie de manière appropriée pour pouvoir lire correctement encoder le signal analogique.

Le théorème de Nyquist nous montre qu'il est nécessaire d'utiliser une fréquence d'échantillonnage d'au moins deux fois la plus haute fréquence présente dans le signal à échantillonner. Seulement, dans ce cas on ne s'intéresse pas tellement à la forme de l'onde qu'à sa fréquence.

La figure 24 montre un cas dans lequel la fréquence d'échantillonnage est trop basse pour reconstituer le signal entrant. Le signal est constitué de 4 vagues, avec 4 pics négatifs et 4 pics positifs. Les divisions réalisées ne reproduisent pas du tout la forme originale.

Figure 24 Figure 24
Figure 24 Figure 24 pour impression embossée

L'étendue de notre audition n'excède pas 20 000 hz. On a donc besoin d'une fréquence d'échantillonnage d'au moins le double. Le standard utilisé sur les CDs est 44.100Hz. Cela correspond à des laps de 22.7 microsecondes; ou la différence entre deux échantillons est de 22.7 microsecondes.

La conversion de analogique vers numérique peut amener la perception de signaux altérés.
Si il y a un battement entre la fréquence d'échantillonnage et une fréquence échantillonnée il peut y avoir un phénomène d'aliasing ; c'est à dire l'apparition du fausse fréquence équivalente à la différence entre les deux fréquences.
Il existe par exemple des phénomènes d'aliasing dans le domaine visuel ; quand on voit les enjoliveurs d'une voiture tourner dans le sens inverse à celui de la marche du véhicule. Ce signal parasite chevauche le signal réel lorsque la fréquence d'échantillonnage est au moins deux fois la plus haute fréquence présente dans le signal. La figure 24 explique clairement pourquoi il est important que la fréquence d'échantillonnage soit plus de deux fois supérieure à la plus haute fréquence perceptible.
On peut également mettre dans le convertisseur un filtre antialiasing, pour éliminer les effets des harmoniques indésirables.

La deuxième valeur importante , en plus de la fréquence d'échantillonnage est la délimitation de l'encodage de l'amplitude de l'échantillonnage.
L'exemple de la figure 25 montre que pour une même fréquence d'échantillonnage, le signal est reproduit à la manière la plus appropriée si elles augmentent les valeurs possibles des échantillons. La première image montre la forme d'onde avec seulement deux valeurs possibles (0 et 1 qui est une des valeurs de bits et un bit de signe) et la même forme avec quatre valeurs possibles positive et négative (c'est à dire de 0 to 3 à 2 bits pour les valeurs et un bit de signe).

Figure 25 Figure 25
Figure 25 Figure 25 pour impression embossée

Utiliser des valeurs d'échantillonnage appropriées est essentiel pour garantir la qualité de la «dynamique» de la musique qui peut aller du pianissimo au fortissimo avec une hausse qui peut être à plus de 70-80 dB . La limite théorique pour le CD est de 96 dB . Un codage approprié , en gardant à l' esprit qu'il doit aussi représenter le signe qui est à soustraire un bit , doit être d'au moins 16 bits , soit 2 ^ 16 qui correspond à 65 536 valeurs , soit une échelle allant de -32768 à 32768. La valeur 16 bits est utilisé comme standard pour les CD audio , et d'autres formats tels que DVD - Audio en charge jusqu'à une profondeur de 24 bits.
Alors que la relation entre la profondeur ( c'est à dire les valeurs indiquées dans les bits ), et la gamme dynamique ( qui est indiqué en dB ) peut être indiquée approximativement par le rapport de 1 /6, il en résulte que pour l'augmentation de la définition d'un bit , la dynamique augmente d'environ 6 dB . Donc, avec 16 bits , vous pouvez obtenir une dynamique théorique 16 * 6, qui est de 96 db , tandis que 24 bits est possible d'obtenir une dynamique théorique 24 * 6 ou environ 144 dB .
Si vous utilisez une valeur basse résolution de quantification pour un signal de faible intensité montre un bruit de quantification typique qui serait ennuyeux quand le son est amplifié. L'exemple suivant montre le bruit typique de la quantification du son quand un son (ici un piano) s'estompe.


Exemple Sonore

Les figures suivantes présentent le même signal qui conserve la valeur de la résolution de l'échantillon de 16 bits, et réduit les valeurs de la fréquence d'échantillonnage de 44 100 Hz, la seconde à 22050 Hz, 11025 Hz dans le troisième et enfin le dernier à 8000 Hz. L'onde perd peu à peu sa forme à force d'être réduit à une vague de plus en plus simple.

Figure 27 Figure 27
Figure 27 Figure 27 pour impression embossée

Ecoutons un exemple musical (l'ouverture du concerto pour violon et cordes de Mendelssohn). La qualité du son s'amenuise au fur et à mesure.

44100Hz and 16 bits example 22050Hz and 16 bits example
11025Hz and 16 bits example 8000Hz and 16 bits example
3000Hz and 16 bits example

Below it is graphically represented the same signal in which the sampling frequency is maintained at 44.100 Hz, but the resolution is reduced from 16 to 8 bits.

Violin 44100Hz 16 bit
Violin 44100Hz 16 bit

Violin 44100Hz 8 bit
Violin 44100Hz 8 bit

En écoutant les exemples suivants pour les trois valeurs de résolution (16, 8 et 4 bits). Encore une fois la qualité s'amenuise au fur et à mesure qu'on baisse la résolution.

44100Hz and 16 bits example 44100Hz and 8 bits example
44100Hz and 4 bits example

Les dimensions en termes de valeurs d'octets à enregistrer pour une heure de musique de qualité d'un CD sont très élevés et correspondent à 44.100 Hz et une fréquence d'échantillonnage de 16 bits qui ont à être doublés pour la stéréophonie comme suit:
16 (résolution en bits) * 44100 (taux d'échantillonnage) * 3600 (secondes) * 2 (canaux stéréo) = 5,08 E 09 bits. Cette valeur, exprimée en mégaoctets (sachant 1 octet = 8 bits) correspondent à 635,04 MB. Le CD contient également, en plus des données audio, d'autres informations, telles que la correction d'erreur et d'autres type général que le numéro de piste , le temps écoulé, titre de chanson, etc.

Theme by Danetsoft and Danang Probo Sayekti inspired by Maksimer