retour :http://gulliver.eu.org/wiki/Thierry



Cartes son



La qualité sonore générale du son du lien dépend des cartes son choisies. On peut distinguer 3 familles :

- Cartes son intégrées sur la carte mère :

  • Avantages :

Presque gratuit.
Pas besoin de port PCI, USB ou Firewire.

  • Inconvénients :

Faible qualité du son, fort bruit de fond lié au manque de filtrage de l'alimentation et à la proximité de composants travaillant en fréquence (bus, circuits intégrés, Disque dur).
Entrée audio médiocre.

- Cartes son Grand Public :

  • Avantages :

Prix modéré.
Certaines carte utilisent des convertisseurs de bonne qualité.
Compatibilité Linux souvent assurée.
Les cartes 5.1 disposent de plusieurs sorties audio.

  • Inconvénients :

La qualité des convertisseurs en entrée est souvent en retrait par rapport a ceux de sortie.
La bande passante de ces cartes n'est pas toujours plate. Cela pourrait nous obliger à quelques contorsions d'égalisation.

- Cartes son semi-pro du marché Home studio :

  • Avantages :

Démocratisation des convertisseurs de qualité studio d'enregistrement pour un prix maintenant accessible.
Réelles qualités audio. Rapport signal bruit 115 DB en sortie et en entrée. Bande passante donnée sur 20Hz –> 20 Khz a /-0,5Db.
Entrée sortie multiples.

  • Inconvénients :

Prix compris en 120 euros et 700 euros. Souvent autour de 220 euros.
Peu d'élues disposent d'un driver Linux.
Configuration carte mère sérieuse requise (est-ce un inconvénient ?!?).


Pour résumer ici, on peut aisément mettre une carte son genre Créative grand public en sortie de module (château d'eau), les convertisseurs Numérique/Analogique et le bruit de fond en sortie devraient suffire. Pour ce qui est de la carte son en module d'entrée (Studio), il est peut-être sage d'opter pour une carte son semi-pro pour la qualité des convertisseurs Analogique/Numérique.

Un site renseigne des compatibilités des cartes son et Linux pour l'environnement ALSA : http://www.alsa-project.org/alsa-doc/

Une question sans réponse pour l'instant est :
Est-il possible de lire deux flux dirigés vers deux sorties audio différentes sous Linux dans le cadre du projet ?



Le codage du Son



La compression sans perte :
Ici on peut comparer la compression du son au fonctionnement des archives Zip. On pratique une compression mathématique et on ne perd pas de données. Le son est exactement le même en entrée qu'en sortie.
Les formats sont FLAC (Free Lossless Audio Codec), Monkey Audio (APE), WavPack, etc… On divise par environ deux la taille des fichiers wave. Le débit est donc d'environ 80 Ko/s. On est en limite de capacité des voies montantes en ADSL actuellement. Ces formats, même s'il semblent anecdotiques pour l'instant, pourraient, dans un avenir proche, être véhiculés pas des liens IP grand public. L'avantage serait d'avoir à disposition un lien au rendu sonore totalement transparent.

La compression avec perte :
Très à la mode, le mp3 a popularisé la compression avec perte de données. Ici on utilise un modèle psycho-acoustique pour éliminer des sons ou fréquences jugées inaudibles car masqués par des sons plus forts. Les taux de compression sont de l'ordre de 5 a 20. Même si on a pris l'habitude de dire que la qualité est celle du CD audio (non compressé lui), il n'en est rien. Avec un public audiophile, le son compressé est presque toujours démasqué lors d'écoutes en aveugles.

Parti pris sur les Caractéristiques des formats :

  • AAC (Advanced Audio Coding): excellent format en bas débit. La peut-être future radio numérique DRM http://www.drm.org/ utilisera ce format sur des débit proches de 30 Kbps. Ce format est bluffant sur ces débits.
  • WMA (Windows Media Audio): format propriétaire Microsoft. Sa seule qualité est d'être passe-partout dans le monde Windows. Pour ce qui est de la qualité sonore il ne brille jamais.
  • MP3 (MPEG-1/2 Audio Layer 3) : même s'il connaît un grand succès ce format est techniquement obsolète. C'est un peu le syndrome de la cassette VHS : Le format le moins bon qui a un énorme succès commercial. La stéréo est mal codée, la bande passante faible, l'aigu très mal restitué, les taux de compression sont faibles en regard de la qualité sonore offerte.
  • OGG : (Ogg vorbis), format du monde libre. Ce format à des qualités reconnues. Bon taux de compression, bonne qualité à débit moyen ou élevé. Parmis ses defauts, la qualité est moyenne à bas débit. Une sorte de souffle parfois audible, une accentuation audible de l'aigu à débit moyen.

Dans le cadre du projet C.O.I.T. On étudiera l'impact du codage choisi (actuellement Ogg vorbis) sur la qualité sonore. L'impact des réglages fin du codec sur le résultat final. On simulera également une diffusion FM.
On étudiera également l'impact des codages successifs avec des codecs différents. Le chemin qui amène le son a l'auditeur est en effet plein de vicissitudes. Par exemple Un animateur récupère un fichier mp3 sur internet, l'enregistre sur un Minidisc (compression SONY ATRAC), le passe au studio. Pour la rediffusion, le PC enregistre le programme en Ogg Vorbis. Enfin, le signal part vers l'émetteur à travers le lien Ogg vorbis. On a ici un cheminement du son à travers 4 compressions avec perte de donnée, mp3 puis ATRAC puis OGG et enfin a nouveau OGG.

Outre la perte de donnée, on découvre aussi parfois, l'apparition de bruit numérique exemple aliasing. Dans cette étude on fera abstraction du bruit analogique de la chaîne de transmission. On codera successivement le son a travers les différents codec à différents débits. Sans anticiper sur les résultats, l'utilisation du format Ogg Vorbis ayant déjà commencée pour la fabrication ou la transmission d'émissions, il semble que le codec devienne relativement transparent entre 192 et 256 Kbs.

L'étude pourra être présentée sous la forme d'une écoute subjective, avec comparaisons.

D'ici là un wiki plutôt exhaustif sur le codage du son :
http://wiki.hydrogenaudio.org/



Procedure de test du codec audio



Les combainaisons sont très nombreuses entre les codages, le debit recherché, les options d'optimisation,…
Ce vers quoi on tend ici va consister à tester sur une base d'échantillonnage 44100Hz 16bits extraits directement de CD Audio de preference originaux. Pour la qualité du son on évitera des compilation car le mastering n'est pas toujours a l'avantage des oeuvres sonores. On choisira des morceaux différents et de nature a pouvoir mettre en defaut les codec. transitoires, complexité sonore, positionnement stéréo, moteurs audio utilisés lors de la production, …

Limiter à 18 minutes la variété de programmation musicale de canal B est un exercice de funambule. Néanmoins, voici une idée de l'échantillon, non encore finalisé :
http://stream.levillage.org/ferarock/CanalB/com_tech/Zique_94_norm_Q3.ogg
On y trouve :
Boogers : un son très “salis” par du bruit numérique.
Amon Tobin : beaucoup de transitoires et un empillage de son.
Sepultura : Du rock épais.
Dead can dance : du rock analogique et ambiant.
Jeff Mills : Un disque de house musique masterisé comme un disque de musique classique.
Electrelane : Un tube de canal B.
La Zone : Stéréo très marquée et son punck.
Nail Head : du Rock Fort bien coulant.
Massive Attack : selon Chef-chef, ce qu'on fait de mieux pour tester un ensemble sonore.
Moughqual : Electronica virant abstrakt. met très bien en défaut les codec sur les transitoires et l'aigu.
Mr Roux : Chanson française et locale.
Swinkels : Hip Hop Français.
A Tribe Called Quest : Pareil en version US.
Mu : je crois electro clash, met tres tres bien en defaut les codec dès les premiers essais !
Para One : Disque produit en 2006 son très électronique.
NHX : croisement entre drum'n bass et Jazz, c'est également un Live d'excellente qualité.
Natacha Atlas : grosse production musique du monde.
Paco : 2 redoutables dub, qui selon Paco, marchent tres bien pour tester un equipement son.
Red Hot Chili Peper : belle production et masterisation sans grosse compression.
The Rature : pareil.
Autechre : Le meilleur pour la fin, une forme d'ondre d'une grande complexité. C'e n'est plus du son, c'est de la mathématique.

S'ajoutera a cette selection musicale un cocktail sonore composé de prise de son accoustiques sorties de CD de test de matériel audiophile :
http://stream.levillage.org/ferarock/CanalB/com_tech/thierry.ogg

Pour le format Ogg Vorbis :
Le codec Ogg Vorbis accepte des presets indiquant la qualité de -1 a 10. Ces preset sont optimisées grace au positionnement des options de codage. Ansi il est préférable de tester ces preset plutôt que d'imposer au codec un taux de compression en paramètre. On demarrera à Q3 (112 Kbps) car la transmission de certains directs legers en ville se fera peut-être à terme en UMTS sur cette qualité.
Q4 (128 Kbps) est actuellement la qualité d'enregistrement des émissions pour la rediffusion.
Q8 (256 Kbps) commence, pour l'audiophile, à être assez transparent.
Le but est de choisir le meilleur compromis.

Un simulation de chaine complète d'émission :
Cette simulation sera sans doute utile apres une première séance d'écoute et un choix sur par exemple 3 options de codec. La simulation de la chaine complète permettra de vérifier la pertinence des choix.

Le schéma de test peut-être le suivant :
Sortie analogique de l'échantillon → compression/equalisation/limiteur audio → numérisation → passage dans le codec → passage analogique → Modulation émission FM → réception FM → Enregistrement numerique en vue de l'écoute comparative.

Ou bien, suivant l'endroit ou sera placé le traitement de limitation/egalisation :
passage dans le codec → Sortie analogique de l'échantillon → compression/equalisation/limiteur audio → Modulation émission FM → réception FM → Enregistrement numerique en vue de l'écoute comparative.

Pour les animateurs :
Des encodages successifs MP3, AAC, OGG, ATRAC pour établir des préconisations d'usage en vue de présever la qualité sonore de l'antenne. Ici on verifiera également que des encodages en amont, n'ont pas de consequence sur la transparence supposé du codec choisi pour le lien IP.

Perspectives
Tester le comportement du codec OGG a une fréquence d'échantillonnage de 96Khz et tenter d'entendre s'il y a une différence dans la restitution de l'aigu.
On testera si possible le format HE AAC (bof les premiers essais ne mettent pas en valeur ce codec a haut débit).



Premiers résultats des écoutes



Ecoute Ogg Vorbis aux differentes qualités d'encodage
Qualité 4 et 5 une sensation de voile terne sur le son. Stéréo peu crédible. L'ecoute confirme ce tableau. ce n'est qu'a partir de la qualité 6 que le codage stéréo s'améliore.
A partir de la qualité 8, le champs stéréo est clair, l'aigu est defini et subtil. le son encodé est fidèle a l'original.
En qualité 9, il n'est pas toujours évident de distinguer l'original.
Le lien est jugé suffisamment transparent a la qualité 8. Sachant que l'émission se fait en FM, on pense que la qualité cible serait 7 ou 8 avec une preference pour la qualité 8. cela correspond a un débit maximum de 320 Kbps.

Qualité | Cible VBR (kbit/s) | Plage réelle VBR (kbit/s) | Codage stéréo | Gestion bruit
q -2 | ~32 | ~32 - ~64 | point/lossless | yes
q -1 | ~48 | ~48 - ~64 | point/lossless |yes
q 0 | ~64 | ~64 - ~80 | point/lossless |yes
q 1 | ~80 | ~80 - ~96 | point/lossless | yes
q 2 | ~96 | ~96 - ~112 | point/lossless | yes
q 3 | ~112 | ~112 - ~128 | point/lossless | yes
q 4 | ~128 | ~128 - ~160 | point/lossless | no
q 5 | ~160 | ~160 - ~192 | point/lossless | no
q 6 | ~192 | ~192 - ~224 | lossless | no
q 7 | ~224 | ~224 - ~256 | lossless | no
q 8 | ~256 | ~256 - ~320 | lossless | no
q 9 | ~320 | ~320 - ~500 | lossless | no
q 10 | ~500 | ~500 - ~1000 | lossless | no

Ecoute Ogg Vorbis en qualité 8 à differents niveaux
Le principe ici est de normaliser le signal a 0, -3, -6, -9 et -12 Db, simuler son codage puis son decodage puis ramener le niveau a 0 Db pour écoute comparative. pour le signal passé dans le codec a -12 Db on aclairement une perte de qualité sonore. On perd progressivement moins d'information jusqu'au signal passé a -3Db jugé semblable au signal a 0Db.
C'est previsible, le codec n'a pas un comportement linéaire. Le lien devra donc passer un signal normalisé en studio entre 0 et -3Db.

Ecoute Ogg Vorbis Q8 de source déja encodées
On vérifie qu'en présence d'un signal audio déja compressé, on ajoute pas de bruit numérique lors du passage dans le lien.
Lors du passage dans le codec Ogg Vorbis en qualité 8, il n'y a pas de dégradation audible pour :

  • Le son issu d'un minidic (codage ATRAC).
  • Le son issu encodé en mp3 100Kbps.
  • Le son préalablement encodé en OGG Q4 (rediffusion des émissions).
  • Le son passé dans ces trois codecs successivement. Et pour cause, il ne reste plus grand chose de l'original a encoder…

Ecoute Ogg Vorbis contre AAC
A 128 Kbps, le codec ACC est meilleur que le le codec ogg. La sensation est moins terne, plus précise pour AAC. Ce codec est impressionnant a ce débit. S'il existait un encodeur fiable, ce codec remplacerait avantageusement le mp3 96Kbps actuellement utilisé sur les directs en extérieur pour la transmission du son vers les studios.
A 256 Kbps, OGG largement vainqueur. Le codec ACC n'a pas l'évolution de qualité attendue en regard de ses qualitées prometteuses à 128Kbs. Le son en AAC moins fidèle, sur certain s enregistrements le morceau musical est modifié et surtout et l'aigu est jugé “métallique”.

En conclusion OGG vainqueur à haut débit qualité 8.

 
astuces/prod_son.txt · Dernière modification: Le 30/01/2019 à 18:12 par jaxom     Haut de page
Recent changes RSS feed Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki Design by Chirripó