Je suis venu vous conter une histoire. Cette histoire est issue d’un dĂ©sir coupable de frimer un peu.
Non, je n’ai pas rĂ©ussi Ă faire quelque chose d’exceptionnel ou d’impossible comme inventer une ampoule qui dure 10 fois plus longtemps que toutes les autres.
Je souhaite juste montrer comment GNU/Linux, le système D et la philosophie OpenSource/libre/DIY peuvent permettre d’automatiser un processus de production vidĂ©o.
Contexte:
Je suis dĂ©veloppeur de Rolisteam. J’avais besoin de faire un peu la promotion du logiciel. De plus, en tant que maĂ®tre de jeu, j’avais envie de garder une trace de ma campagne, histoire
d’en faire profiter d’autres gens.
L’enregistrement des parties en vidĂ©o et audio nous a semblĂ© la meilleure solution pour atteindre ces objectifs.
Le choix des outils:
Après une phase de recherche, mon choix s’est porté sur:
SimpleScreenRecorder (SSR)
Il est pratique, simple et la qualitĂ© vidĂ©o est plutĂ´t bonne. Le seul problème c’est l’enregistrement audio. Impossible d’enregistrer en mĂŞme temps mon micro et
les voix de mes camarades Ă moins de configurer pulseaudio ou l’usage de Jack. Je n’avais pas envie de changer toute la configuration son de ma bĂ©cane. C’est peut-ĂŞtre facile Ă faire mais j’avais pas envie de me lancer la dedans. De plus, la qualitĂ© audio de SSR est moins bonne que Teamspeak (je trouve en tout cas).
Teamspeak:
Ok, ce n’est pas libre mais pour des raisons de qualitĂ© et d’habitude des joueurs, on est restĂ© sur cette solution pour l’audio.
Les fruits de l’enregistrement
Grâce Ă ces outils, j’ai rĂ©alisĂ© les enregistrements.
J’avais donc un fichier son et une vidĂ©o par partie. Dans un premier temps, j’ai fusionnĂ© les deux fichiers avec ffmpeg pour obtenir la vidĂ©o de la partie (avec le son).
ffmpeg -i video.mp4 -i audio.wav -c:v copy -c:a aac -strict experimental output.mp4
Améliorer l’expérience visuelle
Souhaitant offrir une meilleure expĂ©rience pour les Ă©ventuels spectateurs, j’ai codĂ© un plugin Ă teamspeak qui envoie sur dbus le statut de la voix de chaque joueur.
J’ai crĂ©e une application qui Ă©coute ces messages dbus, quand le joueur parle, le portrait de son personnage s’affiche en couleur. Quand il est silencieux le portrait du personnage s’affiche en niveau de gris. Il m’a fallu plusieurs tests et Ă©tapes pour arriver Ă ce fonctionnel final.
Les joueurs ne voulant pas montrer leur visage par webcam. Cela semblait la meilleur solution de suivre facilement les conversations.
Vous trouverez le code ici: https://github.com/obiwankennedy/GameVisualisationHelper/tree/cops/display
Cette application a apportĂ© une contrainte supplĂ©mentaire sur les vidĂ©os. Le son et l’image doivent ĂŞtre synchronisĂ©s avec prĂ©cision. Ce n’était pas le cas avant car les Ă©lĂ©ments de l’écran pouvait ĂŞtre en avance ou en retard par rapport Ă la voix, il n’y avait aucun repère visuel pour le remarquer.
Caler le son et l’image
J’ai d’abord pensĂ© merger les deux fichiers dans un Ă©diteur vidĂ©o.
J’ai essayĂ© PitiVi, OpenShot et Kdenlive. Les deux premiers agonisent dans d’atroces souffrances après le chargement de fichiers supĂ©rieurs Ă 3h. Kdenlive s’en sort mieux. Il n’agonise qu’une fois sur deux. J’ai installĂ© les versions de ma distribution et j’ai fait de report de bug mais je pouvais pas attendre la rĂ©solution des problèmes.
Dans ce contexte, trouver le bon timing pour synchroniser l’audio sur l’image, c’est compliquĂ©. Le drag and drop de fichier de 3h fait assez mal aux logiciels d’Ă©dition vidĂ©o. Sans parler de la prĂ©cision pour les dĂ©placements. Bref, pas pratique.
Je me suis dit “c’est idiot, il faudrait synchroniser le dĂ©but de l’enregistrement de l’audio et la vidĂ©o”.
Je n’ai pas le code source de Teamspeak mais il est possible de crĂ©er un plugin (ou de modifier celui que j’ai créé) et j’ai le code source de SimpleScreenRecorder (SSR).
J’ai donc dĂ©cidĂ© d’exposer l’API de SSR sur DBUS et mon plugin teamspeak envoie des commandes dbus. Vive Dbus !
En gros, j’ai Ă©tudiĂ© le code de SSR pour identifier la fonction qui dĂ©marre l’enregistrement. J’ai créé la petite tambouille pour l’exposer (ainsi que la fonction pour mettre l’enregistrement en pause) sur dbus.
Si vous voulez voir comment faire cela: http://renaudguezennec.eu/index.php/2011/03/10/introduction-a-dbus-avec-qt4/
Pour le coup, après quelques essais et des modifications sur l’ensemble des participants Ă l’affaire. J’ai une solution qui tourne bien. Je peux utiliser ffmpeg pour fusionner mes fichiers vidĂ©os avec le son et cela correspond parfaitement.
ffmpeg -i video.mp4 -i audio.wav -c:v copy -c:a aac -strict experimental output.mp4
Une étape d’accomplie
J’ai fait un pull request Ă l’auteur de SSR. Mon but Ă©tait de montrer comment faire car l’auteur de SSR n’est pas formĂ© Ă Dbus. Il est très intĂ©ressĂ© mais clairement je n’ai pas le temps de gĂ©nĂ©raliser l’usage de Dbus dans SSR, ni lui d’ailleurs.
Ma version est accessible ici : https://github.com/obiwankennedy/ssr
Ma pull request : https://github.com/MaartenBaert/ssr/pull/399
Montage des génériques
Après ces Ă©tapes, j’ai des vidĂ©os de mes parties assez brutes. IdĂ©alement, il me reste Ă ajouter un gĂ©nĂ©rique de dĂ©but et de fin.
Pour le faire, j’ai fait un programme en QML avec deux animations qui se courent après. C’est pas jolie mais cela fait le job. Le gĂ©nĂ©rique dure ~10 secondes, je l’ai enregistrĂ© avec SSR aussi.
J’ai utilisĂ© Kdenlive pour caler une musique libre dessus.
A la fin de cette Ă©tape, j’ai ma petite vidĂ©o de gĂ©nĂ©rique de dĂ©but, idem pour le gĂ©nĂ©rique de fin et mes Ă©pisodes (plus de 75).
Vous l’avez compris, l’Ă©tape ici est de crĂ©er des vidĂ©os contenant les gĂ©nĂ©riques.
J’ai cherchĂ© un peu dans ffmpeg pour arriver Ă cela. C’est une simple fonction de concatĂ©nation des vidĂ©os.
J’ai Ă©crit ma petite commande, ça marche.
[pastacode lang=”bash” manual=”cd%20%2Fracine%2Fdes%2Fvideos%2F%0AOPENING%3D%2Fchemin%2Fvers%2Fgenerique%2Fdebut.mp4%0AENDING%3D%2Fchemin%2Fvers%2Fgenerique%2Ffin.mp4%0Avideo%3D%2Fchemin%2Fvers%2Fvideos.mp4%0ALIST_FILE%3D%2Ftmp%2Fmylist.txt%0AvideoExtLess%3D%5C%60echo%20%24video%20%7C%20awk%20-F%20′.’%20’%7Bprint%20%241%7D’%5C%60%0Aecho%20%22file%20’%24OPENING’%22%20%3E%20%24LIST_FILE%0Aecho%20%22file%20’%24video’%22%20%3E%3E%20%24LIST_FILE%0Aecho%20%22file%20’%24ENDING’%22%20%3E%3E%20%24LIST_FILE%0Affmpeg%20-safe%200%20-f%20concat%20-i%20%2Ftmp%2Fmylist.txt%20%24%7BvideoExtLess%7D_avec_generiques.mp4″ message=”Concat avec ffmpeg” highlight=”” provider=”manual”/]
Du moins, je croyais que cela marchait. En vérité, cela cassait la synchronisation son/image. Ce fut très embêtant.
Je retourne Ă la case dĂ©part “logiciel de montage vidĂ©o” (Kdenlive). Il y a un peu moins de manipulation prĂ©cise Ă faire. Je colle les trois fichiers: gĂ©nĂ©rique de dĂ©but, l’épisode, gĂ©nĂ©rique de fin et c’est parti.
Ça a fonctionné un temps.
Extraction du son et traitement
Une fois la vidĂ©o complète avec les gĂ©nĂ©riques. J’en extrait le son pour la diffusion en podcast, vraiment facile avec ffmpeg.
ffmpeg -i videos.mp4 -codec:a libmp3lame -qscale:a 2 output.mp3
Avant de sortir l’Ă©pisode en podcast, je le re-travaille un peu avec audacity pour supprimer les silences et pour normaliser le son (avec le filtre compresseur du logiciel).
Cela raccourcit l’épisode d’environ 30 mins et le son est bien meilleur.
Traitement sur la vidéo
Je souhaite effectuer les mĂŞmes traitements sur les vidĂ©os. J’ai bien luttĂ© pour trouver une solution.
Normalisation
Pour la normalisation, j’ai trouvĂ© un petit script python: ffmpeg-normalize.
ffmpeg-normalize -vu -p normalized-episode40.mp4 Episode_40.mp4
Supprimer les moments inutiles
Couper la vidĂ©o quand il y a du silence fut bien plus complexe. Aucun logiciel de montage vidĂ©o n’offre de filtre pour cela (je n’ai pas trouvĂ© en tout cas) et j’allais pas le faire Ă la main. Cela m’aurait pris trop de temps.
J’ai donc cherchĂ© Ă droite Ă gauche et c’est Ryzz (Merci Ă lui) sur Linuxfr.org qui m’a envoyĂ© vers une bonne piste: MoviePy
Un module python pour faire de l’Ă©dition vidĂ©o. Il y a mĂŞme un exemple utilisant MoviePy pour crĂ©er le rĂ©sumĂ© d’un match de foot grâce au son des supporters.
J’ai donc créé un script python pour couper les silences. J’en ai profitĂ© Ă©galement ajouter les gĂ©nĂ©riques avec MoviePy.
Quand mon script fut prĂŞt j’avais dĂ©jĂ sorti 20 Ă©pisodes. J’en avais donc 40 en stock Ă refaire. J’ai donc lancer le script sur les 40 restant. Après 3 jours d’exĂ©cution. J’avais
tous mes épisodes prêts.
Si vous souhaitez voir le code du script et des explications techniques:
http://renaudguezennec.eu/index.php/2017/03/03/montage-video-en-python/
La réduction des silences est moins efficace qu’audacity mais il y a un gain indéniable.
VoilĂ , le degrĂ©s maximum que j’ai atteins dans l’automatisation.
Aller encore plus loin
Dans tout ce processus, il me manque encore des choses pour vraiment automatiser toute la chaîne.
Le premier point, c’est audacity. Il n’est pas possible d’utiliser audacity en ligne de commande. Je me suis un peu renseignĂ©, il y a eu des tentatives mais c’est très complexe Ă mettre en place.
J’ai regardĂ© un peu le code, espĂ©rant trouver un moyen d’appliquer les deux filtres dont j’ai besoin. Le code est peu lisible avec des define partout pour diffĂ©rencier les OS. Bref, un cauchemar Ă maintenir. Du coup, j’hĂ©site Ă mis mettre vraiment ou rester en Ă©dition manuelle.
Ensuite, il me reste à automatiser la partie “mise en ligne” sur youtube et sur le wordpress.
Je suis certains que c’est possible mais pour l’instant, je n’ai pas pris le temps de le faire.
Si vous voulez voir le résultat:
Le wordpress pour écouter les épisodes: http://blog.rolisteam.org/
La playlist youtube des épisodes : https://www.youtube.com/playlist?list=PLBSt0cCTFfS5fi3v1LtB9sfeA8opY-Ge1
Les premiers n’ont pas bénéficié de tous les outils. Il y a clairement une marque de progression dans les épisodes jusqu’à l’épisode 20 environ.