Nettoyer les pistes audio avec misst: séparer facilement les tiges sous Linux

Publié par TheJoe sur

Temps de lecture estimé: 3 minutes

J'ai récemment assisté à un événement en direct organisé par Rockin'1000: un concert sur route avec un groupe de onze personnes. Aucune preuve, pas de clic dans les écouteurs, pas de filet de sécurité. Pour nous préparer, l'organisation nous a fourni tout ce dont nous avions besoin: les douze titres de la setlist complète avec partitions, onglets, tutoriels vidéo pour les deux guitares (droite et gauche) et de cliquez sur la piste avec des invites vocales ("verset", "pont", "chœur", etc.) conçu pour éviter les erreurs lors de l'étude individuelle.

Le problème? Je n'aurais eu aucune indication en personne, donc j'ai dû m'entraîner sur les pistes “faire le ménage”, avec juste les sons de base: ces invites vocales n'ont pas pu être utilisées.
Et ici, ça entre en jeu perdu, un logiciel open source qui permet la séparation des tiges à l'aide de modèles d'IA modernes, dont ceux de Meta.

Dans cet article, nous voyons ce que c'est, comment ça marche, comment l'installer et comment je l'ai utilisé pour obtenir des pistes de clics parfaites pour le live.

Qu'est-ce qui ne va pas?

perdu est une application open source pour séparer les pistes audio (« séparation des tiges »).
Son but est simple: prendre un fichier audio stéréo et le diviser en composants isolés, venir:

  • voix,
  • batterie,
  • basse,
  • d'autres outils,
  • percussion,
  • divers accompagnements.

C'est censé être facile, léger, multiplateforme et avec interface graphique, sans avoir à naviguer dans des modèles compliqués ou des dépendances difficiles à gérer.

Grâce aux modèles open source développés par la communauté et — dans certaines versions — aux modèles publiés par Meta, misst parvient à extraire les voix avec une précision surprenante, souvent comparable aux outils professionnels.

Comment installer Misst sur Linux

Contrairement à de nombreux logiciels audio modernes, misst n'est pas disponible via Flatpak ni en tant qu'AppImage ou package précompilé pour Linux. La distribution officielle fournit des installateurs pour Windows uniquement, alors que sous Linux, la seule méthode prise en charge est installation manuelle à partir des sources en utilisant Python et un environnement virtuel (venv).

Exigences

  • Python 3.9 ou supérieur
  • FFmpeg installé sur votre système
  • Git
  • en option: CUDA + GPU NVIDIA pour accélérer la séparation des tiges

Installation étape par étape

Ouvrez un terminal et suivez ces étapes:

# 1. Clona il repository ufficiale
git clone https://github.com/Frikallo/MISST.git
cd MISST

# 2. Crea un ambiente virtuale Python
python3 -m venv venv

# 3. Attiva l'ambiente virtuale
source venv/bin/activate

# 4. Installa le dipendenze
# Per GPU (CUDA): requirements.txt
# Per CPU-only: requirements-minimal.txt

pip install -r requirements-minimal.txt

# 5. Avvia l'applicazione GUI
python3 MISSTapp.py

Remarques importantes

  • Si vous souhaitez profiter du GPU, assurez-vous d'avoir une version CUDA compatible avant d'installer les dépendances complètes.
  • Installation loin pip ça peut prendre du temps, surtout sur les systèmes sans accélération GPU.
  • L'application s'exécutera directement à partir du référentiel cloné: il n'est pas installé à l'échelle du système.

Comment j'ai utilisé Misst pour le projet Rockin'1000

Les pistes click que j'ai reçues étaient parfaites pour étudier en préparation d'un concert avec le click in earphone, mais pour le mien il y avait un gros problème: ils comptaient oralement les sections de la chanson.

« Verset… deux… trois… quatre… »
"Pont!"
"Guitare gauche, chœur!"

Idéal pour éviter les erreurs à la maison, terrible pour s'entraîner en prévision d'un concert sans cliquer sur ses écouteurs.

Regardez ici:  "Niveler" le volume de notre bibliothèque MP3 avec MP3Gain

Objectif

Obtenez un suivi de clic « neutre », composé uniquement de:

  • métronome,
  • tout accent ou indication rythmique non vocale.

Procédure avec misst

  1. J'importe la piste de clic en mesures.

    Je télécharge le fichier WAV/MP3 exactement comme fourni par Rockin'1000.
  2. Je sélectionne le modèle Voix/Autre.

    C'est idéal lorsque l'on souhaite isoler précisément les parties vocales.
  3. je fais la séparation.

    Après quelques secondes (ou quelques minutes, Cela dépend du processeur) j'ai deux fichiers:
    • voix.wav – tout ce que le logiciel considère comme de la voix,
    • no_voice.wav – tout le reste.
  4. je vérifie le résultat.

    Dans la plupart des cas, la voix avec les commandes ("verset", "pont") se termine correctement par le radical de la voyelle.
  5. J'exporte uniquement la piste "instrumentale".

    Celui sans voix devient ma nouvelle piste de clic « propre ».
  6. (en option) Je règle le volume ou je recrée quelques accents avec Audacity.

Le résultat fut impeccable: cliquez sur la piste pulite, pas de commandes vocales, pas d'artefacts évidents, parfait pour étudier comme si vous étiez en direct.

Ce qu'il fait et ce qu'il ne fait pas

Qu'est-ce qui est bon pour toi

  • Excellente séparation vocale pour les pistes de clic, karaoké, pistes de répétition.
  • Interface simple et claire même pour les personnes non techniques.
  • Disponible en Flatpak → installation immédiate.
  • Open source: tu peux l'étudier, modifiez-le, contribuer.
  • Fonctionne hors ligne: pas de téléchargement vers les services cloud.

Ce que ça ne fait pas

  • Ce n'est pas un éditeur audio: pas de coupures, effets, normalisation.
  • ça ne fait pas de miracle: certaines voix résiduelles peuvent subsister si elles se chevauchent avec des instruments occupant des fréquences similaires.
  • Il n'est pas destiné aux productions professionnelles extrêmes (mais pour un usage quotidien c'est suffisant).
  • Il ne remplace pas les logiciels plus "scientifiques" comme Demucs en ligne de commande, si vous avez besoin de la qualité maximale absolue.

Conclusions

Si tu joues, remix, produire ou travailler avec des pistes à éditer, misst est l'un des meilleurs outils open source disponibles pour Linux aujourd'hui.
C'est léger, facile, gratuit et permet à n'importe qui de faire de la séparation vocale sans devenir un expert en modèles d'IA.

Dans mon cas précis – préparer un concert Rockin'1000 live sans pistes de clics vocaux – c'était l'outil parfait, rapide et efficace.

Vaut vraiment une place dans votre boîte à outils musicale.


TheJoe

Je garde ce blog comme un hobby par 2009. Je suis passionné de graphisme, la technologie, logiciel Open Source. Parmi mes articles ne sera pas difficile de trouver de la musique, et quelques réflexions personnelles, mais je préfère la ligne directe du blog principalement à la technologie. Pour plus d'informations me contacter.

0 commentaires

Laisser un commentaire

Espace réservé d'avatar

Votre adresse email ne sera pas publiée. les champs requis sont indiqués *

Ce site utilise Akismet pour réduire le spam. Découvrez comment vos données de commentaire est traité.