Audiospuren mit Misst bereinigen: Trennen Sie Stems unter Linux problemlos

Veröffentlicht von TheJoe am

Geschätzte Lesezeit: 3 Minuten

Ich habe kürzlich an einer Live-Veranstaltung teilgenommen, die von organisiert wurde Rockin’1000: ein Roadkonzert mit einer elfköpfigen Band. Keine Beweise, Kein Klicken im Kopfhörer, kein Sicherheitsnetz. Um uns vorzubereiten, Die Organisation versorgte uns mit allem, was wir brauchten: die zwölf Tracks der Setlist komplett mit Partituren, Registerkarten, Video-Tutorials für beide Gitarren (rechts und links) und von Klicken Sie auf den Track mit Sprachansagen ("Vers", "Brücke", "Chor", usw..) Entwickelt, um Fehler beim individuellen Lernen zu vermeiden.

Das Problem? Persönlich hätte ich keine Hinweise gehabt, Also musste ich die Strecken üben “sauber”, mit nur den Grundgeräuschen: Diese Sprachansagen konnten nicht verwendet werden.
Und hier kommt es ins Spiel verloren, eine Open-Source-Software, die die Stammtrennung mithilfe moderner KI-Modelle ermöglicht, einschließlich derer von Meta.

In diesem Artikel sehen wir, was es ist, wie es funktioniert, wie man es installiert und wie ich damit perfekte Click-Tracks für Live-Aufnahmen bekomme.

Was ist los??

verloren ist eine Open-Source-Anwendung zum Trennen von Audiospuren („Stammtrennung“).
Sein Zweck ist einfach: Nehmen Sie eine Stereo-Audiodatei und teilen Sie sie in isolierte Komponenten auf, kommen:

  • Stimme,
  • Schlagzeug,
  • Bass,
  • andere Werkzeuge,
  • Schlagzeug,
  • verschiedene Begleitungen.

Es soll so sein leicht, Licht, Multiplattform und mit grafischer Oberfläche, ohne durch komplizierte Modelle oder schwer zu verwaltende Abhängigkeiten navigieren zu müssen.

Dank der von der Community entwickelten Open-Source-Modelle und – in einigen Versionen – der von Meta veröffentlichten Modelle, misst schafft es, Stimmen überraschend genau zu extrahieren, oft vergleichbar mit professionellen Werkzeugen.

So installieren Sie misst unter Linux

Im Gegensatz zu vielen modernen Audioprogrammen, misst ist nicht über Flatpak verfügbar noch als AppImage oder vorkompiliertes Paket für Linux. Die offizielle Distribution stellt Installationsprogramme nur für Windows bereit, während unter Linux die einzige unterstützte Methode ist manuelle Installation aus Quellen mit Python und einer virtuellen Umgebung (venv).

Anforderungen

  • Python 3.9 oder höher
  • FFmpeg auf Ihrem System installiert
  • Git
  • fakultativ: CUDA + NVIDIA-GPU zur Beschleunigung der Stammtrennung

Schritt-für-Schritt-Installation

Öffnen Sie ein Terminal und befolgen Sie diese Schritte:

# 1. Clona il repository ufficiale
git clone https://github.com/Frikallo/MISST.git
cd MISST

# 2. Crea un ambiente virtuale Python
python3 -m venv venv

# 3. Attiva l'ambiente virtuale
source venv/bin/activate

# 4. Installa le dipendenze
# Per GPU (CUDA): requirements.txt
# Per CPU-only: requirements-minimal.txt

pip install -r requirements-minimal.txt

# 5. Avvia l'applicazione GUI
python3 MISSTapp.py

Wichtige Hinweise

  • Wenn Sie die GPU nutzen möchten, Stellen Sie sicher, dass Sie über eine kompatible CUDA-Version verfügen, bevor Sie die vollständigen Abhängigkeiten installieren.
  • Installation weg pip es kann einige Zeit dauern, insbesondere auf Systemen ohne GPU-Beschleunigung.
  • Die App wird direkt vom geklonten Repository ausgeführt: Es wird nicht systemweit installiert.

Wie ich misst für das Rockin'1000-Projekt verwendet habe

Die Click-Tracks, die ich erhalten habe, waren perfekt zum Einstudieren in Vorbereitung auf ein Konzert mit den Click-in-Kopfhörern, aber für mich gab es ein großes Problem: Sie zählten die Abschnitte des Liedes mündlich.

„Vers… zwei… drei… vier…“
"Brücke!"
„Gitarre links, Chor!"

Ideal, um Fehler zu Hause zu vermeiden, schrecklich für das Üben in Erwartung eines Live-Auftritts, ohne auf Kopfhörer zu klicken.

Schau hier:  FocusWriter: ein Text-Editor, für diejenigen, die zu abgelenkt werden

Objektiv

Holen Sie sich eine „neutrale“ Klickspur, nur bestehend aus:

  • Metronom,
  • etwaige Akzente oder nicht-stimmliche rhythmische Hinweise.

Vorgehensweise mit misst

  1. Ich importiere die Klickspur in misst.

    Ich lade die WAV/MP3-Datei genau so hoch, wie sie von Rockin'1000 bereitgestellt wurde.
  2. Ich wähle das Modell „Sprache/Andere“..

    Es ist ideal, wenn Sie Gesangsteile präzise isolieren möchten.
  3. Ich mache die Trennung.

    Nach ein paar Sekunden (oder ein paar Minuten, Es hängt von der CPU ab) Ich habe zwei Dateien:
    • Stimme.wav – alles, was die Software als Stimme betrachtet,
    • no_voice.wav – alles andere.
  4. Ich überprüfe das Ergebnis.

    In den meisten Fällen die Stimme mit Befehlen ("Vers", "Brücke") endet korrekt im Vokalstamm.
  5. Ich exportiere nur die „Instrumental“-Spur.

    Der ohne Stimme wird zu meinem neuen „sauberen“ Click-Track.
  6. (fakultativ) Ich stelle die Lautstärke ein oder ich erstelle einige Akzente mit Audacity.

Das Ergebnis war einwandfrei: Klicken Sie auf Track Pulite, keine Sprachbefehle, keine offensichtlichen Artefakte, Perfekt zum Lernen, als ob Sie live wären.

Was es tut und was nicht

Was ist gut für dich?

  • Hervorragende Stimmtrennung für Click-Tracks, Karaoke, Probestücke.
  • Einfache und klare Benutzeroberfläche auch für technisch nicht versierte Personen.
  • Erhältlich als Flatpak → sofortige Installation.
  • Open-Source-: du kannst es studieren, modifizieren Sie es, beitragen.
  • Funktioniert offline: Kein Hochladen in Cloud-Dienste.

Was es nicht tut

  • Es ist kein Audio-Editor: keine Schnitte, Auswirkungen, Normalisierung.
  • Es wirkt keine Wunder: Bei Überlappung mit Instrumenten, die ähnliche Frequenzen belegen, können einige Reststimmen verbleiben.
  • Es ist nicht für extrem professionelle Produktionen gedacht (aber für den täglichen Gebrauch reicht das).
  • Es ersetzt keine eher „wissenschaftliche“ Software wie Demucs über die Befehlszeile, wenn Sie absolute Höchstqualität benötigen.

Schlussfolgerungen

Wenn du spielst, remixi, Sie können Titel produzieren oder mit ihnen arbeiten, um sie zu bearbeiten, misst ist eines der besten Open-Source-Tools, die heute für Linux verfügbar sind.
Es ist hell, leicht, ist kostenlos und ermöglicht jedem die Stimmtrennung, ohne ein Experte für KI-Modelle zu werden.

In meinem speziellen Fall – der Vorbereitung eines Live-Rockin'1000-Konzerts ohne Gesangs-Click-Tracks – war es das perfekte Werkzeug, schnell und effektiv.

Auf jeden Fall einen Platz in Ihrem musikalischen Werkzeugkasten wert.


TheJoe

Ich halte diesen Blog als ein Hobby von 2009. Ich bin begeistert von Grafik, Technologie, Open Source Software. Unter meinen Artikel wird nicht schwierig sein, über die Musik finden, und einige persönliche Reflexionen, aber ich bevorzuge die direkte Linie des Blogs vor allem auf Technologie. Weitere Informationen Kontaktieren Sie mich.

0 Kommentare

Hinterlasse eine Antwort

Avatar-Platzhalter

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre, wie deine Kommentardaten verarbeitet werden.