Meta präsentiert SAM Audio: KI trennt Klänge intuitiv und multimodal

MarkTechPost Original ≈1 Min. Lesezeit
Anzeige

Meta AI hat SAM Audio veröffentlicht, ein KI-Modell, das mit intuitiven und multimodalen Eingabeaufforderungen einzelne Klänge aus realen Mischungen trennt. Es löst ein häufiges Problem in der Audiobearbeitung, indem es die Notwendigkeit eliminiert, für jede Klangklasse ein eigenes Modell zu trainieren.

Das System ist in drei Größen erhältlich – sam-audio-small, sam-audio-base und sam-audio-large – sodass Anwender je nach Leistungsbedarf und Rechenressourcen wählen können. Alle Versionen sind als Open-Source-Download verfügbar und lassen sich direkt im Segment Anything-Framework ausprobieren.

Mit SAM Audio eröffnet Meta einen neuen Standard für die Audio-Trennung, der sowohl für professionelle Studios als auch für Hobbyisten zugänglich ist. Die Kombination aus benutzerfreundlichen Prompts und leistungsstarker Modellarchitektur macht das Tool zu einem vielversprechenden Werkzeug für die Zukunft der Klangbearbeitung.

Ähnliche Artikel