ClipCatalog logo ClipCatalog
DE

Sie erinnern sich an das Wort. ClipCatalog findet den Moment.

Windows 100 % lokale Videoverarbeitung Kostenlose Testversion · Ohne Zeitlimit

Tippen Sie ein paar Wörter ein, die jemand in einem Ihrer Videos gesagt hat — und der Player springt direkt zu der Sekunde, in der sie fielen. Interviews, Vorträge, Livestreams, Familienvideos: jede Audiospur in Ihrem Archiv wird durchsuchbar wie ein Textdokument.

Transkribiert wird lokal mit Whisper, auf Ihrer eigenen Hardware. Keine Uploads, keine Minutenabrechnung, keine Cloud-Konten — eine einmalige 99-$-Lizenz für unbegrenzte Transkriptionsstunden.

Type a word or phrase into ClipCatalog's transcript filter and jump to the exact moment it was said — searchable speech across your local video library.

Das Problem "Ich weiß, dass jemand das gesagt hat"

Sie erinnern sich an ein Wort, einen Namen oder zwei markante Wörter aus einem Zitat — aber nicht an die Datei. Ohne durchsuchbare Transkripte bleibt nur das manuelle Scrubben. Mit ClipCatalog tippen Sie ein, was Sie noch wissen, und die passenden Clips erscheinen in Sekunden.

Ohne Transkriptsuche

  • Sie erinnern sich, dass jemand etwas Wichtiges gesagt hat, aber nicht an die Datei
  • Stundenlanges Durchscrubben, um ein einziges Zitat zu finden
  • Cloud-Transkriptionsdienste rechnen pro Minute ab und verlangen Uploads

Mit ClipCatalog

  • Wort eingeben und jedes Video erhalten, das es enthält, mit dem genauen Zeitstempel
  • Auf ein Ergebnis klicken, direkt zur Sekunde springen, in der die Worte fielen
  • Die Transkription läuft im Hintergrund, während Sie arbeiten — keine Uploads, kein Warten

So funktioniert die Suche nach gesprochenen Worten im Video

Damit sich die Sprachsuche wie Strg+F über die ganze Videobibliothek anfühlt, müssen drei Dinge stimmen: präzise Transkription, bibliotheksweite Indizierung und ein schneller Pfad zurück zum exakten Moment. ClipCatalog erledigt alle drei lokal.

Transkriptsuche →
1

Auf einen Ordner zeigen

Fügen Sie einen oder mehrere Ordner hinzu. ClipCatalog sucht Videodateien und reiht jede für die lokale Transkription ein. Ihre Ordnerstruktur bleibt unangetastet.

2

Lokales Whisper erledigt die Arbeit

ClipCatalog liefert whisper.cpp mit und führt es auf Ihrer Hardware aus — Vulkan-GPU, falls verfügbar, sonst CPU. Nichts wird hochgeladen.

3

Per Sprache suchen

Öffnen Sie den Transkriptfilter, tippen Sie ein Wort wie Abschluss, oder kombinieren Sie Abschluss + Dank und verlangen Sie beide Wörter für eine engere Trefferliste. Per Klick direkt zum Moment, in dem diese Worte fielen.

Beispielsuchen, die plötzlich leicht werden

Sobald Ihre Bibliothek indiziert ist, ist das Finden eines bestimmten Moments so schnell wie das Tippen eines einzigen Wortes. Der Transkriptsuche-Filter übernimmt die Wortebenen-Suche; kombinieren Sie mehrere Wörter und verlangen Sie, dass alle vorkommen, um einzugrenzen — oder lassen Sie eines genügen, um zu erweitern.

Folie — jedes Mal, wenn das Wort in Ihren Tutorial-Aufzeichnungen fällt (Einzelwort-Suche)
Frage + Antwort — jede Fragerunde in einer Vorlesungsreihe (beide Wörter müssen vorkommen)
Rezept + Apfel — Omas mündliche Geschichte, genau die, in der sie das Apfelkuchen-Rezept verraten hat (beide Wörter müssen vorkommen)
Einspruch — jeder Clip einer Vernehmung, in dem die Gegenseite Einspruch erhoben hat (Einzelwort-Suche)
genehmigt ODER abgelehnt — jeder Entscheidungsmoment im Meeting-Archiv (eines der Wörter genügt)
Interview (Tag) + Budget (Transkript) — alle als Interview markierten Clips, in denen über Budget gesprochen wird

Wer durchsucht Video nach gesprochenen Worten?

Alle, die einen Bestand gesprochener Aufnahmen haben, der nie indiziert wurde. Ein paar konkrete Profile:

Journalist:innen mit Interview-Archiven

Achtzig Stunden Originalinterviews aus drei Jahren. ClipCatalog transkribiert sie lokal; suchen Sie nach einem halb erinnerten Zitat und springen Sie direkt hin. Das Quellmaterial verlässt den Laptop nicht.

Podcaster:innen mit Video-Episoden

Jede Erwähnung eines Konkurrenten, jeder Rückbezug auf eine frühere Folge, jeder Witz, den Sie als Short wiederverwenden könnten. Alle Folgen auf einmal durchsuchen.

Dozent:innen und Kursanbieter:innen

Wenn Studierende fragen "Wo haben Sie X behandelt?", antworten Sie mit einem Zeitstempel statt mit "irgendwo in Woche 4".

Rechtsteams mit Vernehmungsaufzeichnungen

Vernehmungen nach exakter Formulierung durchsuchen — die Aufnahmen verlassen die Kanzleirechner nicht, sodass Mandantenmaterial keinen Drittanbieter berührt.

Dokumentarfilmer:innen

Drei Jahre Interview-B-Roll nach jedem Clip durchforsten, in dem eine bestimmte Person, ein Ort oder ein Thema vorkommt — ohne Minutenpreise oder Cloud-Wartezeiten.

Familienhistoriker:innen

Ältere Verwandte haben Geschichten erzählt, die Sie nur lückenhaft notiert haben. Im Video steht die wahre Version. Finden Sie "als Opa über das Boot erzählte", ohne vierzig Stunden anzuschauen.

Was Sie von Sprachsuche im Video erwarten können

Die Transkriptions-Pipeline in ClipCatalog ist praxisnah und ehrlich gestaltet. Das gilt schon, bevor Sie loslegen.

Mehrsprachige Transkription

Whisper beherrscht Dutzende Sprachen, die pro Clip automatisch erkannt werden — keine manuelle Konfiguration. Die vollständige Liste der unterstützten Sprachen finden Sie in den FAQ unten.

Windows 10/11, GPU optional

ClipCatalog läuft auf Windows 10 und 11. Eine leistungsfähige GPU macht die Transkription schnell; reine CPU-Nutzung ist langsamer, funktioniert aber trotzdem. So oder so ist es ein einmaliger Aufwand — sobald das Archiv indiziert ist, liefern Suchen sofortige Ergebnisse.

Suchbar, auch wenn Laufwerke abgezogen sind

Sobald ein Ordner indiziert ist, bleiben die Transkripte auf Ihrem PC. Sie können Clips auf externen Laufwerken auch dann durchsuchen, wenn das Laufwerk getrennt ist — wieder anschließen müssen Sie nur zum Abspielen.

Export als SRT oder TXT

Übernehmen Sie ein fertiges Transkript als SRT-Untertitel in Ihren Editor oder exportieren Sie als reinen Text, um es zusammen mit dem Clip zu veröffentlichen.

Warum Local-First für gesprochene Inhalte zählt

Sprachaufnahmen gehören zu den sensibelsten Inhalten auf einer Festplatte. Interviews unter Sperrfrist. Vernehmungen. Therapiegespräche. Familiengeschichten. Ein Transkriptionsdienst, der sie hochlädt, verlangt Vertrauen in seine Infrastruktur — und dauerhaftes Vertrauen, sobald er die Daten hat.

ClipCatalog führt Whisper auf Ihrer Hardware aus. Das Video bleibt auf der Festplatte. Das Transkript bleibt in einer lokalen SQLite-Datenbank auf Ihrem Rechner. Nichts verlässt das System, bis Sie es teilen.

Wenn Sie Local-First-Videowerkzeuge direkt vergleichen wollen, sehen Sie sich den Privacy-First-Video-Management-Roundup an, in dem ClipCatalog bei Offline-Transkription und bibliotheksweiter Suche eingeordnet wird.

Videos nach gesprochenen Worten durchsuchen — FAQ

Lädt das meine Videos irgendwohin hoch?

Nein. Die Transkription läuft komplett auf Ihrem Rechner mit einem mitgelieferten lokalen Whisper-Modell. Sobald das Modell beim ersten Start heruntergeladen ist, wird keine Netzwerkverbindung mehr benötigt.

Welche Sprachen werden unterstützt?

Dutzende — Englisch, Deutsch, Französisch, Spanisch, Portugiesisch, Russisch, Arabisch, Japanisch, Koreanisch, Mandarin und viele mehr. ClipCatalog erkennt die gesprochene Sprache automatisch pro Clip — keine manuelle Konfiguration nötig.

Wie genau ist das im Vergleich zu Otter, Rev oder Trint?

ClipCatalog verwendet Whisper — dieselbe Modellfamilie, auf der mehrere kommerzielle Dienste aufbauen — konkret das Modell large-v3-turbo, derzeit der Genauigkeits-/Geschwindigkeits-Sweet-Spot der Whisper-Reihe. Die Genauigkeit ist mit kommerziellen Cloud-Diensten vergleichbar, die dieselbe Modellfamilie betreiben.

Kann ich mehrere Videos auf einmal durchsuchen?

Ja — genau darum geht es. Cloud-Transkriptionstools arbeiten meist Datei für Datei. ClipCatalog indiziert Ordner und lässt Sie die ganze Bibliothek auf einmal abfragen.

Funktioniert das auf externen Laufwerken?

Ja. Laufwerke werden nachverfolgt; Sie können Transkripte auch dann durchsuchen, wenn das Laufwerk getrennt ist. Treffer werden als nicht verfügbar angezeigt, bis Sie das Laufwerk wieder anschließen.

Wie schnell ist die Transkription?

ClipCatalog enthält genau ein Whisper-Modell (large-v3-turbo) — die Geschwindigkeit hängt von Ihrer Hardware ab. Auf einer modernen GPU läuft die Transkription typischerweise um ein Vielfaches schneller als Echtzeit.

Kann ich Transkripte als Untertitel exportieren?

Ja — jedes Transkript lässt sich pro Video als SRT-Untertitel oder reinen Text exportieren. Direkt in den Editor ziehen oder neben dem Clip veröffentlichen.

Beinhaltet die kostenlose Testversion die Transkription?

Ja — bis zu 500 Videos und insgesamt 10 Stunden, mit vollem Zugriff auf alle Funktionen inklusive Transkriptsuche und Gesichtserkennung. Kein Konto und keine Kreditkarte nötig.

Was ist mit Videos, deren Audio schlecht ist?

Whisper kommt mit Hintergrundgeräuschen und Akzenten besser zurecht als ältere Sprach-zu-Text-Systeme, ist aber kein Zauber. Stark verzerrtes oder sehr leises Audio liefert weniger genaue Transkripte.

Funktioniert es auf Mac oder Linux?

ClipCatalog ist derzeit nur für Windows verfügbar (Windows 10 und 11). Mac- und Linux-Unterstützung steht kurzfristig nicht auf der Roadmap.

Relevante Vergleiche

Wenn Sie diesen Workflow mit anderen Tools vergleichen, starten Sie mit diesen direkten Gegenüberstellungen.

Probieren Sie ClipCatalog kostenlos aus – bis zu 500 Videos

Kein Konto erforderlich. Ihre Aufnahmen bleiben auf Ihrem Computer.

500 Videos kostenlos Keine Kreditkarte · kein Konto 100 % lokal – Aufnahmen verlassen niemals Ihren PC