Vous vous souvenez du mot. ClipCatalog retrouve l'instant.
Tapez quelques mots prononcés par quelqu'un dans l'une de vos vidéos — et le lecteur saute directement à la seconde où ils ont été dits. Entretiens, conférences, lives, vidéos de famille : chaque piste audio de votre archive devient consultable comme un document texte.
La transcription tourne en local avec Whisper, sur votre propre machine. Aucun téléversement, aucun tarif à la minute, aucun compte cloud — une seule licence à 99 $ pour un nombre illimité d'heures de transcription.
Le problème du « je sais que quelqu'un l'a dit »
Vous vous souvenez d'un mot, d'un nom, ou de quelques mots distinctifs d'une citation — mais pas du fichier. Sans transcriptions consultables, il faut visionner manuellement. Avec ClipCatalog, vous tapez ce dont vous vous souvenez et les clips correspondants apparaissent en quelques secondes.
Sans recherche dans les transcriptions
- Vous savez que quelqu'un a dit quelque chose d'important, mais pas dans quel fichier
- Visionner des heures de rushs pour retrouver une seule citation
- Les services cloud de transcription facturent à la minute et exigent un upload
Avec ClipCatalog
- Tapez le mot et obtenez chaque vidéo qui le contient, avec l'horodatage exact
- Cliquez sur un résultat, sautez directement à la seconde où les mots ont été dits
- La transcription tourne en arrière-plan pendant que vous travaillez — sans upload, sans attente
Comment fonctionne la recherche dans les vidéos par mots prononcés
Trois conditions doivent être réunies pour que la recherche dans la parole ressemble à Ctrl+F sur toute la vidéothèque : transcription précise, indexation à l'échelle de la bibliothèque et chemin rapide vers le moment exact. ClipCatalog assure les trois en local.
Recherche dans les transcriptions →Pointez vers un dossier
Ajoutez un dossier ou plusieurs. ClipCatalog repère les fichiers vidéo et met chacun en file pour une transcription locale. Votre arborescence reste intacte.
Whisper en local fait le travail
ClipCatalog embarque whisper.cpp et l'exécute sur votre matériel — GPU Vulkan si disponible, repli CPU sinon. Rien n'est envoyé en ligne.
Cherchez par la parole
Ouvrez le filtre transcription, tapez un mot comme conclusion, ou combinez conclusion + remerciements en exigeant les deux mots pour affiner. Cliquez sur un résultat pour sauter directement au moment où ces mots ont été prononcés.
Des recherches d'exemple qui deviennent simples
Une fois votre vidéothèque indexée, retrouver un moment précis est aussi rapide que taper un mot. Le filtre de recherche dans les transcriptions fait la recherche au niveau du mot ; combinez plusieurs mots en exigeant qu'ils apparaissent tous pour affiner, ou qu'un seul suffise pour élargir.
Qui cherche dans la vidéo par mots prononcés ?
Toute personne disposant d'un catalogue d'enregistrements parlés qui n'a jamais été indexé. Quelques cas concrets :
Journalistes avec des archives d'interviews
Quatre-vingts heures d'interviews sources sur trois ans. ClipCatalog les transcrit en local ; cherchez une citation à moitié retenue et sautez à l'instant exact. Les sources ne quittent jamais le portable.
Podcasteurs avec des épisodes vidéo
Chaque fois qu'un invité a mentionné un concurrent, chaque rappel à un épisode précédent, chaque blague que vous pourriez réutiliser en short. Cherchez dans tous les épisodes d'un coup.
Enseignants et créateurs de cours
Quand un étudiant demande « où avez-vous abordé X ? », répondez avec un horodatage plutôt qu'avec « quelque part en semaine 4 ».
Équipes juridiques avec des enregistrements de dépositions
Recherchez dans les dépositions par expression exacte — les enregistrements ne quittent jamais les machines du cabinet, donc le matériel client ne passe par aucun service de transcription tiers.
Documentaristes
Passez au peigne fin trois ans de rushs d'interviews pour trouver chaque clip mentionnant une personne, un lieu ou un thème — sans facture à la minute ni aller-retour cloud.
Historiens de la famille
Vos aînés vous ont raconté des histoires que vous avez mal notées. La vidéo en a la vraie version. Retrouvez « quand grand-père a parlé du bateau » sans regarder quarante heures.
À quoi s'attendre avec la recherche vidéo par la parole
Le pipeline de transcription de ClipCatalog se veut concret et honnête. Voici ce qui est vrai avant même de commencer.
Transcription multilingue
Whisper gère des dizaines de langues, détectées automatiquement par clip — aucune configuration manuelle. Consultez la FAQ ci-dessous pour la liste complète des langues prises en charge.
Windows 10/11, GPU en option
ClipCatalog fonctionne sur Windows 10 et 11. Un GPU performant accélère la transcription ; le mode CPU seul est plus lent mais reste fonctionnel. Dans tous les cas, c'est un coût unique — une fois votre archive indexée, les recherches sont instantanées.
Cherchez même quand les disques sont débranchés
Une fois un dossier indexé, les transcriptions restent sur votre PC. Vous pouvez chercher des clips sur des disques externes même débranchés — il suffit de rebrancher pour lire le fichier.
Export en SRT ou TXT
Glissez une transcription terminée dans votre logiciel de montage sous forme de sous-titres SRT, ou exportez en texte brut pour la publier avec la vidéo.
Pourquoi le local-first compte pour la parole enregistrée
Les enregistrements de parole figurent parmi les contenus les plus sensibles d'un disque. Entretiens sous embargo. Dépositions. Séances de thérapie. Récits de famille. Un service de transcription qui les téléverse vous demande de faire confiance à son infrastructure — et de continuer à lui faire confiance une fois qu'il a les données.
ClipCatalog fait tourner Whisper sur votre matériel. La vidéo reste sur le disque. La transcription reste dans une base SQLite locale sur votre machine. Rien ne sort tant que vous ne décidez pas de partager.
Si vous comparez les outils vidéo local-first côte à côte, consultez le comparatif privacy-first des gestionnaires vidéo pour voir où se situe ClipCatalog sur la transcription hors ligne et la recherche à l'échelle de la bibliothèque.
Recherche vidéo par mots prononcés — FAQ
Cela téléverse-t-il mes vidéos quelque part ?
Non. La transcription tourne entièrement sur votre machine avec un modèle Whisper local fourni. Une fois le modèle téléchargé au premier lancement, plus besoin de réseau.
Quelles langues sont prises en charge ?
Des dizaines — anglais, allemand, français, espagnol, portugais, russe, arabe, japonais, coréen, mandarin, et bien d'autres. ClipCatalog détecte automatiquement la langue parlée pour chaque clip — aucune configuration manuelle requise.
Quelle est la précision par rapport à Otter, Rev ou Trint ?
ClipCatalog utilise Whisper — la même famille de modèles sur laquelle reposent plusieurs services commerciaux — plus précisément le modèle large-v3-turbo, qui est actuellement le meilleur compromis précision/vitesse de la gamme Whisper. La précision est comparable à celle des services cloud commerciaux qui utilisent la même famille de modèles.
Puis-je rechercher dans plusieurs vidéos d'un coup ?
Oui — c'est tout l'intérêt. Les outils de transcription cloud fonctionnent généralement fichier par fichier. ClipCatalog indexe des dossiers et vous permet d'interroger toute la vidéothèque en une seule fois.
Cela fonctionne-t-il sur disques externes ?
Oui. Les disques sont suivis ; vous pouvez chercher dans les transcriptions même quand un disque est débranché. Les résultats s'affichent comme indisponibles jusqu'au rebranchement.
Quelle est la vitesse de la transcription ?
ClipCatalog embarque un seul modèle Whisper (large-v3-turbo) — la vitesse dépend de votre matériel. Sur un GPU moderne, la transcription tourne généralement à plusieurs fois la vitesse du temps réel.
Puis-je exporter les transcriptions en sous-titres ?
Oui — chaque transcription peut être exportée en sous-titres SRT ou en texte brut, vidéo par vidéo. Glissez-les dans votre logiciel ou publiez-les avec le clip.
L'essai gratuit inclut-il la transcription ?
Oui — jusqu'à 500 vidéos et 10 heures au total, avec un accès complet à toutes les fonctionnalités, y compris la recherche dans les transcriptions et la reconnaissance faciale. Aucun compte ni carte bancaire requis.
Et les vidéos avec un audio médiocre ?
Whisper gère mieux le bruit de fond et les accents que les anciens systèmes de speech-to-text, mais ce n'est pas magique. Un audio très distordu ou très faible donne des transcriptions moins fidèles.
Fonctionne-t-il sur Mac ou Linux ?
ClipCatalog est actuellement disponible uniquement sur Windows (10 et 11). Le support Mac et Linux n'est pas prévu à court terme.
Combinez la recherche dans les transcriptions avec tout le reste
La recherche par la parole est la plus puissante quand on l'empile sur d'autres filtres. Chaque couche réduit la liste de résultats pour éviter le tri manuel des faux positifs.
Recherche dans les transcriptions
La fonctionnalité de recherche dans les transcriptions en détail : syntaxe des filtres, matching Tous/N'importe quel, filtre de taux de parole, options d'export.
Trouver une personne dans une vidéo
Combinez la recherche dans les transcriptions avec la recherche par visage — chaque clip où une personne précise a dit quelque chose de précis.
Contenu détecté
Empilez la recherche dans les transcriptions sur les scènes et objets détectés — trouvez les clips où quelqu'un parle de quelque chose pendant que c'est à l'écran.
Disques durs externes
La recherche par la parole fonctionne sur les disques externes. Les transcriptions restent consultables même quand le disque est débranché.
Comparaisons pertinentes
Si vous comparez ce flux de travail à d'autres outils, commencez par ces pages comparatives.
Guides connexes centrés sur le problème
Rechercher dans une vidéothèque de plusieurs To
Quand l'index de transcription vit dans une archive de plusieurs To, l'empilement de filtres et les préréglages enregistrés deviennent le vrai levier. Le guide compagnon pour la recherche à grande échelle.
Trouver les B-rolls par contenu visuel
Quand ce dont vous vous souvenez n'est pas une citation, passez de la transcription aux tags visuels — générés automatiquement, sur toute la vidéothèque, sans étiquetage manuel.
Organiser vos rushes sur disques et NAS
Les transcriptions ne servent vraiment que lorsque le catalogue couvre tous vos disques — le guide compagnon pour unifier la couche de stockage.
Retrouver une personne dans votre vidéothèque
Recherche par visage à travers dossiers, disques et années de rushs — le pendant de la recherche par la parole.
Parcourir tous les cas d'usage ClipCatalog
Guides centrés sur le problème et workflows par profil pour retrouver ce qui compte dans votre vidéothèque locale.
Essayez ClipCatalog gratuitement — jusqu'à 500 vidéos
Aucun compte requis. Vos séquences restent sur votre ordinateur.