Recuerdas la palabra. ClipCatalog encuentra el momento.
Escribe unas pocas palabras que alguien dijo en uno de tus vídeos — y el reproductor salta directamente al segundo en que fueron pronunciadas. Entrevistas, conferencias, directos, vídeos familiares: cada pista de audio de tu archivo se vuelve buscable como un documento de texto.
La transcripción se ejecuta localmente con Whisper, en tu propio equipo. Sin subidas, sin tarifas por minuto, sin cuentas en la nube — una sola licencia de 99 $ para horas de transcripción ilimitadas.
El problema de "sé que alguien lo dijo"
Recuerdas una palabra, un nombre o un par de palabras distintivas de una cita — pero no el archivo. Sin transcripciones buscables, solo queda revisar a mano. Con ClipCatalog, escribes lo que recuerdas y los clips coincidentes aparecen en segundos.
Sin búsqueda en transcripciones
- Recuerdas que alguien dijo algo importante, pero no en qué archivo
- Repasar horas de material para encontrar una sola cita
- Los servicios cloud de transcripción cobran por minuto y exigen subir el material
Con ClipCatalog
- Escribe la palabra y obtén todos los vídeos que la contienen, con la marca de tiempo exacta
- Haz clic en un resultado y salta directamente al segundo en que se dijeron las palabras
- La transcripción se ejecuta en segundo plano mientras trabajas — sin subidas, sin esperas
Cómo funciona la búsqueda en vídeo por palabras habladas
Para que la búsqueda por voz se sienta como un Ctrl+F en toda la videoteca, hacen falta tres cosas: transcripción precisa, indexación de toda la biblioteca y una vía rápida de vuelta al momento exacto. ClipCatalog hace las tres en local.
Búsqueda de transcripciones →Apunta a una carpeta
Añade una o varias carpetas. ClipCatalog escanea archivos de vídeo y pone cada uno en cola para la transcripción local. Tu estructura de carpetas no se toca.
Whisper en local hace el trabajo
ClipCatalog incluye whisper.cpp y lo ejecuta en tu hardware — GPU Vulkan cuando está disponible, CPU como alternativa. Nada se sube.
Busca por voz
Abre el filtro de transcripción, escribe una palabra como conclusión, o combina conclusión + agradecimientos exigiendo que aparezcan las dos para acotar más. Haz clic en un resultado para saltar directamente al momento en que se dijeron esas palabras.
Búsquedas de ejemplo que se vuelven fáciles
Una vez indexada tu biblioteca, encontrar un momento concreto es tan rápido como teclear una palabra. El filtro de búsqueda en transcripciones trabaja a nivel de palabra; combina varias palabras y exige que aparezcan todas para acotar, o que aparezca cualquiera para ampliar.
¿Quién busca vídeo por palabras habladas?
Cualquier persona con un fondo de grabaciones habladas que nunca se haya indexado. Algunos perfiles reales:
Periodistas con archivos de entrevistas
Ochenta horas de entrevistas originales de los últimos tres años. ClipCatalog las transcribe en local; busca una cita que recuerdas a medias y salta a ella. El material fuente nunca sale del portátil.
Podcasters con episodios en vídeo
Cada vez que un invitado mencionó a un competidor, cada referencia a un episodio anterior, cada chiste que podrías reutilizar como short. Busca en todos los episodios a la vez.
Profesores y creadores de cursos
Cuando un estudiante pregunta «¿dónde explicaste X?», responde con una marca de tiempo en lugar de «en algún momento de la semana 4».
Equipos jurídicos con grabaciones de declaraciones
Busca en declaraciones por frase exacta — las grabaciones no salen de los equipos del despacho, así el material del cliente no pasa por un servicio de transcripción externo.
Documentalistas
Peina tres años de B-roll de entrevistas para encontrar cada clip que mencione a una persona, lugar o tema concreto — sin pagar por minuto ni esperar viajes al cloud.
Historiadores familiares
Los mayores te contaron historias que apuntaste a medias. El vídeo tiene la versión real. Encuentra "cuando el abuelo habló del barco" sin ver cuarenta horas.
Qué esperar de la búsqueda en vídeo por voz
El pipeline de transcripción de ClipCatalog está pensado para ser práctico y honesto. Esto es cierto incluso antes de empezar.
Transcripción multilingüe
Whisper maneja decenas de idiomas, detectados automáticamente por clip — sin configuración manual. Consulta la sección de preguntas frecuentes más abajo para ver la lista completa de idiomas compatibles.
Windows 10/11, GPU opcional
ClipCatalog funciona en Windows 10 y 11. Una GPU capaz hace que la transcripción sea rápida; solo con CPU es más lento pero funciona. En cualquier caso, es un coste único: una vez indexado el archivo, las búsquedas son instantáneas.
Busca aunque los discos estén desconectados
Una vez indexada una carpeta, las transcripciones se quedan en tu PC. Puedes buscar clips en discos externos aunque estén desconectados — solo reconecta para reproducir el archivo real.
Exporta a SRT o TXT
Lleva una transcripción terminada a tu editor como subtítulos SRT, o expórtala como texto plano para publicarla junto al clip.
Por qué local-first importa para el contenido hablado
Las grabaciones habladas son de los contenidos más sensibles que pueden vivir en un disco. Entrevistas con embargo. Declaraciones. Sesiones de terapia. Historias familiares. Un servicio de transcripción que las sube te pide confiar en su infraestructura — y seguir confiando después de que los datos sean suyos.
ClipCatalog ejecuta Whisper en tu hardware. El vídeo se queda en el disco. La transcripción vive en una base de datos SQLite local en tu equipo. Nada sale hasta que decidas compartirlo.
Si quieres comparar herramientas de vídeo local-first lado a lado, mira el comparativo privacy-first de gestores de vídeo para ver cómo se sitúa ClipCatalog en transcripción offline y búsqueda en toda la biblioteca.
Búsqueda en vídeo por palabras habladas — Preguntas frecuentes
¿Esto sube mis vídeos a algún sitio?
No. La transcripción se ejecuta por completo en tu equipo con un modelo Whisper local incluido. Una vez descargado el modelo en el primer arranque, no hace falta red.
¿Qué idiomas se soportan?
Decenas — inglés, alemán, francés, español, portugués, ruso, árabe, japonés, coreano, mandarín y muchos más. ClipCatalog detecta automáticamente el idioma hablado en cada clip — sin configuración manual.
¿Qué tan preciso es comparado con Otter, Rev o Trint?
ClipCatalog usa Whisper — la misma familia de modelos sobre la que se construyen varios servicios comerciales — en concreto el modelo large-v3-turbo, que ahora mismo es el punto óptimo entre precisión y velocidad dentro de la gama Whisper. La precisión es comparable a la de los servicios en la nube comerciales que usan la misma familia de modelos.
¿Puedo buscar en varios vídeos a la vez?
Sí — esa es la idea. Las herramientas de transcripción en la nube suelen trabajar archivo por archivo. ClipCatalog indexa carpetas y te permite consultar toda la biblioteca a la vez.
¿Funciona en discos externos?
Sí. Los discos se rastrean; puedes seguir buscando en las transcripciones aunque el disco esté desconectado. Los resultados se muestran como no disponibles hasta que reconectes el disco.
¿Qué tan rápido es la transcripción?
ClipCatalog incluye un único modelo Whisper (large-v3-turbo) — la velocidad depende de tu hardware. En una GPU moderna, la transcripción suele ir muchas veces más rápido que en tiempo real.
¿Puedo exportar las transcripciones como subtítulos?
Sí — cada transcripción se puede exportar como subtítulos SRT o texto plano por vídeo. Pásalos a tu editor o publícalos junto al clip.
¿La prueba gratuita incluye transcripción?
Sí — hasta 500 vídeos y 10 horas en total, con acceso completo a todas las funciones, incluida la búsqueda en transcripciones y el reconocimiento facial. No hace falta cuenta ni tarjeta de crédito.
¿Y los vídeos con audio malo?
Whisper maneja ruido de fondo y acentos mejor que los sistemas antiguos de voz a texto, pero no hace milagros. Audio muy distorsionado o con poco volumen produce transcripciones menos precisas.
¿Funciona en Mac o Linux?
ClipCatalog está disponible actualmente solo para Windows (10 y 11). El soporte para Mac y Linux no está en la hoja de ruta a corto plazo.
Combina la búsqueda en transcripciones con todo lo demás
La búsqueda por palabras habladas funciona mejor cuando la apilas sobre otros filtros. Cada capa recorta la lista de resultados para que no tengas que descartar falsos positivos.
Búsqueda de transcripciones
La función de búsqueda en transcripciones en profundidad: sintaxis del filtro, coincidencia Todos/Cualquiera, filtro de cobertura de voz y opciones de exportación.
Encontrar a una persona en vídeo
Combina la búsqueda en transcripciones con la búsqueda por rostro — cada clip en el que una persona concreta dijo algo concreto.
Contenido detectado
Combina la búsqueda en transcripciones con escenas y objetos detectados — encuentra clips donde alguien habla de algo mientras está en pantalla.
Unidades externas
La búsqueda por voz funciona en discos externos. Las transcripciones siguen siendo buscables aunque el disco esté desconectado.
Comparativas relevantes
Si estás evaluando este flujo de trabajo frente a otras herramientas, empieza por estas comparativas lado a lado.
Guías relacionadas centradas en el problema
Buscar en una videoteca de varios TB
Cuando el índice de transcripción vive dentro de un archivo de varios TB, los filtros en capas y los preajustes guardados se convierten en el verdadero desbloqueo. La guía complementaria para la recuperación a escala.
Encontrar B-roll por lo que aparece en pantalla
Cuando lo que recuerdas no es una cita, cambia de la transcripción a las etiquetas visuales — autogeneradas, en toda la biblioteca, sin etiquetar a mano.
Organiza el material en discos y NAS
Las transcripciones solo importan cuando el catálogo abarca todos tus discos — la guía complementaria para unificar la capa de almacenamiento.
Encontrar a una persona en tu videoteca
Búsqueda por rostro entre carpetas, discos y años de material — el problema gemelo de la búsqueda por voz.
Explorar todos los casos de uso de ClipCatalog
Guías centradas en el problema y flujos de trabajo por audiencia para encontrar contenido en tu videoteca local.
Prueba ClipCatalog gratis: hasta 500 vídeos.
No es necesario crear una cuenta. Las imágenes permanecen en tu ordenador.