ClipCatalog logo ClipCatalog
ES

Recuerdas la palabra. ClipCatalog encuentra el momento.

Windows Procesamiento de vídeo 100 % local Prueba gratuita · Sin límite de tiempo

Escribe unas pocas palabras que alguien dijo en uno de tus vídeos — y el reproductor salta directamente al segundo en que fueron pronunciadas. Entrevistas, conferencias, directos, vídeos familiares: cada pista de audio de tu archivo se vuelve buscable como un documento de texto.

La transcripción se ejecuta localmente con Whisper, en tu propio equipo. Sin subidas, sin tarifas por minuto, sin cuentas en la nube — una sola licencia de 99 $ para horas de transcripción ilimitadas.

Type a word or phrase into ClipCatalog's transcript filter and jump to the exact moment it was said — searchable speech across your local video library.

El problema de "sé que alguien lo dijo"

Recuerdas una palabra, un nombre o un par de palabras distintivas de una cita — pero no el archivo. Sin transcripciones buscables, solo queda revisar a mano. Con ClipCatalog, escribes lo que recuerdas y los clips coincidentes aparecen en segundos.

Sin búsqueda en transcripciones

  • Recuerdas que alguien dijo algo importante, pero no en qué archivo
  • Repasar horas de material para encontrar una sola cita
  • Los servicios cloud de transcripción cobran por minuto y exigen subir el material

Con ClipCatalog

  • Escribe la palabra y obtén todos los vídeos que la contienen, con la marca de tiempo exacta
  • Haz clic en un resultado y salta directamente al segundo en que se dijeron las palabras
  • La transcripción se ejecuta en segundo plano mientras trabajas — sin subidas, sin esperas

Cómo funciona la búsqueda en vídeo por palabras habladas

Para que la búsqueda por voz se sienta como un Ctrl+F en toda la videoteca, hacen falta tres cosas: transcripción precisa, indexación de toda la biblioteca y una vía rápida de vuelta al momento exacto. ClipCatalog hace las tres en local.

Búsqueda de transcripciones →
1

Apunta a una carpeta

Añade una o varias carpetas. ClipCatalog escanea archivos de vídeo y pone cada uno en cola para la transcripción local. Tu estructura de carpetas no se toca.

2

Whisper en local hace el trabajo

ClipCatalog incluye whisper.cpp y lo ejecuta en tu hardware — GPU Vulkan cuando está disponible, CPU como alternativa. Nada se sube.

3

Busca por voz

Abre el filtro de transcripción, escribe una palabra como conclusión, o combina conclusión + agradecimientos exigiendo que aparezcan las dos para acotar más. Haz clic en un resultado para saltar directamente al momento en que se dijeron esas palabras.

Búsquedas de ejemplo que se vuelven fáciles

Una vez indexada tu biblioteca, encontrar un momento concreto es tan rápido como teclear una palabra. El filtro de búsqueda en transcripciones trabaja a nivel de palabra; combina varias palabras y exige que aparezcan todas para acotar, o que aparezca cualquiera para ampliar.

diapositiva — cada vez que se dice esa palabra en tus tutoriales grabados (búsqueda por palabra única)
pregunta + respuesta — cada turno de preguntas y respuestas de una serie de conferencias (ambas palabras deben aparecer)
receta + manzana — la historia oral de la abuela, esa en la que de verdad te dio la receta del bizcocho de manzana (ambas palabras deben aparecer)
objeción — cada momento de una declaración en el que la otra parte protestó (búsqueda por palabra única)
aprobado O rechazado — cada momento de decisión en un archivo de reuniones (basta con cualquiera de las palabras)
entrevista (etiqueta) + presupuesto (transcripción) — cada clip etiquetado entrevista en el que se habló de presupuesto

¿Quién busca vídeo por palabras habladas?

Cualquier persona con un fondo de grabaciones habladas que nunca se haya indexado. Algunos perfiles reales:

Periodistas con archivos de entrevistas

Ochenta horas de entrevistas originales de los últimos tres años. ClipCatalog las transcribe en local; busca una cita que recuerdas a medias y salta a ella. El material fuente nunca sale del portátil.

Podcasters con episodios en vídeo

Cada vez que un invitado mencionó a un competidor, cada referencia a un episodio anterior, cada chiste que podrías reutilizar como short. Busca en todos los episodios a la vez.

Profesores y creadores de cursos

Cuando un estudiante pregunta «¿dónde explicaste X?», responde con una marca de tiempo en lugar de «en algún momento de la semana 4».

Equipos jurídicos con grabaciones de declaraciones

Busca en declaraciones por frase exacta — las grabaciones no salen de los equipos del despacho, así el material del cliente no pasa por un servicio de transcripción externo.

Documentalistas

Peina tres años de B-roll de entrevistas para encontrar cada clip que mencione a una persona, lugar o tema concreto — sin pagar por minuto ni esperar viajes al cloud.

Historiadores familiares

Los mayores te contaron historias que apuntaste a medias. El vídeo tiene la versión real. Encuentra "cuando el abuelo habló del barco" sin ver cuarenta horas.

Qué esperar de la búsqueda en vídeo por voz

El pipeline de transcripción de ClipCatalog está pensado para ser práctico y honesto. Esto es cierto incluso antes de empezar.

Transcripción multilingüe

Whisper maneja decenas de idiomas, detectados automáticamente por clip — sin configuración manual. Consulta la sección de preguntas frecuentes más abajo para ver la lista completa de idiomas compatibles.

Windows 10/11, GPU opcional

ClipCatalog funciona en Windows 10 y 11. Una GPU capaz hace que la transcripción sea rápida; solo con CPU es más lento pero funciona. En cualquier caso, es un coste único: una vez indexado el archivo, las búsquedas son instantáneas.

Busca aunque los discos estén desconectados

Una vez indexada una carpeta, las transcripciones se quedan en tu PC. Puedes buscar clips en discos externos aunque estén desconectados — solo reconecta para reproducir el archivo real.

Exporta a SRT o TXT

Lleva una transcripción terminada a tu editor como subtítulos SRT, o expórtala como texto plano para publicarla junto al clip.

Por qué local-first importa para el contenido hablado

Las grabaciones habladas son de los contenidos más sensibles que pueden vivir en un disco. Entrevistas con embargo. Declaraciones. Sesiones de terapia. Historias familiares. Un servicio de transcripción que las sube te pide confiar en su infraestructura — y seguir confiando después de que los datos sean suyos.

ClipCatalog ejecuta Whisper en tu hardware. El vídeo se queda en el disco. La transcripción vive en una base de datos SQLite local en tu equipo. Nada sale hasta que decidas compartirlo.

Si quieres comparar herramientas de vídeo local-first lado a lado, mira el comparativo privacy-first de gestores de vídeo para ver cómo se sitúa ClipCatalog en transcripción offline y búsqueda en toda la biblioteca.

Búsqueda en vídeo por palabras habladas — Preguntas frecuentes

¿Esto sube mis vídeos a algún sitio?

No. La transcripción se ejecuta por completo en tu equipo con un modelo Whisper local incluido. Una vez descargado el modelo en el primer arranque, no hace falta red.

¿Qué idiomas se soportan?

Decenas — inglés, alemán, francés, español, portugués, ruso, árabe, japonés, coreano, mandarín y muchos más. ClipCatalog detecta automáticamente el idioma hablado en cada clip — sin configuración manual.

¿Qué tan preciso es comparado con Otter, Rev o Trint?

ClipCatalog usa Whisper — la misma familia de modelos sobre la que se construyen varios servicios comerciales — en concreto el modelo large-v3-turbo, que ahora mismo es el punto óptimo entre precisión y velocidad dentro de la gama Whisper. La precisión es comparable a la de los servicios en la nube comerciales que usan la misma familia de modelos.

¿Puedo buscar en varios vídeos a la vez?

Sí — esa es la idea. Las herramientas de transcripción en la nube suelen trabajar archivo por archivo. ClipCatalog indexa carpetas y te permite consultar toda la biblioteca a la vez.

¿Funciona en discos externos?

Sí. Los discos se rastrean; puedes seguir buscando en las transcripciones aunque el disco esté desconectado. Los resultados se muestran como no disponibles hasta que reconectes el disco.

¿Qué tan rápido es la transcripción?

ClipCatalog incluye un único modelo Whisper (large-v3-turbo) — la velocidad depende de tu hardware. En una GPU moderna, la transcripción suele ir muchas veces más rápido que en tiempo real.

¿Puedo exportar las transcripciones como subtítulos?

Sí — cada transcripción se puede exportar como subtítulos SRT o texto plano por vídeo. Pásalos a tu editor o publícalos junto al clip.

¿La prueba gratuita incluye transcripción?

Sí — hasta 500 vídeos y 10 horas en total, con acceso completo a todas las funciones, incluida la búsqueda en transcripciones y el reconocimiento facial. No hace falta cuenta ni tarjeta de crédito.

¿Y los vídeos con audio malo?

Whisper maneja ruido de fondo y acentos mejor que los sistemas antiguos de voz a texto, pero no hace milagros. Audio muy distorsionado o con poco volumen produce transcripciones menos precisas.

¿Funciona en Mac o Linux?

ClipCatalog está disponible actualmente solo para Windows (10 y 11). El soporte para Mac y Linux no está en la hoja de ruta a corto plazo.

Comparativas relevantes

Si estás evaluando este flujo de trabajo frente a otras herramientas, empieza por estas comparativas lado a lado.

Prueba ClipCatalog gratis: hasta 500 vídeos.

No es necesario crear una cuenta. Las imágenes permanecen en tu ordenador.

500 vídeos gratis Sin tarjeta de crédito · sin cuenta 100 % local: tus vídeos nunca salen de tu PC