Busca en una videoteca de varios TB, en local y en segundos.
Una vez indexado tu archivo, ClipCatalog combina la búsqueda por etiquetas, la búsqueda de palabras habladas, la búsqueda por descripción en lenguaje natural, los filtros de rostros y los filtros de metadatos en una única ruta de consulta sobre toda la biblioteca. Reduce miles de clips a docenas en pocos clics.
Sin tarifas por minuto. Sin suscripciones. Una licencia única de 99 $ para hacer que cada vídeo tuyo sea buscable en todas tus unidades.
El problema del «sé que está ahí, en algún lado»
Pasados unos pocos terabytes, ni siquiera una buena estructura de carpetas basta. Sabes que la toma existe, pero no en qué disco, en qué carpeta de viaje, en qué entrevista ni en qué take. Sin búsqueda en toda la biblioteca, te toca hacer scroll. Con ClipCatalog, haces una consulta y el clip correcto aparece en segundos.
Sin búsqueda en toda la biblioteca
- Sabes que la toma existe, pero no en qué disco ni en qué carpeta de qué año
- El precio del SaaS en la nube crece con el tamaño de la biblioteca, justo cuando más necesitas buscar
- Las herramientas de un solo propósito indexan etiquetas, o transcripciones, o rostros, pero nunca todo a la vez
Con ClipCatalog
- Una sola barra de búsqueda cubre todas las carpetas, todos los discos y todos los años de metraje
- Combina una etiqueta, una palabra hablada, un rostro y un rango de fechas en una sola consulta
- Los preajustes guardados convierten consultas multi-filtro recurrentes en recuperaciones de un clic
Cómo funciona la búsqueda en toda la biblioteca de vídeo
A escala TB tienen que cumplirse tres condiciones: cada clip debe ser accesible desde una sola búsqueda, cada modo de recuperación debe usar el mismo índice y el índice debe sobrevivir a la reorganización de discos. ClipCatalog se ocupa de las tres cosas en local.
Búsqueda de vídeos →Apunta a cada carpeta
Añade discos internos, SSD externos, recursos NAS y discos de archivo. ClipCatalog registra cada uno por volumen de almacenamiento, de modo que el catálogo sobrevive a movimientos de discos, renombres y ciclos de desconexión/reconexión. Puedes excluir subcarpetas cuando solo quieras indexar una parte de un directorio.
La IA local construye el índice
La extracción de miniaturas, el etiquetado visual con IA, la transcripción con Whisper, la detección de rostros y los embeddings para búsqueda en lenguaje natural se ejecutan en tu hardware: DirectML o Vulkan cuando es posible, CPU como fallback. La primera pasada es un coste único; después, cada búsqueda golpea un índice local.
Busca apilando filtros
Combina en una sola consulta filtros por etiqueta, transcripción, rostro, tipo de footage y metadatos. Cada filtro reduce más el conjunto de resultados — una biblioteca de 10 000 clips se queda en un puñado en cuestión de segundos. Cualquier combinación que vayas a repetir se guarda como preajuste; la siguiente búsqueda está a un clic.
Búsquedas en toda la biblioteca que por fin son fáciles
Seis búsquedas que muestran cómo se ve en la práctica la búsqueda en toda la biblioteca — desde una sola etiqueta visual hasta un preajuste guardado que combina cuatro filtros a la vez. Cada ejemplo asume que el índice ya está construido; a partir de ahí, la consulta es lo fácil.
¿Quién busca en una videoteca de varios TB?
Seis perfiles reales de archivos en los que la búsqueda en toda la biblioteca compensa en el momento en que dejas de hacer scroll y empiezas a consultar.
Archivo de noticias de televisión con contenido indexado de una década
Unos 40 TB, 80 000 clips, cuatro salas de montaje en la redacción sacando material a diario. Cuando salta una noticia, la pregunta es: «¿qué tenemos ya de esta persona, este lugar, este incidente?». Un filtro de rostros + una búsqueda de una palabra en la transcripción + un rango de fechas la contestan sobre diez años de cobertura en segundos.
Biblioteca de stock footage con catálogo de derechos liberados a lo largo de décadas
Cientos de miles de clips, cada uno etiquetado por lo que aparece en pantalla. Los compradores llegan con briefings muy concretos («plano cenital a cámara lenta de una costa en hora dorada»). Una búsqueda por descripción en lenguaje natural en modo Strict + filtro de tipo paisajístico + filtro de dron reduce cientos de miles de clips a una preselección licenciable en una sola consulta.
E-discovery legal sobre material de declaraciones, body-cams y cámaras de vigilancia
Veinticinco terabytes de grabaciones en discovery: declaraciones, extractos de body-cam, volcados de cámaras de barrio. La parte contraria hace una pregunta; el equipo necesita cada clip que mencione un término concreto, rápido y sin subir material bajo secreto a un tercero. Búsqueda de una palabra en la transcripción sobre el conjunto, luego acotar por rango de fechas y rostro del hablante.
Análisis deportivo sobre bibliotecas multi-temporada de partidos y entrenamientos
Cinco temporadas de capturas multicámara de los partidos enteros, más material de entrenamiento diario, suman decenas de terabytes. El analista pide «todos los contraataques iniciados por el jugador X en partidos que perdimos»: un filtro de rostros + una búsqueda por etiqueta para la acción + un filtro de metadatos para derrotas reducen años de cinta a un reel de estudio enfocado en una sola consulta.
Laboratorio universitario de medios y archivo de imagen científica de una década
Ochenta terabytes de grabaciones de experimentos: ensayos conductuales, capturas de microscopio, trabajo de campo, montajes de time-lapse. El próximo paper necesita material comparable de estudios más antiguos: una búsqueda por descripción en lenguaje natural en modo Balanced más un filtro de rango de fechas saca a la luz cada ensayo comparable a lo largo de la década, sin que una doctoranda tenga que pasarse dos semanas rebuscando en discos externos.
Bóveda de archivo de postproducción para proyectos de cliente cerrados
Ocho años de proyectos terminados archivados durante el periodo de retención contractual: bien por encima de los 100 TB. La productora vuelve a pedir «el reel lifestyle de la campaña de cosmética de primavera 2024»: un preajuste guardado que combina etiqueta de cliente + rango de fechas del proyecto + tipo de plano sin diálogo devuelve la bobina correcta en segundos, aunque la mayor parte del archivo viva en discos en frío.
Qué esperar a escala TB
Las bibliotecas grandes someten a presión cada paso de la cadena de indexación. ClipCatalog está construido alrededor de las concesiones que de verdad importan a escala TB; esta es la versión honesta.
El primer índice es el mayor coste
Planifica la primera pasada para una noche o un fin de semana en una biblioteca de varios TB. Una vez completada, las sincronizaciones incrementales solo procesan el contenido nuevo. Pausa y reanuda según te convenga: el progreso se conserva.
Los controles de hardware ponen la velocidad en tus manos
Elige por separado la GPU usada para el análisis de contenido, la GPU usada para la transcripción con Whisper y el dispositivo usado para la detección de rostros. Ejecuta el benchmark integrado y ClipCatalog propone la configuración más rápida para tu equipo.
La latencia sigue siendo manejable más allá de 100 000 clips
El índice se basa en una base vectorial local y un catálogo SQLite cifrado afinado para búsquedas rápidas. Cuenta con que una consulta por una etiqueta o una palabra te devuelva los primeros resultados en segundos sobre una biblioteca de 20 000 clips, y siga respondiendo cuando la biblioteca se duplique.
Los filtros combinados mantienen manejables las listas de resultados
Una biblioteca de 10 000 clips no tiene por qué darte 10 000 resultados. Apila etiquetas, transcripción, rostros, tipo de plano y metadatos — cada filtro reduce más el conjunto, de modo que el puñado que realmente quieres aparece en cuestión de segundos.
Cuatro modos de recuperación, una sola biblioteca
La búsqueda por etiquetas usa un vocabulario de IA enumerable; la búsqueda por palabras habladas encuentra palabras sueltas en las transcripciones con Match-All/Match-Any; la búsqueda en lenguaje natural ordena los clips a partir de descripciones libres con los niveles Relaxed/Balanced/Strict; la búsqueda por rostros filtra por personas agrupadas a partir de los rostros detectados. Usa el modo que encaje con la pregunta.
Solo Windows por ahora
ClipCatalog funciona en Windows 10 y 11. La aplicación elige la ruta de hardware más rápida posible: DirectML, Vulkan, OpenCL o CPU. No hay versión para Mac ni Linux en la hoja de ruta cercana.
Qué aspecto tiene realmente la «escala TB»
Órdenes de magnitud concretos sobre hardware representativo (una GPU Vulkan reciente, disco de catálogo NVMe). Tus números variarán con la mezcla de códecs, el tamaño del modelo y la velocidad del almacenamiento; esto es la referencia para planificar, no un SLA cerrado.
Biblioteca de prueba representativa
≈24 TB de vídeo fuente, ≈3 000 horas, repartidos en tres discos internos y un recurso NAS. Las cifras de abajo son un modelo de planificación de orden de magnitud para una biblioteca con esa forma — tus números reales variarán con el mix de códecs, el hardware y las etapas de IA que actives.
Latencia del primer resultado
Una consulta por una etiqueta contra el índice completo de 20 000 clips devuelve los primeros resultados en 2-5 segundos en el equipo de referencia. Cada capa de filtro extra añade una fracción de segundo; lo más lento suele ser la búsqueda vectorial en lenguaje natural.
Huella del catálogo en disco
Miniaturas, etiquetas de IA, transcripciones, datos de rostros y vectores semánticos suman almacenamiento sobre tu vídeo de origen. La pantalla Configuración → Uso de almacenamiento desglosa el total en directo por categoría en MB — mide tu huella real después del primer pase de indexación en lugar de partir de una estimación.
Tiempo de la primera pasada de indexación
Para bibliotecas de varios TB, planifica la primera pasada como trabajo en segundo plano de noche o de fin de semana — el tiempo de indexación depende mucho del mix de códecs, la clase de GPU y de cuántas etapas de IA actives. El pipeline se reanuda, así que sobrevive a reinicios y cambios de unidad.
Coste de la sincronización incremental
Tras la primera pasada, solo los clips nuevos o cambiados pasan por el pipeline de IA. El índice existente no se reconstruye nunca. Una sincronización diaria sobre una biblioteca activa suele alcanzar el estado «al día» en pocos minutos, aunque el archivo subyacente sea de escala TB.
La economía de buscar en un archivo de 10 TB
Los servicios de transcripción en la nube suelen cobrar entre 0,005 y 0,024 $ por minuto de audio. En un archivo de varios TB que son cientos de horas de fuente, una sola pasada de transcripción ya sube a una cifra de cuatro dígitos — antes de tarifas por nivel de almacenamiento, puestos de búsqueda por usuario o tráfico de salida (la salida en la nube cuesta entre 0,05 y 0,09 $ por GB, entre 500 y 900 $ más si algún día quieres recuperar 10 TB). La factura crece con la biblioteca: cuanto más tiempo te quedas, peor sale la cuenta.
ClipCatalog ingiere sobre los discos que ya tienes, indexa localmente con la GPU que ya tienes y guarda todo en una base SQLite cifrada en tu máquina. 99 $ de pago único. Sin ancho de banda, sin egress, sin suscripción. Una biblioteca de 50 TB y una de 5 TB cuestan lo mismo en licencia; el coste dominante es el hardware de almacenamiento que ya tienes.
¿Comparando herramientas local-first para archivos grandes? Mira el comparativa de gestión de vídeo centrada en la privacidad para ver cómo se comporta ClipCatalog en ingesta a escala TB, búsqueda en toda la biblioteca y flujos de trabajo offline.
Buscar en una videoteca grande — Preguntas frecuentes
¿De qué tamaño puede ser una biblioteca que ClipCatalog maneje?
Está diseñado para archivos de varios TB repartidos en varias carpetas, unidades y volúmenes. La base del catálogo, el índice vectorial y la cola están preparados para escalar; el límite práctico en un PC moderno es sobre todo el espacio para miniaturas y embeddings, no un número fijo de vídeos.
¿Cuánto tarda la primera pasada de indexación en una biblioteca de varios TB?
Depende mucho del hardware, la mezcla de códecs y de cuántas etapas de IA actives. En una biblioteca de varios TB suele convenir lanzar la primera pasada por la noche o durante un fin de semana en un PC con GPU. La indexación es completamente reanudable.
¿Las consultas se mantienen rápidas a medida que la biblioteca crece?
Sí: justo en eso está pensada la arquitectura. Las búsquedas por etiqueta y transcripción usan columnas indexadas del catálogo SQLite local; las consultas semánticas y de rostros, un índice vectorial local. Ambas están diseñadas para mantenerse rápidas a medida que la biblioteca crece, así que una biblioteca de 50 000 clips solo es marginalmente más lenta que una de 5 000 para la misma forma de consulta.
¿Puedo guardar combinaciones de filtros para no tener que reconstruirlas?
Sí: los preajustes de búsqueda guardados son una característica de primer nivel. Empaqueta una búsqueda por etiquetas, un filtro de palabra en la transcripción, un filtro de rostros y un rango de fechas en un preajuste con nombre y vuelve a ejecutarlo con un solo clic. Los preajustes siguen siendo útiles aunque la biblioteca crezca.
¿De verdad puedo combinar filtros de etiquetas, transcripción, rostros y metadatos en una sola búsqueda?
Sí. Los filtros de las categorías Visual, Audio, Metadatos, Ubicación y Técnico se aplican todos a la misma lista de resultados. Cada uno elimina las coincidencias que no cumplen su condición, de modo que filtros en capas reducen muy rápidamente una lista de cinco cifras a un puñado manejable.
Las funciones que más rinden a medida que la biblioteca crece
Tres capacidades pesan desproporcionadamente a escala: los preajustes guardados que convierten consultas recurrentes en un clic, la clasificación de tipo de plano que separa diálogo, voz en off y planos generales antes incluso de aplicar otros filtros, y una barra de búsqueda unificada que apila etiquetas, transcripción, rostros y metadatos en una sola consulta.
Búsqueda de vídeos
Preajustes guardados y la interfaz unificada de búsqueda donde etiquetas, transcripción, rostros y metadatos se componen en una sola consulta — la superficie de trabajo donde el filtrado en toda la biblioteca sucede de verdad.
Contenido detectado
El vocabulario de etiquetas autogenerado está diseñado para mantenerse rápido a medida que la biblioteca crece — la búsqueda por etiquetas en una biblioteca de 100 000 clips se siente similar a una de 10 000.
Búsqueda de transcripciones
Las columnas indexadas del catálogo SQLite local mantienen rápidas las búsquedas de una palabra en la transcripción a lo largo de cientos de miles de clips. El Match-All/Match-Any sobre varias palabras se compone igual.
Reconocimiento facial
Los grupos de personas se mantienen al crecer la biblioteca: los nuevos clips de la misma persona se asocian al grupo existente, así que encontrar todo con un rostro recurrente sigue siendo una operación de un clic, por grande que sea la biblioteca.
Comparativas relevantes
Si estás evaluando este flujo de trabajo frente a otras herramientas, empieza por estas comparativas lado a lado.
Guías relacionadas centradas en el problema
Encontrar B-roll por lo que aparece en pantalla
Etiquetas visuales autogeneradas con combinaciones Match-All / Match-Any — el complemento natural a la búsqueda combinada en toda la biblioteca.
Organiza el material en discos y NAS
Cuando un archivo cruza la escala de TB, el material casi siempre vive en varios discos y recursos NAS. La guía complementaria para unificar la capa de almacenamiento.
Buscar vídeos por palabras habladas
Búsqueda de una palabra en la transcripción sobre un archivo indexado localmente con Whisper: el complemento palabra a palabra de la búsqueda combinada en toda la biblioteca.
Encontrar a una persona en tu videoteca
Búsqueda por rostro a través de carpetas, unidades y años de metraje: el compañero «por persona» de la búsqueda combinada en toda la biblioteca.
Prueba ClipCatalog gratis: hasta 500 vídeos.
No es necesario crear una cuenta. Las imágenes permanecen en tu ordenador.