Lembra-se da palavra. O ClipCatalog encontra o momento.
Escreva algumas palavras que alguém disse num dos seus vídeos — e o leitor salta diretamente para o segundo em que foram ditas. Entrevistas, palestras, transmissões em direto, vídeos de família: cada faixa de áudio do seu arquivo torna-se pesquisável como um documento de texto.
A transcrição corre localmente com o Whisper, no seu próprio computador. Sem uploads, sem cobrança ao minuto, sem contas na nuvem — uma única licença de 99 $ para horas de transcrição ilimitadas.
O problema do "sei que alguém o disse"
Lembra-se de uma palavra, de um nome ou de duas palavras distintivas de uma citação — mas não do ficheiro. Sem transcrições pesquisáveis, só resta percorrer manualmente. Com o ClipCatalog, escreve o que se lembra e os clipes correspondentes aparecem em segundos.
Sem pesquisa em transcrições
- Lembra-se de que alguém disse algo importante, mas não em que ficheiro
- Percorrer horas de material para encontrar uma única citação
- Os serviços de transcrição na nuvem cobram por minuto e exigem upload
Com o ClipCatalog
- Escreva a palavra e obtenha todos os vídeos que a contêm, com o carimbo temporal exato
- Clique num resultado e salte diretamente para o segundo em que as palavras foram ditas
- A transcrição corre em segundo plano enquanto trabalha — sem uploads, sem esperas
Como funciona a pesquisa em vídeo por palavras faladas
Para que a pesquisa por voz funcione como um Ctrl+F em toda a videoteca, três coisas têm de estar certas: transcrição rigorosa, indexação de toda a biblioteca e um caminho rápido de regresso ao momento exato. O ClipCatalog faz as três localmente.
Pesquisa de transcrição →Aponte para uma pasta
Adicione uma ou várias pastas. O ClipCatalog procura ficheiros de vídeo e coloca cada um em fila para transcrição local. A sua estrutura de pastas fica intacta.
O Whisper local faz o trabalho
O ClipCatalog inclui o whisper.cpp e executa-o no seu hardware — GPU Vulkan quando disponível, CPU em alternativa. Nada é enviado.
Pesquise por voz
Abra o filtro de transcrição, escreva uma palavra como encerramento, ou combine encerramento + agradecimentos exigindo que apareçam as duas para afinar mais. Clique num resultado para saltar diretamente para o momento em que essas palavras foram ditas.
Exemplos de pesquisa que se tornam simples
Depois de a biblioteca estar indexada, encontrar um momento específico é tão rápido como escrever uma palavra. O filtro de pesquisa em transcrições trata da procura ao nível da palavra; combine várias palavras e exija que apareçam todas para reduzir, ou que apareça qualquer uma para alargar.
Quem pesquisa vídeo por palavras faladas?
Qualquer pessoa com um arquivo de gravações faladas que nunca tenha sido indexado. Alguns casos reais:
Jornalistas com arquivos de entrevistas
Oitenta horas de entrevistas-fonte ao longo de três anos. O ClipCatalog transcreve-as localmente; pesquise uma citação que se lembra a meio e salte para ela. O material-fonte nunca sai do portátil.
Podcasters com episódios em vídeo
Cada vez que um convidado mencionou um concorrente, cada referência a um episódio anterior, cada piada que pode reutilizar num short. Pesquise em todos os episódios de uma vez.
Professores e criadores de cursos
Quando um aluno pergunta «onde abordou X?», responda com um carimbo temporal em vez de «algures na semana 4».
Equipas jurídicas com gravações de depoimentos
Pesquise depoimentos por frase exata — as gravações nunca saem das máquinas da firma, pelo que o material do cliente não passa por um serviço de transcrição externo.
Documentaristas
Pesquise três anos de B-roll de entrevistas por cada clipe que mencione uma pessoa, local ou tema específicos — sem pagar por minuto nem esperar idas e voltas à nuvem.
Historiadores familiares
Os mais velhos contaram-lhe histórias que apontou mal. O vídeo tem a versão verdadeira. Encontre "quando o avô falou do barco" sem ver quarenta horas.
O que esperar da pesquisa em vídeo por voz
O pipeline de transcrição do ClipCatalog é prático e honesto. Aqui está o que é verdade antes mesmo de começar.
Transcrição multilíngue
O Whisper trata dezenas de idiomas, detetados automaticamente por clip — sem configuração manual. Consulte as perguntas frequentes abaixo para ver a lista completa de idiomas suportados.
Windows 10/11, GPU opcional
O ClipCatalog funciona em Windows 10 e 11. Uma GPU capaz torna a transcrição rápida; só com CPU é mais lento, mas continua a funcionar. De qualquer forma, é um custo único — assim que o arquivo está indexado, as pesquisas são instantâneas.
Pesquise mesmo com os discos desligados
Depois de uma pasta estar indexada, as transcrições ficam no seu PC. Pode pesquisar clipes em discos externos mesmo desligados — basta voltar a ligar para reproduzir o ficheiro real.
Exporte para SRT ou TXT
Leve uma transcrição pronta para o seu editor como legendas SRT, ou exporte texto simples para publicar junto ao clipe.
Porque é que o local-first importa para conteúdo falado
As gravações faladas estão entre os conteúdos mais sensíveis de um disco. Entrevistas sob embargo. Depoimentos. Sessões de terapia. Histórias de família. Um serviço de transcrição que as carrega pede-lhe que confie na sua infraestrutura — e que continue a confiar depois de os dados serem deles.
O ClipCatalog corre o Whisper no seu hardware. O vídeo fica no disco. A transcrição fica numa base de dados SQLite local na sua máquina. Nada sai até que decida partilhar.
Se quer comparar ferramentas de vídeo local-first lado a lado, veja o comparativo privacy-first de gestores de vídeo para perceber como o ClipCatalog se posiciona em transcrição offline e pesquisa em toda a biblioteca.
Pesquisa em vídeo por palavras faladas — Perguntas frequentes
Isto envia os meus vídeos para algum lado?
Não. A transcrição corre inteiramente na sua máquina com um modelo Whisper local incluído. Depois de o modelo ser descarregado no primeiro arranque, não é precisa rede.
Que idiomas são suportados?
Dezenas — inglês, alemão, francês, espanhol, português, russo, árabe, japonês, coreano, mandarim e muitos mais. O ClipCatalog deteta automaticamente o idioma falado em cada clip — sem configuração manual.
Qual é a precisão face ao Otter, Rev ou Trint?
O ClipCatalog usa Whisper — a mesma família de modelos em que assentam vários serviços comerciais — em concreto o modelo large-v3-turbo, neste momento o ponto ótimo entre precisão e velocidade dentro da linha Whisper. A precisão é comparável à dos serviços na nuvem comerciais que correm a mesma família de modelos.
Posso pesquisar em vários vídeos de uma vez?
Sim — é precisamente esse o ponto. As ferramentas de transcrição na nuvem normalmente trabalham ficheiro a ficheiro. O ClipCatalog indexa pastas e permite-lhe consultar toda a biblioteca de uma só vez.
Funciona em discos externos?
Sim. Os discos são acompanhados; pode pesquisar nas transcrições mesmo com o disco desligado. Os resultados aparecem como indisponíveis até voltar a ligar o disco.
Quão rápida é a transcrição?
O ClipCatalog inclui um único modelo Whisper (large-v3-turbo) — a velocidade depende do seu hardware. Numa GPU moderna, a transcrição corre tipicamente várias vezes mais depressa do que o tempo real.
Posso exportar as transcrições como legendas?
Sim — cada transcrição pode ser exportada como legendas SRT ou texto simples por vídeo. Leve-os para o seu editor ou publique-os junto ao clipe.
A versão de teste gratuita inclui transcrição?
Sim — até 500 vídeos e 10 horas no total, com acesso completo a todas as funcionalidades, incluindo pesquisa em transcrições e reconhecimento facial. Sem conta nem cartão de crédito.
E os vídeos com áudio mau?
O Whisper lida com ruído de fundo e sotaques melhor do que sistemas antigos de voz-para-texto, mas não faz milagres. Áudio muito distorcido ou com pouco volume gera transcrições menos precisas.
Funciona em Mac ou Linux?
O ClipCatalog está atualmente disponível apenas para Windows (10 e 11). O suporte para Mac e Linux não está no roadmap de curto prazo.
Combine a pesquisa em transcrições com tudo o resto
A pesquisa por palavras faladas é mais poderosa quando a empilha sobre outros filtros. Cada camada reduz a lista de resultados para não ter de filtrar falsos positivos manualmente.
Pesquisa de transcrição
A funcionalidade de pesquisa em transcrições em detalhe: sintaxe do filtro, correspondência Todos/Qualquer, filtro de cobertura de fala e opções de exportação.
Encontrar uma pessoa em vídeo
Combine a pesquisa em transcrições com a pesquisa por rosto — cada clipe em que uma pessoa específica disse algo específico.
Conteúdo detetado
Combine a pesquisa em transcrições com cenas e objetos detetados — encontre clipes em que alguém fala de algo enquanto está em ecrã.
Unidades externas
A pesquisa por voz funciona em discos externos. As transcrições continuam pesquisáveis mesmo com o disco desligado.
Comparações relevantes
Se estiver a avaliar este fluxo de trabalho em relação a outras ferramentas, comece por estas comparações lado a lado.
Guias relacionados centrados no problema
Pesquisar uma videoteca de vários TB
Quando o índice de transcrição vive dentro de um arquivo de vários TB, os filtros em camadas e as predefinições guardadas tornam-se o verdadeiro desbloqueio. O guia complementar para a recuperação à escala.
Encontrar B-roll pelo que aparece em ecrã
Quando o que recorda não é uma citação, passe da transcrição às etiquetas visuais — autogeradas, em toda a biblioteca, sem rotular manualmente.
Organize vídeos em discos e NAS
As transcrições só fazem diferença quando o catálogo abrange todos os discos — o guia complementar para unificar a camada de armazenamento.
Encontrar uma pessoa na sua videoteca
Pesquisa por rosto em pastas, discos e anos de material — o problema irmão da pesquisa por voz.
Explorar todos os casos de uso do ClipCatalog
Guias centrados no problema e fluxos por público para encontrar conteúdo na sua videoteca local.
Experimente o ClipCatalog gratuitamente — até 500 vídeos
Não é necessário criar uma conta. As suas imagens ficam no seu computador.