단어는 기억납니다. 순간은 ClipCatalog가 찾아드립니다.
영상 속에서 누군가 말했던 단어 몇 개를 입력하시면, 플레이어가 그 말이 나온 정확한 초로 바로 이동합니다. 인터뷰, 강연, 라이브 방송, 가족 영상까지 — 아카이브의 모든 오디오 트랙이 텍스트 문서처럼 검색 가능해집니다.
전사는 Whisper로 사용자의 PC에서 로컬로 실행됩니다. 업로드도, 분당 요금도, 클라우드 계정도 필요 없습니다. 한 번 결제하는 99달러 라이선스 하나로 무제한 시간의 전사를 사용할 수 있습니다.
"누가 그 말 했던 것 같은데" 문제
단어, 이름, 또는 인용에서 기억나는 특징적인 단어 두어 개는 있지만 어느 파일인지는 모르는 상황. 검색 가능한 전사가 없으면 수동으로 훑어볼 수밖에 없습니다. ClipCatalog에서는 기억나는 내용을 입력하면 일치하는 클립이 몇 초 안에 나타납니다.
전사 검색 없이
- 누군가 중요한 말을 했던 기억은 있지만 어느 파일인지 모릅니다
- 한 줄의 인용을 찾으려고 몇 시간짜리 영상을 훑는 일
- 클라우드 전사 서비스는 분당 요금을 부과하고 업로드를 요구합니다
ClipCatalog와 함께
- 단어를 입력하면 그 단어가 포함된 모든 동영상을 정확한 타임스탬프와 함께 얻을 수 있습니다
- 결과를 클릭하면 그 말이 발화된 정확한 순간으로 바로 이동
- 작업하는 동안 전사가 백그라운드에서 진행됩니다 — 업로드도, 기다림도 없습니다
음성 단어로 비디오를 검색하는 방법
음성 검색이 비디오 라이브러리 전체에 대한 Ctrl+F처럼 느껴지려면 세 가지가 필요합니다: 정확한 전사, 라이브러리 전체 인덱싱, 그리고 정확한 순간으로 돌아가는 빠른 경로. ClipCatalog는 세 가지 모두를 로컬에서 처리합니다.
대본 검색 →폴더를 지정합니다
폴더 하나 또는 여러 개를 추가하면 ClipCatalog가 비디오 파일을 검사하고 각각을 로컬 전사 대기열에 넣습니다. 폴더 구조는 그대로 유지됩니다.
로컬 Whisper가 처리합니다
ClipCatalog는 whisper.cpp를 내장하여 사용자의 하드웨어에서 실행합니다 — 가능하면 Vulkan GPU, 아니면 CPU. 업로드되는 것은 없습니다.
음성으로 검색
전사 필터를 열고 마무리 같은 단어를 입력하거나, 마무리 + 인사말 두 단어가 모두 들어 있도록 결합해 결과를 좁히세요. 결과를 클릭하면 그 단어들이 발화된 순간으로 바로 이동합니다.
쉬워지는 검색 예시
라이브러리가 인덱싱되면 특정 순간을 찾는 것이 단어 하나를 입력하는 속도가 됩니다. 전사 검색 필터는 단어 단위로 검색합니다. 여러 단어를 조합할 때는 모든 단어가 들어 있어야 결과를 좁힐 수 있고, 어떤 단어든 하나만 있어도 범위를 넓힐 수 있습니다.
누가 음성 단어로 비디오를 검색하나요?
한 번도 인덱싱된 적 없는 음성 녹화 자료가 쌓여 있는 모든 사람. 몇 가지 실제 사례:
인터뷰 아카이브를 가진 기자
3년치, 총 80시간 분량의 원본 인터뷰. ClipCatalog가 로컬에서 전사해 줍니다. 어렴풋이 기억나는 인용을 검색해 바로 그 지점으로 이동하세요. 원본 자료는 노트북을 벗어나지 않습니다.
비디오 에피소드를 만드는 팟캐스터
게스트가 경쟁사를 언급한 모든 순간, 이전 에피소드로 돌아간 모든 콜백, 쇼츠로 재활용할 만한 모든 농담. 전체 에피소드를 한 번에 검색합니다.
강사와 강의 제작자
학생이 "X 부분 어디에서 다루셨어요?"라고 물으면 "4주차 어딘가" 대신 타임스탬프로 답할 수 있습니다.
진술 녹화를 다루는 법무팀
정확한 구절로 진술 녹화를 검색하세요 — 녹화는 사무소의 기기에서 절대 나가지 않으므로, 의뢰인의 자료가 외부 전사 서비스에 노출되지 않습니다.
다큐멘터리 영화감독
3년치 인터뷰 B-roll에서 특정 인물, 장소 또는 주제가 언급된 모든 클립을 훑어보세요 — 분당 요금이나 클라우드 왕복 대기 없이.
가족사 기록자
어르신들이 들려준 이야기를 메모로는 제대로 남기지 못했죠. 영상에 진짜 버전이 있습니다. "할아버지가 배 이야기를 하셨던 때"를 40시간을 다시 보지 않고도 찾으세요.
음성 비디오 검색에 기대할 수 있는 것
ClipCatalog의 전사 파이프라인은 실용적이고 정직하게 설계되었습니다. 시작하기 전 알아두어야 할 사실입니다.
다국어 전사
Whisper는 클립별로 자동 감지되는 수십 개 언어를 지원합니다 — 수동 설정이 필요 없습니다. 지원되는 전체 언어 목록은 아래 FAQ를 참조하세요.
Windows 10/11, GPU 선택 사항
ClipCatalog는 Windows 10과 11에서 동작합니다. 성능 좋은 GPU가 있으면 전사가 빠르고, CPU만으로도 느리지만 작동합니다. 어느 쪽이든 일회성 작업이며, 아카이브가 인덱싱되면 검색은 즉시 이루어집니다.
드라이브가 분리되어 있어도 검색
폴더가 인덱싱되면 전사는 PC에 남아 있습니다. 외장 드라이브가 분리되어 있어도 그 안의 클립을 검색할 수 있습니다 — 실제 파일을 재생할 때만 다시 연결하면 됩니다.
SRT 또는 TXT로 내보내기
완성된 전사를 SRT 자막으로 편집기에 끌어다 놓거나, 일반 텍스트로 내보내 클립과 함께 게시할 수 있습니다.
음성 콘텐츠에 로컬 우선이 중요한 이유
음성 녹화는 드라이브에 저장된 콘텐츠 중에서도 가장 민감한 부류입니다. 엠바고가 걸린 인터뷰, 진술, 상담 세션, 가족 이야기. 이를 업로드하는 전사 서비스는 그들의 인프라를 신뢰해 달라고 요청하는 것이며, 데이터가 그들의 것이 된 뒤에도 계속 신뢰하라는 요청입니다.
ClipCatalog는 Whisper를 사용자의 하드웨어에서 실행합니다. 비디오는 드라이브에, 전사는 기기 안의 로컬 SQLite 데이터베이스에 머무릅니다. 사용자가 공유를 선택하기 전까지 아무것도 밖으로 나가지 않습니다.
로컬 우선 비디오 도구를 나란히 비교하고 싶다면, 프라이버시 중심 비디오 관리 비교에서 ClipCatalog가 오프라인 전사와 라이브러리 전체 검색 측면에서 어떻게 자리 잡는지 확인하세요.
음성 단어로 비디오 검색 — 자주 묻는 질문
이 기능이 제 비디오를 어디든 업로드하나요?
아니요. 전사는 내장된 로컬 Whisper 모델을 사용해 전적으로 사용자의 기기에서 실행됩니다. 첫 실행 시 모델만 내려받으면 이후에는 네트워크가 필요하지 않습니다.
어떤 언어를 지원하나요?
수십 개 — 영어, 독일어, 프랑스어, 스페인어, 포르투갈어, 러시아어, 아랍어, 일본어, 한국어, 중국어 등 다수. ClipCatalog는 클립별로 발화 언어를 자동으로 감지합니다 — 수동 설정은 필요 없습니다.
Otter, Rev, Trint와 비교해 얼마나 정확한가요?
ClipCatalog는 여러 상용 서비스가 기반으로 삼는 것과 같은 Whisper 모델 계열을 사용합니다 — 구체적으로는 현재 Whisper 라인업에서 정확도와 속도의 균형이 가장 좋은 large-v3-turbo 모델입니다. 정확도는 같은 모델 계열을 돌리는 상용 클라우드 서비스와 비슷한 수준입니다.
여러 비디오를 한 번에 검색할 수 있나요?
네, 바로 그것이 목적입니다. 클라우드 전사 도구는 보통 파일 단위로 작동하지만, ClipCatalog는 폴더를 인덱싱하여 전체 라이브러리를 한 번에 검색할 수 있게 해줍니다.
외장 드라이브에서도 동작하나요?
네. 드라이브가 추적되므로 분리되어 있어도 전사를 검색할 수 있습니다. 결과는 드라이브를 다시 연결할 때까지 "사용 불가"로 표시됩니다.
전사는 얼마나 빠른가요?
ClipCatalog는 하나의 Whisper 모델(large-v3-turbo)만을 제공합니다 — 속도는 하드웨어에 따라 달라집니다. 최신 GPU에서는 전사가 보통 실시간의 몇 배 빠르게 진행됩니다.
전사를 자막으로 내보낼 수 있나요?
네 — 각 비디오의 전사를 SRT 자막이나 일반 텍스트로 내보낼 수 있습니다. 편집기에 끌어다 쓰거나 클립과 함께 게시하세요.
무료 체험판에 전사가 포함되나요?
네 — 비디오 500개, 총 10시간까지 전사 검색과 얼굴 인식을 포함한 모든 기능을 사용할 수 있습니다. 계정이나 신용카드가 필요하지 않습니다.
오디오 품질이 나쁜 비디오는 어떻게 되나요?
Whisper는 배경 잡음과 억양을 기존 음성 인식 시스템보다 잘 처리하지만 마법은 아닙니다. 심하게 왜곡되었거나 음량이 매우 낮은 오디오는 정확도가 떨어집니다.
Mac이나 Linux에서도 작동하나요?
ClipCatalog는 현재 Windows 전용입니다 (Windows 10과 11). Mac과 Linux 지원은 단기 로드맵에 없습니다.
전사 검색을 다른 모든 것과 결합하세요
음성 검색은 다른 필터 위에 겹쳐 사용할 때 가장 강력합니다. 각 레이어가 결과 목록을 줄여 거짓 양성을 가려낼 필요를 없애 줍니다.
대본 검색
전사 검색 기능을 자세히 살펴봅니다: 필터 문법, 모두/아무거나 매칭, 발화 비율 필터, 내보내기 옵션.
영상에서 사람 찾기
전사 검색을 얼굴 검색과 결합하세요 — 특정 인물이 특정한 말을 한 모든 클립.
탐지된 콘텐츠
전사 검색을 감지된 장면·객체와 함께 사용하세요 — 화면에 무언가가 비치는 동안 그것에 대해 말하는 클립을 찾을 수 있습니다.
외장 드라이브
음성 검색은 외장 드라이브에도 적용됩니다. 드라이브가 분리되어 있어도 전사 검색은 그대로 동작합니다.
관련 비교
이 워크플로를 다른 도구와 비교하고 있다면, 먼저 이 나란한 비교 페이지부터 확인하세요.
관련된 문제 중심 가이드
테라바이트급 영상 라이브러리 검색
자막 색인이 수 TB 분량의 아카이브 안에 있을 때, 진짜 열쇠는 겹쳐 쌓은 필터와 저장된 프리셋입니다. 대규모 검색을 위한 동반 가이드입니다.
화면에 보이는 것으로 B-roll 찾기
기억나는 것이 대사가 아니라면 자막 대신 시각 태그로 옮겨가세요 — 자동 생성, 라이브러리 전체, 수동 라벨링 없이.
드라이브와 NAS에 흩어진 영상 정리
자막은 카탈로그가 모든 드라이브를 실제로 포함할 때 비로소 의미가 있습니다 — 저장 계층을 하나로 묶기 위한 동반 가이드입니다.
비디오 라이브러리에서 특정 인물 찾기
폴더, 드라이브, 수년치 영상에 걸친 얼굴 검색 — 음성 검색의 짝이 되는 문제입니다.
ClipCatalog 사용 사례 전체 보기
로컬 비디오 라이브러리에서 원하는 것을 찾기 위한 문제 중심 가이드와 대상자별 워크플로우.
ClipCatalog 무료 체험 — 최대 500 개의 동영상
계정 등록이 필요 없습니다. 촬영한 영상은 컴퓨터에 그대로 보관됩니다.