ClipCatalog logo ClipCatalog
KO
제품 업데이트 · · 글쓴이: Andreas

ClipCatalog 0.19.0 — 라이브러리가 더 또렷하게, 더 빠른 음성 인식, 무료 평가판 연장까지

0.19.0 버전은 새로 디자인된 동기화 화면, 더 빠른 Whisper 음성 인식, 4K 썸네일 병렬 처리, 단계별 GPU 제어, 14일 무료 평가판 연장을 제공합니다.

ClipCatalog 0.19.0 동기화 화면. 단계별 진행률, 실시간 속도, 현재 썸네일을 만들고 있는 파일 목록이 표시됩니다.
0.19.0에서 새로 디자인된 동기화 화면 — 완료된 것, 지금 처리 중인 것, 다음에 처리될 것, 그리고 앱이 얼마나 빠르게 동작하는지가 한눈에 들어옵니다.

ClipCatalog 0.19.0이 오늘 출시됐습니다. 이 글은 블로그의 첫 번째 글이고, 여러분이 (아마) 이미 영상을 찾는 데 쓰고 있는 앱의 새 소식부터 시작하는 것보다 좋은 출발점은 없을 겁니다.

영상 라이브러리 인덱싱은 어떤 카탈로그 툴에서든 느리고 화려하지 않은 부분입니다. 0.19.0의 릴리스 노트는 길지만, 모두 한 가지를 가리킵니다. 영상 자료를 처음 훑는 그 과정을 더 명확하게 보고, 더 빠르게 끝내고, 도중에 당황하지 않도록 만드는 것입니다.

특히 눈에 띄는 세 가지가 있습니다.

지금 실제로 무슨 일이 일어나고 있는지 더 분명히 보입니다

동기화 화면은 가장 오래 들여다보는 화면이고, 이번에 훨씬 더 솔직해졌습니다. 맥락 없이 조금씩 차오르는 단일 진행 막대 대신, 이제 완료, 지금, 다음 세 개의 열이 보이며, “지금” 열에는 이 순간 실제로 처리되고 있는 파일들이 표시됩니다.

각 단계는 자체 진행률을 보여줍니다. 실시간 처리 속도도 표시됩니다(위 스크린샷의 8.3×는 “실제 시간 1초당 영상 8.3초분을 인덱싱 중”이라는 뜻입니다). 화면 상단의 남은 시간 추정치는 파일당 평균값이 아니라, 여러분의 컴퓨터가 실제로 내고 있는 속도를 기반으로 합니다.

“이거 멈춘 거 아닌가?”라는 의문이 들 때, 이제는 그 답을 훨씬 쉽게 알 수 있습니다. 속도 숫자가 움직이고 있거나, 움직이지 않거나, 둘 중 하나입니다.

더 빠르고, 더 똑똑한 처리

여기에서 세 가지 변경 사항이 누적됩니다.

  • 새로운 Whisper 음성 인식 모델. ClipCatalog는 이제 이전의 q5 양자화 대신 Whisper의 q8 양자화를 사용합니다. CPU에서는 약 5배 빠릅니다 — 새 양자화가 OpenBLAS와 훨씬 잘 맞기 때문입니다. GPU에서는 이전보다 약간만 느려졌지만, 음성 인식 품질은 눈에 띄게 좋아졌습니다. 특히 잡음이 섞인 발화, 억양, 영어가 아닌 여러 언어에서 그렇습니다. 모델 크기는 약 850MB이며, 0.19.0을 처음 실행할 때 자동으로 내려받습니다. 디스크 공간을 확보하기 위해 이전 모델은 제거됩니다.
  • 썸네일 병렬 디코딩. 4K 이하 해상도의 영상에서, ClipCatalog는 이제 썸네일 추출 중에 여러 풀 디코딩 경로를 동시에 실행합니다. 키프레임이 충분하지 않은 영상 — 즉 기존에 썸네일 단계의 병목이었던 종류 — 에서 품질 손실 없이 체감되는 속도 향상이 있습니다.
  • 음성 인식의 GPU 기본값이 더 똑똑해졌습니다. 내장 GPU와 외장 GPU가 모두 있는 시스템에서, ClipCatalog는 이제 적절한 경우 음성 인식에 내장 GPU를 우선합니다. 직관과 다르게 들리지만 사실입니다. 최근의 내장 GPU는 같은 세대의 외장 카드보다 Whisper를 훨씬 더 빠르게 돌립니다. 병목이 연산 성능이 아니라 메모리 대역폭이기 때문입니다. 물론 원하는 GPU를 그대로 선택할 수도 있습니다.

이 마지막 항목은 더 큰 변화의 일부입니다. 바로 단계별 GPU 재정의입니다. 태그 부착, 얼굴 인식, 음성 인식, 시각 검색을 각각 다른 GPU에 할당할 수 있습니다. 노트북에 iGPU와 dGPU가 모두 있다면, 단계마다 다른 GPU를 써서 동시에 돌릴 수 있어 모든 작업을 같은 카드에 몰아넣지 않아도 됩니다. 벤치마크 대화상자도 워크로드별 속도 배지와 앱이 적용할 프리셋 미리보기를 함께 보여주도록 새로 단장했습니다.

더 견고해진 인덱싱 — 처음부터 다시 할 이유가 줄어듭니다

10TB 규모의 라이브러리를 다루다 보면 의미가 커지는, 조용한 개선들도 몇 가지 있습니다.

  • Whisper 서버 충돌 복구. 음성 인식 사이드카가 작업 도중 죽어도 진행 중이던 영상이 더 이상 사라지지 않습니다. 재시도 컨트롤러가 이를 이어받아, 이미 추출된 WAV 파일을 재사용합니다.
  • 10비트 HEVC 360도 영상 썸네일. HEVC Main 10으로 촬영된 DJI Osmo 360과 Insta360 카메라에서 썸네일 생성이 실패하던 문제가 해결됐습니다.
  • 업그레이드 후 FFmpeg 하드웨어 가속. 예전 버전에서 GPU 가속을 비활성화한 적이 있더라도, 그 설정이 업그레이드 후에도 FFmpeg을 조용히 CPU에 묶어두는 식으로 이어지지 않습니다.
  • 유료 라이선스가 슬그머니 강등되지 않습니다. 라이선스 토큰이 오프라인 상태에서 만료되면 유료 라이선스가 “평가판”으로 재분류되곤 했습니다. 이제는 유료로 유지되고, 앱이 다음에 인터넷에 연결되면 갱신됩니다.
  • 인앱 업데이트가 더 매끄럽습니다. 인스톨러는 이제 실행 중인 ClipCatalog 인스턴스가 종료될 때까지 기다린 뒤 파일을 복사합니다. 더 이상 종료와 경쟁하듯 동시에 진행하지 않습니다.
  • CPU 폴백 메시지가 더 명확합니다. 비전 사이드카가 GPU에 접근하지 못할 때, 이제는 실제로 CPU로 폴백합니다(이전 버전의 회귀 버그였습니다). 경고 문구는 “CPU/GPU 하이브리드 모드로 동작 중”과 “완전히 CPU로 폴백됨”을 구분해서, 차이를 한눈에 알 수 있습니다.

여러분이 이미 한 작업을 존중하는 평가판

무료 평가판을 사용 중이라면, 라이선스 화면이 이전과 달라 보일 겁니다. 일반적인 카운트다운 대신, 여러분이 실제로 이루어낸 것 — 얼마나 많은 영상이 인덱싱됐는지, 얼마나 많은 자료가 아직 대기 중인지, 평가 기간 어디쯤에 있는지 — 부터 보여줍니다.

이 화면에는 새 옵션도 있습니다. 바로 단 한 번만 가능한 14일 무료 평가판 연장입니다. 이메일 주소를 입력하면 추가로 2주가 주어져, 앱을 살 만한지 결정하기 전에 라이브러리 인덱싱을 마칠 수 있습니다. 신용카드도, 계정도, 자동 결제도 없습니다. 14일 무료 라이선스를 보내드리기 위한 이메일 주소만 받습니다.

이 새 디자인은 결정을 공정하게 만드는 것이 목적입니다. ClipCatalog는 라이브러리가 인덱싱되기 전까지는 유용하지 않고, 본격적인 라이브러리를 인덱싱하는 데는 원래의 평가 기간보다 더 오래 걸릴 수 있습니다. 특히 느린 하드웨어나 NAS 드라이브에서는 그렇습니다. 연장이 존재하는 이유는, 평가 기간이 단순히 작은 폴더 하나에 앱을 두었는지가 아니라 “앱이 여러분에게 잘 맞는지”를 반영하도록 하기 위해서입니다.

업데이트 받기

이미 Windows에 ClipCatalog가 설치되어 있다면, 하루 안에 인앱 업데이트 안내가 나타날 겁니다. 그렇지 않다면 0.19.0을 직접 다운로드하세요. 전체 변경 사항 목록은 변경 이력에 있습니다.

첫 번째 글은 여기까지입니다. 다음 글들은 ClipCatalog 릴리스 노트보다는 영상 관리 자체에 더 무게를 둘 예정입니다 — 수십 테라바이트 규모의 아카이브를 어떻게 정리할지, 외장 드라이브를 어떻게 통제할지, 절반만 기억나는 클립을 어떻게 찾을지 등입니다. 도움이 되실 것 같다면, RSS 피드가 가장 손쉬운 구독 방법입니다.