ClipCatalog logo ClipCatalog
JA
プロダクトアップデート · · 執筆: Andreas

ClipCatalog 0.19.0 — ライブラリの状況がより見やすく、文字起こしはより速く、無料の試用期間延長も

バージョン0.19.0では、再設計された同期画面、より高速なWhisper文字起こし、4Kサムネイルの並列処理、ステージごとのGPU制御、14日間の無料試用期間延長を導入します。

ClipCatalog 0.19.0の同期画面。ステージごとの進捗、リアルタイム速度、現在サムネイルを生成中のファイル一覧を表示。
0.19.0で再設計された同期画面 — 完了したもの、いま処理中のもの、次に控えているもの、そしてアプリの処理速度がひと目でわかります。

ClipCatalog 0.19.0が本日リリースされました。これはブログの最初の記事です。皆さんがすでに動画を見つけるために(願わくば)使ってくださっているアプリの新機能から始めるのが、一番自然でしょう。

動画ライブラリのインデックス作成は、どのカタログツールでも時間がかかって地味な部分です。0.19.0のリリースノートは長いのですが、その狙いはすべて同じです。素材を最初に通す処理を、見ていてわかりやすく、終わるのが速く、途中で予想外のことが起こりにくいものにする、ということです。

特に目立つ点が3つあります。

いま実際に何が起きているのかが、もっとはっきりわかる

同期画面は、いちばん長く眺めることになる画面です。その表示が大幅に率直になりました。文脈もなくじわじわ伸びていく1本の進捗バーの代わりに、完了いまの3列が表示され、「いま」列の中には、まさにこの瞬間に処理されているファイルが並びます。

各ステージはそれぞれ独自のパーセンテージを表示します。リアルタイムの処理速度(上のスクリーンショットの8.3×は「実時間1秒あたり8.3秒分の動画をインデックスしている」という意味)も確認できます。画面上部に表示される残り時間の見積もりは、ファイルあたりの一律な見積もりではなく、あなた自身のマシンが実際に出している速度に基づいています。

「これって止まってる?」と思ったことがある方も、いまならその答えはずっと出しやすくなっているはずです。速度の数字が動いているか、動いていないか、それだけのことです。

より速く、より賢い処理

ここで3つの変更が積み重なります。

  • 新しいWhisper文字起こしモデル。 ClipCatalogは、従来のq5量子化版に代わってWhisperのq8量子化版を使うようになりました。CPUでは約5倍高速になっています。これは主に、新しい量子化がOpenBLASとずっと相性がよいからです。GPUでは以前よりわずかに遅いだけですが、文字起こしの精度は明らかに向上しています。とくにノイズの多い音声、訛り、英語以外のいくつかの言語で顕著です。モデルサイズは約850 MBで、0.19.0を初めて起動したときに自動的にダウンロードされます。古いモデルはディスク容量を空けるために削除されます。
  • サムネイルの並列デコード。 4K以下の解像度の動画では、ClipCatalogはサムネイル抽出時にフルデコード処理を複数同時に走らせるようになりました。キーフレームが十分にない動画 — つまり、これまでサムネイル処理のボトルネックになりがちだったタイプ — では、品質を落とさずに実感できる高速化が得られます。
  • 文字起こし向けGPUの既定選択が、より賢くなりました。 内蔵GPUと外付けGPUの両方を備えたシステムでは、ClipCatalogは適切な場合に内蔵GPUを文字起こし用に優先して選ぶようになりました。直感には反しますが事実です。最近の内蔵GPUは、同世代の外付けカードよりもWhisperをかなり高速に走らせます。ボトルネックは演算能力ではなくメモリ帯域だからです。もちろん、お好みのGPUを手動で選ぶこともできます。

最後の点は、より大きな変更の一部です。ステージごとのGPU指定です。タグ付け、顔検出、文字起こし、画像検索のそれぞれを別々のGPUに割り当てられます。ノートPCにiGPUとdGPUの両方があるなら、すべての処理を同じカードに通すのではなく、それぞれのステージを別のGPUに割り当てて並列に走らせられます。ベンチマークダイアログも刷新され、ワークロードごとの速度ピルや、アプリが適用するプリセットのプレビューが表示されます。

より堅牢なインデックス作成 — やり直す必要が減ります

10 TB規模のライブラリになるとありがたみがわかる、控えめな改善もいくつかあります。

  • Whisperサーバーのクラッシュからの復帰。 文字起こしsidecarがジョブの途中で落ちても、進行中の動画はもう失われません。リトライコントローラーがそれらを引き継ぎ、すでに抽出されたWAVファイルを再利用します。
  • 10ビットHEVCの360度動画サムネイル。 HEVC Main 10で撮影されたDJI Osmo 360やInsta360の素材は、これまでサムネイル生成に失敗していました。いまは動作します。
  • アップグレード後のFFmpegハードウェアアクセラレーション。 古いバージョンでGPUアクセラレーションを無効にしたことがある場合でも、その設定がアップグレード後に引き継がれて、知らないうちにFFmpegがCPU動作のままになるということはなくなりました。
  • ライセンスが知らないうちに格下げされません。 有料ライセンスは、オフラインの間にライセンストークンが期限切れになると「試用」に再分類されることがありました。いまは有料のままです。次にアプリがインターネットに接続したときに更新されます。
  • アプリ内アップデートがよりスムーズに。 インストーラーは、起動中のClipCatalogインスタンスが終了するのを待ってからファイルをコピーするようになり、競合状態を起こさなくなりました。
  • CPUフォールバック時のメッセージが明快に。 画像系sidecarがGPUに到達できないとき、いまは本当にCPUへフォールバックします(これはリグレッションでした)。警告文では「CPU/GPUハイブリッドモードで動作中」と「完全にCPUへフォールバック」を区別するため、違いが一目でわかります。

これまでの作業を無駄にしない試用

無料試用版をお使いの場合、ライセンス画面の見た目が変わっています。ありきたりなカウントダウンの代わりに、あなたが実際に達成したこと — 何本の動画がインデックス済みか、どれだけの素材がまだ待機中か、試用期間のどのあたりにいるか — を最初に表示します。

その画面に新しい選択肢も加わりました。1回限りの14日間無料試用期間延長です。メールアドレスを入力すると、アプリを購入する価値があるかを判断する前に、ライブラリのインデックス作成を終わらせるための2週間が追加されます。クレジットカードもアカウントも自動課金もありません。14日間の無料ライセンスをお送りするためのメールアドレスだけ、いただきます。

この再設計の狙いは、判断を公平にすることです。ライブラリのインデックス作成が終わるまでClipCatalogは本領を発揮しませんし、本格的なライブラリのインデックス作成は、当初の試用期間より長くかかることがあります。低速なハードウェアやNASドライブの場合は特にそうです。延長機能があるのは、試用期間が「アプリがあなたに合うかどうか」を映し出すためであって、たまたま小さなフォルダを指定したかどうかで決まらないようにするためです。

アップデートの入手

すでにWindowsにClipCatalogをインストール済みであれば、アプリ内のアップデート通知が1日以内に表示されるはずです。そうでなければ、0.19.0を直接ダウンロードしてください。変更点の全リストは変更履歴にあります。

最初の記事はこれで以上です。次回以降は、ClipCatalogのリリースノートよりも、動画管理そのものの話を増やしていきます — 数テラバイト規模のアーカイブをどう整理するか、外付けドライブをどう破綻させずに管理するか、うろ覚えのクリップをどう探すか、といった話題です。役に立ちそうだと感じたら、RSSフィードが一番手軽な購読方法です。