覚えているのは言葉。瞬間を見つけるのは ClipCatalog。
動画のなかで誰かが話していた言葉をいくつか入力するだけで、プレーヤーはその言葉が発せられた正確な秒へとジャンプします。インタビュー、講演、ライブ配信、家族のホームビデオ──アーカイブ内のすべての音声トラックが、テキスト文書のように検索可能になります。
文字起こしは Whisper を使って、お手元の PC 上でローカルに実行されます。アップロードなし、分課金なし、クラウドアカウント不要。一度きりの 99 ドルライセンスで、文字起こし時間は無制限です。
「誰かが言っていたはず」問題
単語、名前、あるいは引用の中の特徴的な数語は覚えていても、どのファイルかは分からない。検索可能な文字起こしがなければ、手作業で見直すしかありません。ClipCatalog なら、覚えていることを入力するだけで、該当クリップが数秒で表示されます。
文字起こし検索がないと
- 誰かが重要なことを言った記憶はあるのに、どのファイルか分からない
- 1 つの引用を探すために何時間もの映像をスクラブする
- クラウドの文字起こしサービスは分課金でアップロードを要求します
ClipCatalog なら
- 単語を入力するだけで、それを含むすべての動画が正確なタイムスタンプ付きで見つかります
- 結果をクリックすれば、その言葉が話された瞬間に直接ジャンプ
- 作業しながらバックグラウンドで文字起こしが進行 — アップロードも待ち時間もなし
発話による動画検索のしくみ
発話検索を動画ライブラリ全体の Ctrl+F のように感じさせるには、正確な文字起こし、ライブラリ全体のインデックス、そして該当の瞬間への高速な経路の三つが揃う必要があります。ClipCatalog はそのすべてをローカルで処理します。
文字起こし検索 →フォルダを指定
1 つまたは複数のフォルダを追加します。ClipCatalog は動画ファイルをスキャンし、それぞれをローカル文字起こしのキューに入れます。フォルダ構成はそのまま維持されます。
ローカル Whisper が処理
ClipCatalog は whisper.cpp を同梱し、お使いのハードウェア上で実行します — 利用可能なら Vulkan GPU、なければ CPU。アップロードは一切ありません。
発話で検索
文字起こしフィルターを開き、閉会 のような単語を入力するか、閉会 + 挨拶 を両方とも必須にして組み合わせ、結果を絞り込みます。結果をクリックすれば、その単語が話された瞬間に直接ジャンプします。
簡単になる検索例
ライブラリのインデックスが完成すれば、特定の発話を探すのは一語を入力するのと同じ速さです。文字起こし検索フィルターは単語単位で検索します。複数の単語を組み合わせるときは、すべての単語を必須にして絞り込むか、どれか一語でも該当すれば該当として広く拾えます。
発話された言葉で動画を検索するのは誰?
話し言葉の録画が蓄積されているのに、一度もインデックス化されていない人すべて。具体例:
インタビュー・アーカイブを抱えるジャーナリスト
3 年分、80 時間に及ぶインタビュー素材。ClipCatalog がローカルで文字起こしし、うろ覚えの引用を検索してそこへジャンプできます。素材はノート PC から出ません。
動画版を出すポッドキャスター
ゲストが競合に触れたすべての瞬間、過去回への言及、ショート用に再利用したい一言。すべてのエピソードを一括で検索できます。
講師・コース制作者
学生から「X はどこで扱いましたか?」と聞かれたら、「第 4 週のどこか」ではなくタイムスタンプで答えられます。
証言録画を扱う法務チーム
証言録画を厳密なフレーズで検索 — 録画は法律事務所のマシンから出ないため、依頼人の素材が第三者の文字起こしサービスに渡ることはありません。
ドキュメンタリー映画製作者
3 年分のインタビュー B ロールを、特定の人物・場所・テーマが出てくるすべてのクリップで通しで漁る — 分課金もクラウドとの往復もありません。
家族の記録を残す人
年配の親族から聞いた話を、メモにはきちんと残せていない。動画には本当のバージョンがあります。「祖父が船の話をした時」を 40 時間見直さずに見つけ出せます。
発話による動画検索に期待できること
ClipCatalog の文字起こしパイプラインは、現実的で誠実であることを目指しています。始める前に押さえておきたい事実です。
多言語の文字起こし
Whisper はクリップごとに自動検出される数十の言語に対応 — 手動設定は不要です。対応言語の完全なリストは下の FAQ をご覧ください。
Windows 10/11、GPU は任意
ClipCatalog は Windows 10 と 11 で動作します。高性能な GPU があれば文字起こしは高速になり、CPU のみでも遅いながら動きます。いずれにせよ一度きりの処理で、アーカイブがインデックス化されれば検索は瞬時です。
ドライブを外していても検索可能
フォルダのインデックスが完成すれば、文字起こしは PC 上に残ります。外付けドライブを外していても、その中のクリップを検索できます — 実ファイルを再生したいときだけ接続し直してください。
SRT または TXT に書き出し
完成した文字起こしを SRT 字幕としてエディターに取り込んだり、プレーンテキストとして書き出してクリップと一緒に公開したりできます。
発話コンテンツに local-first が効く理由
発話の録画は、ドライブ上でも特に機微な内容です。エンバーゴ下のインタビュー、証言、セラピーのセッション、家族の語り。それをアップロードする文字起こしサービスは、そのインフラを信用してくれと求め、しかもデータが向こうのものになった後も信用し続けることを要求します。
ClipCatalog は Whisper をお使いのハードウェア上で実行します。動画はドライブにとどまり、文字起こしはあなたのマシン上のローカル SQLite データベースに保存されます。あなたが共有を選ぶまで、何も外には出ません。
local-first の動画ツールを横並びで比較したい場合は、privacy-first の動画管理ロードアップを参照してください。ClipCatalog がオフライン文字起こしとライブラリ全体検索でどう位置づけられるかが分かります。
発話で動画を検索 — よくある質問
これは私の動画をどこかにアップロードしますか?
いいえ。文字起こしは同梱のローカル Whisper モデルを使ってマシン上だけで完結します。初回起動時にモデルをダウンロードすれば、その後はネットワーク不要です。
対応している言語は?
数十言語 — 英語、ドイツ語、フランス語、スペイン語、ポルトガル語、ロシア語、アラビア語、日本語、韓国語、中国語普通話など。ClipCatalog はクリップごとに話されている言語を自動検出します — 手動設定は不要です。
Otter や Rev、Trint と比べて精度はどうですか?
ClipCatalog は Whisper — 複数の商用サービスが基盤としているのと同じモデル系統 — を使用しており、具体的には large-v3-turbo モデルです。これは現在の Whisper ラインナップで精度と速度のバランスが最も良いポイントです。精度は同じモデル系統を使う商用クラウドサービスと同等です。
複数の動画を一度に検索できますか?
はい、それが目的です。クラウド転写ツールは通常ファイルごとに処理しますが、ClipCatalog はフォルダ単位でインデックスを作成し、ライブラリ全体を一度に検索できます。
外付けドライブでも動きますか?
はい。ドライブはトラッキングされており、外していても文字起こしは検索できます。結果は再接続するまで「利用不可」と表示されます。
文字起こしの速度は?
ClipCatalog は Whisper モデル (large-v3-turbo) を 1 つだけ同梱しています — 速度はハードウェア次第です。最新の GPU では、文字起こしは通常リアルタイムの数倍の速さで進みます。
文字起こしを字幕として書き出せますか?
はい — 各動画の文字起こしを SRT 字幕またはプレーンテキストとして書き出せます。エディターに取り込んだり、クリップと一緒に公開したりできます。
無料体験版に文字起こしは含まれますか?
はい — 動画 500 本かつ合計 10 時間まで、文字起こし検索や顔認識を含む全機能を利用できます。アカウントやクレジットカードは不要です。
音声の質が悪い動画はどうなりますか?
Whisper は背景ノイズや訛りを従来の音声認識より上手く扱いますが、魔法ではありません。著しく歪んだ音声や小さすぎる音声は精度が落ちます。
Mac や Linux で動きますか?
ClipCatalog は現在 Windows 専用です (Windows 10 と 11)。Mac と Linux のサポートは近い将来のロードマップには入っていません。
文字起こし検索を他のすべてと組み合わせる
発話検索は、他のフィルターを重ねたときに最も力を発揮します。各レイヤーが結果リストを絞り込み、誤検出を手作業で取り除く手間を省きます。
関連する比較
このワークフローを他のツールと比較している場合は、まずこれらの比較ページをご覧ください。
関連する課題ベースのガイド
テラバイト級の動画ライブラリを検索
文字起こしのインデックスが数 TB のアーカイブの中にあるとき、本当の鍵になるのは重ねがけフィルタと保存プリセットです。大規模検索のコンパニオンガイド。
画面に映っているものから B ロールを探す
覚えているのが台詞ではないときは、文字起こしから視覚タグに切り替えましょう — 自動生成、ライブラリ全体、手作業のラベル付けは不要です。
ドライブと NAS にまたがる素材を整理
文字起こしが本当に役立つのは、カタログがすべてのドライブをカバーしてからです — ストレージ層を統合するための併読ガイドです。
動画ライブラリの中から特定の人物を探す
フォルダ、ドライブ、何年分もの素材を横断する顔検索 — 発話検索と対になる課題です。
ClipCatalog のユースケースをすべて見る
ローカル動画ライブラリで目的のものを見つけるための、課題ベースのガイドと利用者別ワークフロー。
ClipCatalogを無料でお試しください — 500本までの動画が視聴可能
アカウント不要。撮影した映像はあなたのコンピューターに保存されます。