ClipCatalog logo ClipCatalog
ZH

在本地几秒钟内搜索数 TB 规模的视频库。

Windows 100% 本地视频处理 免费试用 · 不限时长

完成索引后,ClipCatalog 会将标签搜索、口语词检索、自然语言描述搜索、人脸过滤器和元数据过滤器整合到覆盖整个库的单一查询路径上。几次点击就能把成千上万的片段缩减到几十个。

无按分钟计费,无订阅。99 美元一次性授权,让你的每一段视频在每一块硬盘上都可被搜索。

下载免费试用版 查看价格 →
Walkthrough of the ClipCatalog search interface — switching between visual, transcript, person, and metadata filters across an indexed local video library.

“我知道它就在里面某处”的问题

一旦超过几个 TB,再好的文件夹结构也不够用。你知道那个镜头存在,却不知道在哪块硬盘、哪个旅行文件夹、哪场采访的哪一条素材里。没有覆盖整个库的搜索,你只能不断滚动。用 ClipCatalog,你只需提出一个查询,正确的片段几秒钟就会出现。

没有覆盖整个库的搜索时

  • 你知道那个镜头存在,但不知道在哪块硬盘、哪一年文件夹里
  • 云 SaaS 费用随库的规模增长,而你恰恰在这种规模下最需要搜索
  • 单一用途的工具要么索引标签,要么索引转写文本,要么索引人脸,从不会同时处理

使用 ClipCatalog

  • 一个搜索框覆盖所有文件夹、所有硬盘和多年的素材
  • 在一次查询中同时组合标签、口语词、人脸和日期范围
  • 保存的预设让常用的多层过滤查询变成一键调用

覆盖全库的视频搜索如何运作

在 TB 级规模上需要同时满足三件事:每个片段都能从同一个搜索框抵达,所有检索方式都使用同一份索引,索引在硬盘重新组织后仍能保留下来。ClipCatalog 把这三件事都放在本地完成。

视频搜索 →
1

指向每一个文件夹

添加内置硬盘、外接 SSD、NAS 共享和归档盘。ClipCatalog 按存储卷分别跟踪它们,因此目录在硬盘移动、重命名以及拔插循环后依然保留。当你只想索引目录的一部分时,可以排除子文件夹。

2

本地 AI 建立索引

缩略图提取、AI 视觉打标、Whisper 转写、人脸检测以及用于自然语言搜索的向量嵌入,全部在你的硬件上运行 — 可用时使用 DirectML 或 Vulkan,否则回退到 CPU。第一遍是一次性成本;此后每次搜索都打在本地索引上。

3

叠加过滤器进行搜索

把标签、转写、人脸、素材类型和元数据等过滤器叠加在同一个查询里。每加一个过滤器,结果集就再收窄一层——1 万段视频的库可以在几秒内缩到一小撮。任何你打算反复用的组合都可以存为 预设,下次搜索只要一次点击。

终于变得轻松的全库搜索

六个示例展示了覆盖整个库的检索在实际中是什么样 — 从一个单独的视觉标签,到一次性叠加四个过滤器的保存预设。每个例子都假定索引已经建好;之后,查询本身才是最容易的那部分。

海滩 + 日落 — 两个视觉标签的 Match-All — 跨越你所有的硬盘(标签搜索)
教程档案中的 总结 — 多年录像中的每个收尾时刻(转写文本单词搜索)
日出时分越过雾霭山谷的无人机镜头 — 用自然语言描述想要的画面(自然语言搜索,Balanced 严格度)
某张人脸 + 采访标签 + 2023 年的日期范围 — 在某一季中,某位指定人物出现的所有采访片段(人脸过滤器 + 标签搜索 + 元数据)
scenic 镜头类型 + 4K 分辨率 + 无人机 — 每一个无对白的 4K 风光广角镜头,随时可用于下一段开场(镜头类型 + 技术过滤器)
保存的预设 “客户 A — 2024 年访谈” — 人脸过滤 + dialogue-heavy 镜头类型 + 访谈标签 + 2024 年日期范围,一键即达(四种模式组合的预设)

谁会去搜索 TB 级视频库?

六种现实档案形态,一旦你停止滚动开始查询,覆盖全库的搜索就立刻显出价值。

拥有跨越十年的已索引内容的广播新闻档案库

约 40 TB、8 万段素材、四间新闻部剪辑间每天都在调用素材。当突发新闻出现时,问题永远是:“关于这个人、这个地方、这场事件,我们手里已经有什么?”人脸过滤器 + 单词转录搜索 + 日期范围,能在十年的报道素材里几秒钟给出答案。

拥有跨越数十年、版权已清算的素材库

几十万段素材,每一段都按画面里出现的内容打标。买家带来非常具体的需求("黄金时刻沿海的慢动作航拍")。Strict 严格度的自然语言描述搜索 + 风景空镜镜头类型过滤器 + 无人机过滤器,一次查询就能把几十万段素材压缩到一份可授权的短名单。

覆盖取证、执法记录仪与监控视频的法务电子取证

取证阶段共有 25 TB 的录像 — 证言、执法记录仪片段以及社区监控视频转储。对方律师提出一个问题,团队需要在不把封存资料上传给第三方的前提下,迅速找到所有出现某个特定词的片段。先在整体上做单词转录搜索,再按日期范围和说话者人脸进一步收窄。

覆盖多个赛季比赛与训练视频库的体育数据分析

五个赛季完整比赛的多机位录像加上日常训练素材合起来是数十 TB。分析师需要的是“我们输掉的比赛里,由球员 X 发起的所有反击”——人脸过滤器 + 该动作的标签搜索 + 标注败场的元数据过滤器,一次查询就能把多年的素材浓缩为一段聚焦的分析剪辑。

跨度达十年的高校媒体实验室与科研影像档案库

80 TB 的实验记录:行为实验、显微镜拍摄、田野工作、延时摄影装置。下一篇论文需要与过往研究可比的画面 — Balanced 严格度的自然语言描述搜索 + 日期范围过滤器,会把过去十年里每一次可比的实验都翻出来,不必让一位博士生花两周翻找外置硬盘。

存放已完成客户项目的后期归档库

按合同要求的保留期归档的八年已完成项目——总量远超过 100 TB。制片人回来要“2024 年春季美妆推广活动的生活方式那段剪辑”,一个把客户标签 + 项目日期范围 + 无对白镜头类型组合在一起的保存预设,即便档案大多在冷盘上,也能在几秒钟内交回正确的那段素材。

在 TB 规模下可以预期什么

大型库会给索引流水线的每一步施加压力。ClipCatalog 围绕在 TB 规模下真正重要的取舍来构建 — 以下是诚实的实情。

首次索引是最大的成本

对于数 TB 规模的库,可以把第一遍索引安排在通宵或周末进行。完成之后,增量同步只处理新增内容。可随时暂停和继续 — 进度都会保留。

硬件设置让速度由你掌控

可以分别选择用于内容分析的 GPU、用于 Whisper 转写的 GPU 以及用于人脸检测的设备。运行内置基准测试,ClipCatalog 会为你的机器推荐最快的配置。

即使超过 10 万段,搜索时延仍然可用

索引建立在本地向量数据库和针对快速查询调优的加密 SQLite 目录之上。在两万段素材的库上,对单个标签或单个词的查询会在数秒内返回首批结果;当库再翻一倍时,响应仍能跟得上。

组合过滤器让结果列表保持可管理

拥有一万段素材的库不一定要给你一万条结果。把标签、转写文本、人脸、镜头类型和元数据过滤器叠在一起 — 每加一个过滤器,集合就再收窄一些,真正要找的那一小撮在几秒内就浮现出来。

四种检索方式,一座库

标签搜索使用可枚举的 AI 词表;口语词搜索可在转写文本中以 Match-All / Match-Any 查找单词;自然语言搜索按 Relaxed/Balanced/Strict 严格度根据自由描述对片段排序;人脸搜索按从检测到的人脸聚类出来的人物筛选。选择最适合当下问题的模式。

目前仅支持 Windows

ClipCatalog 运行在 Windows 10 和 11 上。应用会自动挑选最快的硬件路径 — DirectML、Vulkan、OpenCL 或 CPU — 但近期路线图中不包含 Mac 与 Linux 版本。

“TB 规模”到底是什么样

在具有代表性的硬件(较新的 Vulkan 级 GPU、NVMe 目录盘)上的数量级估算。具体数字会随编解码组合、模型大小和存储速度变化 — 把它当做规划的尺度,而不是一份硬性 SLA。

≈2 万段素材

具有代表性的测试库

约 24 TB 源视频、约 3,000 小时,分布在三块内置硬盘和一处 NAS 共享上。下面的数字是针对这种规模库的数量级规划模型 —— 你的真实数字会随编码格式组合、硬件和启用的 AI 阶段而变化。

用秒计,不用分钟

首批结果延迟

在参考机器上,对完整 2 万段索引做单标签查询,2-5 秒内就能返回首批结果。每多叠一层过滤器只增加不到一秒;最慢的通常是自然语言向量检索。

设置 → 存储使用

目录在磁盘上的占用

缩略图、AI 标签、转录、人脸数据和语义向量都会在源视频之外占用额外存储。设置 → 存储使用 界面按分类实时显示当前 MB 总量——首轮索引完成后,用实际占用值来规划,而不是依赖估算值。

数小时到数天

首次索引耗时

对于数 TB 规模的库,把首次摄入安排成夜间或周末的后台任务来计划 —— 索引耗时强烈受编码格式组合、GPU 等级以及你启用了多少 AI 阶段影响。流水线可恢复,重启与换硬盘都不怕。

每段新片几分钟

增量同步成本

首次跑完之后,只有新增或变动的片段才会再走一遍 AI 流水线,已建好的索引永远不会重建。日常同步在活跃使用的库上通常几分钟内就能“追上最新”,哪怕底层档案是 TB 规模。

搜索一个 10 TB 档案的经济账

云端转写服务通常按每分钟音频 $0.005-$0.024 收费。在一份数 TB 的档案上 —— 那已经是数百小时的源素材 —— 光是跑一次转写就能跳到四位数美元 — 这还不算存储分层费、按席位的搜索许可,或者 egress(云端 egress 费每 GB $0.05-$0.09,如果你哪天要把这 10 TB 拿回来,再加 $500-$900)。账单随库膨胀;留得越久,账算得越难看。

ClipCatalog 在你已经拥有的硬盘上导入,使用你本来就有的 GPU 在本地建立索引,并把所有内容存进你机器上一座 SQLCipher 加密的 SQLite 数据库。99 美元一次性付费。没有带宽、没有 egress、也没有订阅费。50 TB 的库和 5 TB 的库授权费完全相同;占大头的成本是你早就拥有的存储硬件。

正在比较面向大型档案的“本地优先”工具?参阅 隐私优先视频管理工具盘点,看看 ClipCatalog 在 TB 级摄入、覆盖整库的搜索和离线工作流上的表现。

搜索大型视频库 — 常见问题

ClipCatalog 能处理多大规模的库?

它面向跨多个文件夹、硬盘和卷的数 TB 规模档案而设计。目录数据库、向量索引和任务队列都为可扩展性考虑过;在一台现代 PC 上,实际上限主要是缩略图与向量所占的磁盘空间,而不是一个固定的视频数量。

首次索引一个 TB 级的库需要多长时间?

首次耗时高度依赖硬件、编解码组合,以及你启用了多少 AI 阶段。数 TB 规模的库通常更适合在装有 GPU 的 PC 上把第一遍放在通宵或周末完成。索引完全可恢复。

随着库变大,查询还能保持快速吗?

可以 — 这正是架构所围绕的点。标签和转写文本检索使用本地 SQLite 目录中的索引列;语义和人脸检索使用本地向量索引。两者都被设计为在库不断增长时依旧保持快速,所以同样形态的查询,5 万段素材的库只比 5,000 段的库慢一点。

可以保存过滤器组合,免得每次都重新搭起来吗?

可以 — 保存搜索预设是核心功能之一。把标签搜索、转写文本单词过滤器、人脸过滤器和日期范围打包成一个命名的预设,下次一键就能再次运行。即便库随着时间变大,预设依旧保持有意义。

我真的能在一次搜索里把标签、转写文本、人脸和元数据过滤器组合在一起吗?

可以。Visual、Audio、Metadata、Location、Technical 这几个类别下的过滤器都作用在同一份结果列表上。每一个都会把不满足条件的匹配剔掉,于是多层叠加之后,五位数的结果列表会很快缩到可管理的几条。

相关比较

如果你正在将这一工作流程与其他工具比较,请先查看这些并排对比页面。

免费试用 ClipCatalog — 最多可索引 500 个视频

无需注册账户。您的视频素材将始终保存在您的电脑上。

下载免费试用版 立即购买 — $99
500 个视频免费 无需信用卡 · 无需账户 100% 本地处理 — 素材绝不离开您的电脑