在本地几秒钟内搜索数 TB 规模的视频库。
完成索引后,ClipCatalog 会将标签搜索、口语词检索、自然语言描述搜索、人脸过滤器和元数据过滤器整合到覆盖整个库的单一查询路径上。几次点击就能把成千上万的片段缩减到几十个。
无按分钟计费,无订阅。99 美元一次性授权,让你的每一段视频在每一块硬盘上都可被搜索。
“我知道它就在里面某处”的问题
一旦超过几个 TB,再好的文件夹结构也不够用。你知道那个镜头存在,却不知道在哪块硬盘、哪个旅行文件夹、哪场采访的哪一条素材里。没有覆盖整个库的搜索,你只能不断滚动。用 ClipCatalog,你只需提出一个查询,正确的片段几秒钟就会出现。
没有覆盖整个库的搜索时
- 你知道那个镜头存在,但不知道在哪块硬盘、哪一年文件夹里
- 云 SaaS 费用随库的规模增长,而你恰恰在这种规模下最需要搜索
- 单一用途的工具要么索引标签,要么索引转写文本,要么索引人脸,从不会同时处理
使用 ClipCatalog
- 一个搜索框覆盖所有文件夹、所有硬盘和多年的素材
- 在一次查询中同时组合标签、口语词、人脸和日期范围
- 保存的预设让常用的多层过滤查询变成一键调用
覆盖全库的视频搜索如何运作
在 TB 级规模上需要同时满足三件事:每个片段都能从同一个搜索框抵达,所有检索方式都使用同一份索引,索引在硬盘重新组织后仍能保留下来。ClipCatalog 把这三件事都放在本地完成。
视频搜索 →指向每一个文件夹
添加内置硬盘、外接 SSD、NAS 共享和归档盘。ClipCatalog 按存储卷分别跟踪它们,因此目录在硬盘移动、重命名以及拔插循环后依然保留。当你只想索引目录的一部分时,可以排除子文件夹。
本地 AI 建立索引
缩略图提取、AI 视觉打标、Whisper 转写、人脸检测以及用于自然语言搜索的向量嵌入,全部在你的硬件上运行 — 可用时使用 DirectML 或 Vulkan,否则回退到 CPU。第一遍是一次性成本;此后每次搜索都打在本地索引上。
叠加过滤器进行搜索
把标签、转写、人脸、素材类型和元数据等过滤器叠加在同一个查询里。每加一个过滤器,结果集就再收窄一层——1 万段视频的库可以在几秒内缩到一小撮。任何你打算反复用的组合都可以存为 预设,下次搜索只要一次点击。
终于变得轻松的全库搜索
六个示例展示了覆盖整个库的检索在实际中是什么样 — 从一个单独的视觉标签,到一次性叠加四个过滤器的保存预设。每个例子都假定索引已经建好;之后,查询本身才是最容易的那部分。
谁会去搜索 TB 级视频库?
六种现实档案形态,一旦你停止滚动开始查询,覆盖全库的搜索就立刻显出价值。
拥有跨越十年的已索引内容的广播新闻档案库
约 40 TB、8 万段素材、四间新闻部剪辑间每天都在调用素材。当突发新闻出现时,问题永远是:“关于这个人、这个地方、这场事件,我们手里已经有什么?”人脸过滤器 + 单词转录搜索 + 日期范围,能在十年的报道素材里几秒钟给出答案。
拥有跨越数十年、版权已清算的素材库
几十万段素材,每一段都按画面里出现的内容打标。买家带来非常具体的需求("黄金时刻沿海的慢动作航拍")。Strict 严格度的自然语言描述搜索 + 风景空镜镜头类型过滤器 + 无人机过滤器,一次查询就能把几十万段素材压缩到一份可授权的短名单。
覆盖取证、执法记录仪与监控视频的法务电子取证
取证阶段共有 25 TB 的录像 — 证言、执法记录仪片段以及社区监控视频转储。对方律师提出一个问题,团队需要在不把封存资料上传给第三方的前提下,迅速找到所有出现某个特定词的片段。先在整体上做单词转录搜索,再按日期范围和说话者人脸进一步收窄。
覆盖多个赛季比赛与训练视频库的体育数据分析
五个赛季完整比赛的多机位录像加上日常训练素材合起来是数十 TB。分析师需要的是“我们输掉的比赛里,由球员 X 发起的所有反击”——人脸过滤器 + 该动作的标签搜索 + 标注败场的元数据过滤器,一次查询就能把多年的素材浓缩为一段聚焦的分析剪辑。
跨度达十年的高校媒体实验室与科研影像档案库
80 TB 的实验记录:行为实验、显微镜拍摄、田野工作、延时摄影装置。下一篇论文需要与过往研究可比的画面 — Balanced 严格度的自然语言描述搜索 + 日期范围过滤器,会把过去十年里每一次可比的实验都翻出来,不必让一位博士生花两周翻找外置硬盘。
存放已完成客户项目的后期归档库
按合同要求的保留期归档的八年已完成项目——总量远超过 100 TB。制片人回来要“2024 年春季美妆推广活动的生活方式那段剪辑”,一个把客户标签 + 项目日期范围 + 无对白镜头类型组合在一起的保存预设,即便档案大多在冷盘上,也能在几秒钟内交回正确的那段素材。
在 TB 规模下可以预期什么
大型库会给索引流水线的每一步施加压力。ClipCatalog 围绕在 TB 规模下真正重要的取舍来构建 — 以下是诚实的实情。
首次索引是最大的成本
对于数 TB 规模的库,可以把第一遍索引安排在通宵或周末进行。完成之后,增量同步只处理新增内容。可随时暂停和继续 — 进度都会保留。
硬件设置让速度由你掌控
可以分别选择用于内容分析的 GPU、用于 Whisper 转写的 GPU 以及用于人脸检测的设备。运行内置基准测试,ClipCatalog 会为你的机器推荐最快的配置。
即使超过 10 万段,搜索时延仍然可用
索引建立在本地向量数据库和针对快速查询调优的加密 SQLite 目录之上。在两万段素材的库上,对单个标签或单个词的查询会在数秒内返回首批结果;当库再翻一倍时,响应仍能跟得上。
组合过滤器让结果列表保持可管理
拥有一万段素材的库不一定要给你一万条结果。把标签、转写文本、人脸、镜头类型和元数据过滤器叠在一起 — 每加一个过滤器,集合就再收窄一些,真正要找的那一小撮在几秒内就浮现出来。
四种检索方式,一座库
标签搜索使用可枚举的 AI 词表;口语词搜索可在转写文本中以 Match-All / Match-Any 查找单词;自然语言搜索按 Relaxed/Balanced/Strict 严格度根据自由描述对片段排序;人脸搜索按从检测到的人脸聚类出来的人物筛选。选择最适合当下问题的模式。
目前仅支持 Windows
ClipCatalog 运行在 Windows 10 和 11 上。应用会自动挑选最快的硬件路径 — DirectML、Vulkan、OpenCL 或 CPU — 但近期路线图中不包含 Mac 与 Linux 版本。
“TB 规模”到底是什么样
在具有代表性的硬件(较新的 Vulkan 级 GPU、NVMe 目录盘)上的数量级估算。具体数字会随编解码组合、模型大小和存储速度变化 — 把它当做规划的尺度,而不是一份硬性 SLA。
具有代表性的测试库
约 24 TB 源视频、约 3,000 小时,分布在三块内置硬盘和一处 NAS 共享上。下面的数字是针对这种规模库的数量级规划模型 —— 你的真实数字会随编码格式组合、硬件和启用的 AI 阶段而变化。
首批结果延迟
在参考机器上,对完整 2 万段索引做单标签查询,2-5 秒内就能返回首批结果。每多叠一层过滤器只增加不到一秒;最慢的通常是自然语言向量检索。
目录在磁盘上的占用
缩略图、AI 标签、转录、人脸数据和语义向量都会在源视频之外占用额外存储。设置 → 存储使用 界面按分类实时显示当前 MB 总量——首轮索引完成后,用实际占用值来规划,而不是依赖估算值。
首次索引耗时
对于数 TB 规模的库,把首次摄入安排成夜间或周末的后台任务来计划 —— 索引耗时强烈受编码格式组合、GPU 等级以及你启用了多少 AI 阶段影响。流水线可恢复,重启与换硬盘都不怕。
增量同步成本
首次跑完之后,只有新增或变动的片段才会再走一遍 AI 流水线,已建好的索引永远不会重建。日常同步在活跃使用的库上通常几分钟内就能“追上最新”,哪怕底层档案是 TB 规模。
搜索一个 10 TB 档案的经济账
云端转写服务通常按每分钟音频 $0.005-$0.024 收费。在一份数 TB 的档案上 —— 那已经是数百小时的源素材 —— 光是跑一次转写就能跳到四位数美元 — 这还不算存储分层费、按席位的搜索许可,或者 egress(云端 egress 费每 GB $0.05-$0.09,如果你哪天要把这 10 TB 拿回来,再加 $500-$900)。账单随库膨胀;留得越久,账算得越难看。
ClipCatalog 在你已经拥有的硬盘上导入,使用你本来就有的 GPU 在本地建立索引,并把所有内容存进你机器上一座 SQLCipher 加密的 SQLite 数据库。99 美元一次性付费。没有带宽、没有 egress、也没有订阅费。50 TB 的库和 5 TB 的库授权费完全相同;占大头的成本是你早就拥有的存储硬件。
正在比较面向大型档案的“本地优先”工具?参阅 隐私优先视频管理工具盘点,看看 ClipCatalog 在 TB 级摄入、覆盖整库的搜索和离线工作流上的表现。
搜索大型视频库 — 常见问题
ClipCatalog 能处理多大规模的库?
它面向跨多个文件夹、硬盘和卷的数 TB 规模档案而设计。目录数据库、向量索引和任务队列都为可扩展性考虑过;在一台现代 PC 上,实际上限主要是缩略图与向量所占的磁盘空间,而不是一个固定的视频数量。
首次索引一个 TB 级的库需要多长时间?
首次耗时高度依赖硬件、编解码组合,以及你启用了多少 AI 阶段。数 TB 规模的库通常更适合在装有 GPU 的 PC 上把第一遍放在通宵或周末完成。索引完全可恢复。
随着库变大,查询还能保持快速吗?
可以 — 这正是架构所围绕的点。标签和转写文本检索使用本地 SQLite 目录中的索引列;语义和人脸检索使用本地向量索引。两者都被设计为在库不断增长时依旧保持快速,所以同样形态的查询,5 万段素材的库只比 5,000 段的库慢一点。
可以保存过滤器组合,免得每次都重新搭起来吗?
可以 — 保存搜索预设是核心功能之一。把标签搜索、转写文本单词过滤器、人脸过滤器和日期范围打包成一个命名的预设,下次一键就能再次运行。即便库随着时间变大,预设依旧保持有意义。
我真的能在一次搜索里把标签、转写文本、人脸和元数据过滤器组合在一起吗?
可以。Visual、Audio、Metadata、Location、Technical 这几个类别下的过滤器都作用在同一份结果列表上。每一个都会把不满足条件的匹配剔掉,于是多层叠加之后,五位数的结果列表会很快缩到可管理的几条。
随着库规模扩大,收益最大的功能
有三类能力随着规模增长,回报会不成比例地放大:把重复查询变成一键操作的保存预设;在你应用其他过滤器之前就把对白、画外音和风景空镜分开的镜头类型分类;以及把标签、转写、人脸、元数据叠加在同一个查询里的统一搜索栏。
视频搜索
保存预设,以及让标签、转写、人脸、元数据过滤器汇聚成同一个查询的统一搜索界面 — 真正在整个库上做过滤的那块工作区。
检测到的内容
自动生成的标签词表被设计为在库不断增长时依旧保持快速 —— 在 10 万段素材的库上做标签搜索的体感,应当和 1 万段时差不多。
记录检索
本地 SQLite 目录中的索引列让单词转写文本检索在数十万段素材上依然保持快速。多个单词的 Match-All / Match-Any 以同样的方式组合。
人脸识别
人物聚类能跟得上库的增长:同一个人的新片段会挂到已有的人物组上,所以无论库变多大,找出所有出现某张常见面孔的片段,永远是一次点击的事。
相关比较
如果你正在将这一工作流程与其他工具比较,请先查看这些并排对比页面。
其他以问题为中心的指南
免费试用 ClipCatalog — 最多可索引 500 个视频
无需注册账户。您的视频素材将始终保存在您的电脑上。