按画面内容查找空镜。
你知道那个镜头就在你的素材库里某个地方,但要找到它,只能花上几个小时翻看素材,期望一眼认出来。ClipCatalog 在你第一次索引文件夹时,就会在本地为每一个片段自动打上标签。之后,只要叠加几个标签 —— 日落 + 海洋,或人群 + 演唱会 —— 就能从你拍过的每一次素材中拉出所有匹配的片段。几秒,而不是几小时。
没有按片段计费。没有云端上传。一张 99 美元的一次性授权,让你拥有的每个片段都能按画面里实际可见的内容来浏览。
覆盖整个媒资库,而不是单条视频
像 OpusClip 这样的工具一次只能从一条视频里切出片段。ClipCatalog 走的是反方向 — 它会索引你的整个素材库,让你从拍过的所有素材中,按标签组合调出匹配的镜头。
标签词汇,而不是自由文本猜测
标签搜索用的是一个离散且可浏览的词汇 — 你能真正深入进去 — 所以你在查询之前就知道媒资库里有什么。词汇中没法表达的少量画面,可切换到自然语言搜索,严格度有「宽松」「均衡」「严格」三档。两种搜索模式,一个本地索引。
一次付费,无按片段计费,无云端
云端 DAM 和 AI 切片服务按资产、按席位、按分钟或按月收费。ClipCatalog 是 99 美元的一次性授权 — 任何时候都可以无额外费用重新索引文件夹,你的素材也绝不会送到第三方。标签索引是你自己的,存在本地磁盘上,且加密。
「我知道我拍过类似的镜头」难题
标签搜索把 B-roll 工作彻底翻转过来:你不用再面对十二块硬盘组成的干草堆,一边拉时间轴一边指望认出那个镜头,而是从 AI 已经标记为符合筛选条件的一份候选短名单开始。从前要花一个小时才能找到的那个四秒钟咖啡杯插入镜头,如今只需一次 Match-All 点击 —— 因为每个片段在索引那一刻就已经打好了标签。
没有标签搜索时
- 十二块硬盘的原始素材,命名毫无统一标准,也无法按画面来搜
- 人工记录要花上数周,下一次拍摄一到就立刻过时
- 云端 DAM 按资产、按席位、按月计费 — 还要把你的素材放到他们的服务器上
- 你要的镜头,正好在那块已经寄回客户的 SSD 上
用 ClipCatalog 之后
- 打开「检测到的内容」筛选器,就能看到 AI 从你自己的素材里建立的标签词汇,从一个短名单出发
- 叠加合适的标签,选 Match-All,几秒内就会出现一条候选镜头结果带 — 不用拉时间轴,也不用瞎猜
- 从结果带里把需要的片段直接拖进 Premiere、DaVinci Resolve 或 Vegas Pro — 文件始终不离开你的电脑
- 之后的拍摄会在后台自动打标签,硬盘没接也照样可搜,月度账单永远不会出现
按画面内容搜索空镜的工作原理
要让按画面搜索空镜真正替代拉时间轴,需要三件事同时成立:足够好的标签、覆盖整个媒资库,以及一条不依赖文件名的查询路径。ClipCatalog 在本地把这三件事都做了。
检测到的内容 →指向你的素材文件夹
添加一个或多个文件夹 — 内置硬盘、外置 SSD、归档 NAS 都行。ClipCatalog 会扫描视频文件,把每个文件排进本地 AI 标签队列。你的目录结构原封不动。
本地 AI 为每个片段打标签
视觉模型在你的硬件上运行 — 有 GPU 用 GPU,没有就用 CPU — 为每个片段生成一组结构化标签:场景、物体、动作。不向云端上传任何内容。标签词汇是如何生成的、该选哪个模型尺寸,详见 AI 视频标签功能页。
按标签调出空镜
打开「检测到的内容」筛选器,选一个像 沙滩 这样的标签,或用 Match-All 叠加 沙滩+日落 收窄范围。如果是标签词汇没有名字的镜头,可切换到自然语言搜索,输入自由文本描述 — 严格度可在「宽松」「均衡」「严格」之间选择。
变得简单的搜索示例
标签是离散且可枚举的,所以你可以浏览媒资库里到底有什么,而不是靠猜。「检测到的内容」筛选器支持单标签和多标签查询;用 Match-All(AND)或 Match-Any(OR)组合标签。词汇中任何标签都无法描述的镜头,则交给 自然语言筛选器 接受一段自由文本描述。
谁会按画面内容搜索空镜?
凡是维护一个不断扩大、需要反复回头去翻的素材库的人。几个真实场景:
拥有多项目存档的剪辑师
三年企业、纪录片和品牌项目散落在轮转的硬盘上。无须记住哪个客户付了哪次拍摄,就能调出所有办公室内景镜头、产品特写、街道定场镜头。
需要可复用空镜的 YouTube 创作者
你已经发布过的每一条美食、健身或城市漫步视频,也都是下一条视频的备用插入素材。打一次标签,一直能复用 — 不必按片段订阅。
为原始素材建档的纪录片导演
一部包含 400 小时素材的纪录长片。无需逐盘人工记录,就能找到所有主角故乡的镜头、工坊内景、过渡风景。
调取视觉示例的课程创作者
数百节录制课程,加上屏幕分享和外景拍摄。找到每段能直观展示某个概念的镜头 — 白板、街景、某件器材 — 直接放入下一个模块。
复用拍摄素材的品牌内容团队
一次产品拍摄能撑起一年的社媒短切。无须重看整段镜头,就能找到所有新瓶身镜头、生活方式空镜、英雄特写。
维护个人素材库的素材摄影师
你自己拍摄、慢慢挖来用作作品集的素材积压。把所有剪影、空荡街道、航拍调出来,然后挑出值得收尾的那些。
空镜视觉搜索能做到什么
ClipCatalog 的标签流水线追求实用与坦诚。开始之前先了解这些事实。
速度取决于你的硬件
性能不错的 GPU 会让首次索引很快;只用 CPU 较慢但也能跑。无论哪种,每个片段都是一次性成本:媒资库索引完成后,标签搜索能在几秒内返回首批结果。
目前仅支持 Windows
ClipCatalog 目前支持 Windows 10 和 11。有 GPU 会更好,但不是必需 — 应用会自动为你的硬件选择更快的方案。
为什么空镜素材库要坚持本地优先
尚未发布的素材是创作者最敏感的资料之一。仍在保密期的客户交付物、未公开的产品镜头、未签授权的人物镜头。云端 DAM 把每个片段都上传去打标签,等于要求你永远相信他们的访问控制 — 以及他们经营策略上长期的善意。
ClipCatalog 在你的硬件上为片段打标签。视频留在硬盘里。标签存放在你电脑本地的 SQLite 数据库中。在你决定分享之前,没有任何内容离开本机。
如果你想把本地优先的视频工具放在一起对比,请看 隐私优先视频管理工具汇总,看看 ClipCatalog 在 AI 标签、语义搜索和媒资库整体检索上如何站位。
按画面内容搜索空镜 — 常见问题
这会把我的素材上传到哪里吗?
不会。打标签完全在你的电脑上进行,使用内置的本地视觉模型。模型在磁盘上后,索引和搜索都不需要联网。
这跟 OpusClip 之类的片段提取工具有什么不同?
OpusClip 这类工具是把一条长视频切成更短的片段。ClipCatalog 走的是反方向 — 它索引你整个媒资库,让你能从每一次拍摄中调出匹配的空镜。
标签搜索和自然语言搜索有什么区别?
标签搜索使用一套离散且可枚举的词汇 — 你从 AI 检测到的标签里挑选,用 Match-All / Match-Any 组合,得到精确匹配。自然语言搜索接受自由文本短语,按语义相似度对片段排序,有三个严格度档位:「宽松」「均衡」「严格」。两者都在本地运行;按你想找的镜头类型,挑合适的那种用就行。
拿到一个标签搜索的短名单后,能再继续收窄吗?
可以。在标签之上还能叠加人脸筛选、转写筛选、画面类型筛选(对白/旁白/风景)、日期范围、相机、分辨率等。每加一项筛选,结果就会再收窄。
免费试用包含 AI 标签功能吗?
可以 — 最多 500 个视频、总时长 10 小时,且完全开放所有功能,包括标签搜索、人脸检测与分组以及自然语言搜索。无须账号或信用卡。
在 Mac 或 Linux 上能用吗?
ClipCatalog 目前仅支持 Windows(10 和 11)。近期路线图中没有 Mac 或 Linux 支持。
把标签搜索和其他一切组合起来
标签搜索在和其他筛选器叠加时最强大。每加一层,结果列表都会变短,免得在几百个「差不多」的镜头里翻找。
相关比较
如果你正在将这一工作流程与其他工具比较,请先查看这些并排对比页面。
相关的问题导向指南
搜索 TB 级的视频库
当空镜档案进入多 TB 区间时,单靠标签搜索就不够了。把它和人脸、转录、元数据筛选器组合起来 — 再把组合保存为预设。
整理硬盘和 NAS 上的素材
空镜检索的前提是目录真的覆盖了每一块硬盘 — 这是把内置 SSD、外接硬盘和 NAS 整合成一个可搜索视频库的姊妹指南。
按口语内容搜索视频
在你的媒资库里找到每一次某个词、名字或短语被说出的瞬间 — Whisper 转录在本地运行,无按分钟计费。
在你的视频库中找到某个人
跨文件夹、跨硬盘、跨多年素材的人脸搜索 — 与视觉标签搜索互为搭档的问题。
面向影片创作者和剪辑师的素材库
面向跨越数月、动辄 TB 级项目的剪辑师端到端工作流 — 摄入、搜索、复看、拖到时间线。
YouTube 素材管理器
把你已经发布过的每条美食、健身或城市漫步视频,当成下一条视频的备用插入素材来复用。
免费试用 ClipCatalog — 最多可索引 500 个视频
无需注册账户。您的视频素材将始终保存在您的电脑上。