SubtitleOCR

快如闪电的硬字幕提取工具。仅需苹果M1芯片或英伟达3060显卡即可达到10倍速提取。A very fast tool for video hardcode subtitle extraction

278
13
Swift

望言OCR

望言OCR是一款快如闪电的硬字幕提取工具,旨在加速AI时代下的视频硬字幕数据挖掘工作。

您只需一台具有普通M芯片的Mac,或者一台搭载3060级别显卡的Windows电脑,便能达到10倍速以上的硬字幕提取速度。

商业化版本

望言OCR的最后一个免费版是v1.3,商业版已经更新到了v2.1,功能特性如下:

功能特性 免费版v1.3 商业版v2.1
高速提取
极速提取
(Boost加速功能)

(可提高约100%识别速度)
自研模型
中文空格识别
(通过自研模型"望言v2"实现)
中文繁体识别
(通过自研模型"望言v2"实现)
甄别错误识别结果
批量提取
多格式导出

关于商业版与免费版的性能区别,及其与第三方工具的性能比较,您可参考下方的列表:
(x后面的数字表示能达到几倍速,例如x10代表10倍速,即10分钟的视频在1分钟内处理完毕)

测试平台 VSE 雨伞OCR 望言OCR
(免费版v1.3)
望言OCR
(商业版v2.1)
M1 Macbook Air x1.6 x2.4 x10.5 x22.1
M2 Macbook Air x1.8 x2.9 x14.9 x29.6
M3 Macbook Pro x2.1 x3.5 x21.7 x51.9
NVIDIA RTX 3060(with Intel I5 12400) x3.3 x4.2 x15.2 x32.5
NVIDIA RTX 4070(with AMD R7 5800X) x4.7 x5.9 x24.1 x48.8

备注:测试视频为一段45分钟的含有中英双语字幕的mp4视频,您实际运行的速度可能受具体视频、CPU性能和GPU型号的影响,但不会有太多偏差。


更多功能,您可下载商业版试用:

Mac:https://apps.apple.com/cn/app/望言ocr/id6738074717?mt=12

Windows:https://pan.baidu.com/s/1muf9eM9BtGFKKtMCQpZ6WQ?pwd=w2ei

对应的视频教程:https://www.bilibili.com/video/BV1FUAHehEns/?vd_source=48fff58090109fe7eb61febbc62c153b

免费版目前不再更新,商业版目前处于一个较低的价格,随着功能的越来越多会逐步涨价,现在入手即可以一个比较低的价格锁定权益。

下载开源版本

Mac用户:

点此处下载mac版APP

Windows用户:

点此处下载Windows版APP

使用教程

可在哔哩哔哩观看使用教程(Windows/MacOS通用)。

修改与定制

如需二次开发,请见此处教程

鸣谢

PaddleOCR:https://github.com/PaddlePaddle/PaddleOCR