在瀏覽器裡跑 · 不上傳

把聲音與畫面,
變成乾淨的文字。

語音辨識、影片字幕 OCR、文件轉 Markdown —— 模型直接在你的分頁裡執行,檔案不離開這台電腦。繁中、英文、台語。

即時辨識

邊講邊出字,停下即定稿。串流模型 + 端點偵測,全程在分頁裡。

字幕 OCR

框選影片字幕區域,逐幀辨識去重,輸出 SRT。

文件轉 MD

PDF / 文件轉 Markdown,圖片一併截出。

對照校正

畫面字幕與語音兩路比對,互相補正。

模型在頁面上執行

權重透過 Cloudflare 從邊緣串流到你的瀏覽器,第一次載入後就快取在本機。 之後辨識在分頁內完成 —— 沒有伺服器排隊、沒有上傳、可離線。

01 載入並快取模型權重
02 麥克風 / 檔案在本機解碼
03 WASM · WebGPU 推論
04 產生 SRT / 文字 / Markdown