在瀏覽器裡跑 · 不上傳

把聲音與畫面，
變成乾淨的文字。

語音辨識、影片字幕 OCR、文件轉 Markdown —— 模型直接在你的分頁裡執行，檔案不離開這台電腦。繁中、英文、台語。

邊講邊出字，停下即定稿。串流模型 + 端點偵測，全程在分頁裡。

框選影片字幕區域，逐幀辨識去重，輸出 SRT。

PDF / 文件轉 Markdown，圖片一併截出。

畫面字幕與語音兩路比對，互相補正。

模型在頁面上執行

權重透過 Cloudflare 從邊緣串流到你的瀏覽器，第一次載入後就快取在本機。之後辨識在分頁內完成 —— 沒有伺服器排隊、沒有上傳、可離線。

01 載入並快取模型權重

02 麥克風 / 檔案在本機解碼

03 WASM · WebGPU 推論

04 產生 SRT / 文字 / Markdown