Generic TTS 平台
賣的是平台寬度
- 多聲線、多功能、多入口
- 短篇 demo 很好看
- 長篇與技術詞常在邊角露餡
- 發布與驗收通常是另一套流程
1. 戰場
如果你要的是幾十種台灣口音、開箱即用、自己點一點就出聲的 SaaS, 市場上已經有人做。但如果你要的是「這真的是我 / 我們品牌的聲音,而且長篇也撐得住」, 戰場就完全不同。
Generic TTS 平台
Authorized Voice Factory
2. 商品面
只賣聲音模型,客戶最後還是會卡在 pronunciation、長篇穩定、壞段修復與發布對帳。 我們把這些全收斂成可交付的 product surface。
Layer 1
授權確認、corpus intake、style profile、pronunciation lexicon、reference classes。
Layer 2
script normalization、segment render、failed-span rerender、mastering,不再靠人手記參數。
Layer 3
audio staging、metadata update、RSS rebuild、public bundle build、optional deploy。
Layer 4
hard gate、bad phrase registry、acceptance report、release artifacts,避免 demo 偽裝成產品。
3. 方案
目前商品化方式採 quote-based,重點先把 scope、交付與驗收寫清楚,不拿假的公開價目表充場面。
Pilot
適合先確認「這個聲音能不能被產品化」。
Production
適合 Podcast、課程旁白、研究報告、有聲簡報。
Deployment
適合內部媒體團隊、顧問公司與教育品牌。
4. 交付證據
真正可賣的商品,至少要有唯一入口、唯一 authority、唯一發布路徑,還要有發布後的 artifact。
Voice Authority
每個聲音的權限、workspace、model、reference classes 與 render preset 都收斂到同一個 contract。
audio/approved_voices/registry.json
Execution Surface
不是一堆散腳本,而是 `bootstrap-voice`、`voice-preflight`、`render-fastpath`、`publish-fastpath`、`full-fastpath`。
scripts/media_factory.py
Release Discipline
音檔、metadata、feed、public bundle、episode artwork 與 Pages deploy 已能串成一致輸出。
distribution/rss/ + website/build/public
What We Do Not Fake
self-serve SaaS、marketplace、完整 analytics 與大規模 streaming 不是現在的宣稱範圍。
operator-assisted, publish-grade
5. Roadmap
我們不會先堆漂亮 dashboard,再回頭補 acceptance。順序是先把流程產品化,再把界面和規模化補上。
30 Days
60 Days
90 Days
6. 合作入口
適合的合作不是「給我一個好聽的 demo」,而是一起定義授權、內容、驗收與發布邊界,做出真的能運營的聲音產品。