✅ 試做一個【語音助理】：結合 Python 與 Qwen3 的智慧互動體驗

✅ 試做一個【語音助理】 (Voice-Activated Assistant)

Voice-activated_assistant_py

隨著語音辨識與合成技術的成熟，打造一個專屬的語音助理已不再是難事。Voice-Activated Assistant 是一個基於 Python 開發的開源專案，利用 Qwen3-ASR 模型實現精準的語音轉文字（STT），並結合 Qwen3-TTS 技術提供即時的語音回覆。

本專案的核心目標在於「極致的互動感」與「隱私優先」。語音轉文字 (ASR) 結果僅暫存於記憶體，程式結束後自動釋放，不留任何磁碟紀錄，確保您的資料安全。

為了提供如同真人般的對話體驗，我們在程式架構上進行了多項深度優化：

🚀 極速本地推論：
- 使用 Qwen3-ASR 與 Qwen3-TTS，支援串流輸出，具備極低首包延遲。
🗣️ 純淨自然發音：
- 內建 OpenCC 簡繁轉換機制，避免 TTS 模型朗讀繁體中文時產生混淆，確保發音皆為標準的國語/普通話。同時排除帶有強烈方言口音的角色，保障溝通無礙。
🧠 智慧停頓偵測 (VAD)：
- 使用 Silero VAD，內建連續靜音判斷，精準識別一段話的結束點。
🚦 狀態機協調：
- 當 TTS 播放時自動暫停 ASR 監聽，完美解決「自己聽到自己講話」的自我回饋問題。
🤫 隱私與安全：
- ASR 處理結果全在記憶體運作，不落定磁碟。

只需幾個簡單步驟即可在本地運行：

複製專案並執行：

python src/main.py --rules config/rules.json

Voice-Activated Assistant 不僅是一個工具，更是一個展示 Python 敏捷開發與整合強大開源模型的實踐。無論是作為智慧家居的控制核心，還是日常工作中的語音助手，它都展示了 AI 落地本地端並保護隱私的最佳可能性。

歡迎造訪 chiisen/voice-activated-assistant.py 探索更多細節！🚀✨