如果你看過我的 VTuber 6 個月紀錄,這篇是那 6 個月技術設定的整理。
從零搭一個能穩定直播的 VTuber 直播間,我估計新手要花 8-12 小時。我寫這篇是讓你壓縮到 2 小時。
需要的東西分三層:硬體 / 軟體 / 設定。我們從硬體開始。
硬體清單(最低需求 vs 推薦)
| 項目 | 最低需求 | 推薦 |
|---|---|---|
| CPU | i5-10400 / R5 3600 | i7-12700 / R7 5700 |
| RAM | 16GB DDR4 | 32GB DDR4 |
| GPU | 內建 / GTX 1050 | RTX 3060 以上(有 NVENC) |
| 麥克風 | USB 動圈麥(如 Samson Q2U) | XLR + 介面(如 Shure SM7B + Focusrite) |
| 攝影機 | 不需要 | iPhone / Android(臉部追蹤用) |
| 網路 | 上行 5Mbps | 上行 20Mbps 有線 |
關鍵點:
- NVENC 編碼器很重要 — RTX 30 系以上的 NVIDIA 顯卡有專門的影片編碼晶片,讓 OBS 不吃 CPU。沒有 NVENC 你會用 x264 軟編,CPU 立刻 100%
- 有線網路勝於 WiFi — 哪怕只貴一條網路線
- 麥比攝影機重要 100 倍 — VTuber 不需要相機,但麥的音質決定觀眾留多久
軟體清單
必裝(免費)
- OBS Studio(obsproject.com)— 直播軟體
- VTube Studio(Steam 上,免費版有水印,Pro $14.99)— 臉部追蹤 + 模型顯示
- VoiceMeeter Banana(vb-audio.com)— 音訊路由
- Live2D Cubism Editor 免費版 — 如果你要自己 rig 模型(用別人做的話不用裝)
選裝
- OBS WebSocket plugin — 讓觀眾留言可以觸發特效
- VLC — 播 BGM,比 OBS 內建播放器穩
- NVIDIA Broadcast — 降噪 / 去回音(有 NVIDIA 顯卡才能用)
OBS 場景設定
新手最常犯的錯誤是「只有一個場景」,然後在那個場景裡塞所有東西。直播當下要切換內容會手忙腳亂。
我固定下來的 5 個場景:
場景 1:Starting Soon(開台前)
- 背景圖(可動 .webm 或靜態)
- 文字:倒數計時 / "Starting soon..."
- BGM(VLC 播放器)
開台前 5-10 分鐘掛這個,讓早到的觀眾不要看到你在調 OBS。
場景 2:Just Chatting(雜談主場景)
- Live2D 模型(右下,大)
- 攝影機畫面(不需要的話省略)
- 聊天室 overlay(右側)
- 訂閱 / 追蹤通知 overlay
- 麥音量視覺化(讓觀眾知道音訊還在)
最常用的場景,你大部分時間在這。
場景 3:Game(遊戲)
- 遊戲擷取(全螢幕)
- Live2D 模型(左下,小)
- 聊天室 overlay(透明)
玩遊戲時切到這個。
場景 4:BRB(暫離)
- 暫離畫面(動圖 + 文字)
- BGM(降音量)
- Live2D 模型(可選)
去廁所、回應 Discord 訊息、技術故障時切換。有 BRB 場景的直播看起來專業很多。
場景 5:Ending(結尾)
- 結尾畫面 + 文字「謝謝大家」
- 下次直播時間
- Discord / Twitter 連結
- BGM
直播結尾掛這個 1-2 分鐘,讓觀眾看完通知 + 跟上你的下個平台。
OBS 編碼器設定(防止掉幀的關鍵)
進 OBS → Settings → Output → Output Mode: Advanced
推薦設定(NVIDIA 顯卡有 NVENC)
Encoder: NVIDIA NVENC H.264 (new)
Rate Control: CBR
Bitrate: 4500 Kbps (1080p 30fps)
6000 Kbps (1080p 60fps)
2500 Kbps (720p 30fps)
Keyframe Interval: 2 seconds
Preset: Quality
Profile: high
Look-ahead: OFF (省 CPU)
Psycho Visual Tuning: ON
GPU: 0
B-frames: 2
為什麼 CBR:固定比特率,網路上傳穩定。VBR 在動態場景會爆。
為什麼 keyframe 2 秒:YouTube / Twitch 都要求 2 秒以下。
沒 NVIDIA 顯卡的話(x264 軟編)
Encoder: x264
Rate Control: CBR
Bitrate: 3500 Kbps (1080p 30fps 偏低)
CPU Usage: veryfast (新手別碰 medium / slow)
CPU 會吃很重,veryfast 是新手底線,不要試圖追品質。
Live2D + VTube Studio 串接
Step 1:模型放進 VTube Studio
VTube Studio 預設模型路徑:
Steam\steamapps\common\VTube Studio\VTube Studio_Data\StreamingAssets\Live2DModels\
把 Live2D model 資料夾(裡面有 .moc3 / .model3.json)拖進去。
Step 2:校正臉部追蹤
開 VTube Studio → 模型選你的 → 點右下相機按鈕 → 用手機 APP「VTube Studio」當 face tracker(免費版有效)
手機放在螢幕上方,距離 50-70cm。校正完成後動嘴 / 眨眼 / 點頭應該都會跟。
Step 3:把模型送進 OBS
方法 A(推薦):用 Spout / Syphon
VTube Studio Pro 才有 Spout/Syphon 輸出。Spout 是「螢幕共享 to OBS」的低延遲管道,延遲 < 16ms。
OBS 加 Source → Spout2 → 選 VTube Studio。
方法 B(免費):視窗擷取
如果你用免費版,只能用 OBS Window Capture 抓 VTube Studio 視窗。延遲約 50-80ms,可接受但不完美。
Step 4:背景去掉
VTube Studio 預設有彩色背景。設定 → Background → 透明,然後 OBS 加 Chroma Key filter 把殘留邊緣處理掉。
VoiceMeeter 音訊路由
這是最折磨新手的部分,但搞懂後永遠不會再有「我聽得到 BGM 但觀眾聽不到」的問題。
基本概念
你的電腦音訊有「輸入」(麥)跟「輸出」(喇叭 / 耳機)。VoiceMeeter 在中間多了 3 個虛擬設備:
- Voicemeeter Input — 給軟體輸出用的「假喇叭」
- Voicemeeter Aux Input — 第二條「假喇叭」(獨立路由)
- Voicemeeter Output — 整合輸出的「假麥」(OBS 從這抓)
標準設定
| 來源 | 送到 |
|---|---|
| 你的麥(實體) | Voicemeeter → 監聽耳機 + 送 OBS |
| 系統聲音(瀏覽器、遊戲) | Voicemeeter Input(觀眾聽 + 你聽) |
| Discord 聲音 | Voicemeeter Aux Input(你聽,觀眾不聽) |
| BGM(VLC 直接送) | OBS 直接吃 VLC source(不經 VoiceMeeter) |
設定步驟:
- Windows 聲音設定 → 預設輸出 → Voicemeeter Input(讓系統音都進 VoiceMeeter)
- Discord 設定 → 輸出裝置 → Voicemeeter Aux Input(讓 Discord 走獨立路由)
- OBS 設定 → Audio → Mic/Auxiliary Audio → Voicemeeter Output(OBS 從 VoiceMeeter 吃整合音)
- 你的監聽耳機 → 設成 A1(Hardware Out)
- VoiceMeeter 介面把每個輸入 routing 到 A1 + B1(B1 是給 OBS 用的)
一個常見坑
Discord 朋友會聽到你的 BGM 嗎?
如果你把 BGM 也設成預設輸出,Discord 會接到。所以 BGM 用 VLC 直接餵 OBS,Windows 預設輸出只接「系統音 / 瀏覽器」。
直播前 10 分鐘 checklist
每次開台前我會跑這個清單,避免直播當下出包:
☐ OBS 開了,正確場景在 preview
☐ Live2D 模型動作正常(眨眼、嘴型、頭部)
☐ 麥試說一句,VoiceMeeter / OBS 都有反應
☐ 系統音試播一首歌,觀眾端能聽到
☐ Discord 朋友能聽到我說話、聽不到我播的 BGM
☐ 網路測上行 > 8Mbps
☐ 電腦溫度正常(<70°C)
☐ 手機 face tracker 連線穩定
☐ 直播平台(YouTube / Twitch)後台輸入正確 stream key
☐ 通知 Discord / Twitter「我要開台了」
10 分鐘做完這 10 項。
結束後 5 分鐘 checklist
直播結束別忘了:
☐ 停止 streaming(OBS 上方按鈕)
☐ 確認本地錄影檔有存
☐ Twitter / Threads 發「下台了,謝謝大家」
☐ 看 dashboard 留言有沒有要回應的
☐ 把錄影檔搬到「待剪輯」資料夾
我會在隔天剪精華 Shorts。趁印象還新做這件事,品質會好很多。
完整工作流(從直播到後續內容)
直播當下 → 錄影檔 → 隔天剪 1 支 Shorts → 上 YouTube + Twitter
→ 過 3-5 天剪 1 支精華長片 → 上 YouTube
詳細的剪片流程在 個人創作者的影片剪輯流水線 那篇。
結論:設定 2 小時,享受 6 個月
第一次設定真的痛苦,我那時候花了 2 週才把所有環節串穩。
但設定好以後,你 6 個月不用再碰。VoiceMeeter / OBS / VTube Studio 都是一次設定 + 日常使用的工具。
如果你卡在某一步,歡迎在 /contact/ 留言,或加入 Discord(在「🍯 支持冬蜜」彈窗裡)。技術設定的部分,有人陪走真的快很多。
下一篇我會分享 影片剪輯流水線,把直播錄影怎麼變成 YouTube 影片的完整流程寫出來。
常見問題
電腦規格至少要多好?
最低:i5 或 R5 + 16GB RAM + 內建顯卡可勉強跑。流暢:i7 / R7 + 16GB + NVIDIA RTX 30 系以上(有 NVENC 編碼)。我用 i5-12400 + 16GB + GTX 1660 撐了 6 個月,1080p 30fps 沒問題。
VTube Studio 跟 nizima LIVE 哪個好?
VTube Studio 對新手友善、社群大、外掛多。nizima LIVE 是官方的、品質穩,但相對封閉。建議從 VTube Studio 開始。
為什麼要用 VoiceMeeter?
讓你「麥克風 + 系統音 + BGM」分軌進 OBS,觀眾聽得到 BGM 但 Discord 朋友只聽得到你的聲音。少了 VoiceMeeter,你只能把麥跟系統音綁在一起播。
我家網路只有 50Mbps,夠直播嗎?
夠。直播上行需要 ~5Mbps(1080p 30fps CBR 4500)。但你的上行(Upload)要先測,有些網路上下行不對等。用 fast.com 測 upload 速度,有 8Mbps 就 OK。