如果你看過我的 VTuber 6 個月紀錄,這篇是那 6 個月技術設定的整理。

從零搭一個能穩定直播的 VTuber 直播間,我估計新手要花 8-12 小時。我寫這篇是讓你壓縮到 2 小時

需要的東西分三層:硬體 / 軟體 / 設定。我們從硬體開始。

硬體清單(最低需求 vs 推薦)

項目最低需求推薦
CPUi5-10400 / R5 3600i7-12700 / R7 5700
RAM16GB DDR432GB DDR4
GPU內建 / GTX 1050RTX 3060 以上(有 NVENC)
麥克風USB 動圈麥(如 Samson Q2U)XLR + 介面(如 Shure SM7B + Focusrite)
攝影機不需要iPhone / Android(臉部追蹤用)
網路上行 5Mbps上行 20Mbps 有線

關鍵點:

  1. NVENC 編碼器很重要 — RTX 30 系以上的 NVIDIA 顯卡有專門的影片編碼晶片,讓 OBS 不吃 CPU。沒有 NVENC 你會用 x264 軟編,CPU 立刻 100%
  2. 有線網路勝於 WiFi — 哪怕只貴一條網路線
  3. 麥比攝影機重要 100 倍 — VTuber 不需要相機,但麥的音質決定觀眾留多久

軟體清單

必裝(免費)

  1. OBS Studio(obsproject.com)— 直播軟體
  2. VTube Studio(Steam 上,免費版有水印,Pro $14.99)— 臉部追蹤 + 模型顯示
  3. VoiceMeeter Banana(vb-audio.com)— 音訊路由
  4. Live2D Cubism Editor 免費版 — 如果你要自己 rig 模型(用別人做的話不用裝)

選裝

  1. OBS WebSocket plugin — 讓觀眾留言可以觸發特效
  2. VLC — 播 BGM,比 OBS 內建播放器穩
  3. NVIDIA Broadcast — 降噪 / 去回音(有 NVIDIA 顯卡才能用)

OBS 場景設定

新手最常犯的錯誤是「只有一個場景」,然後在那個場景裡塞所有東西。直播當下要切換內容會手忙腳亂。

我固定下來的 5 個場景:

場景 1:Starting Soon(開台前)

- 背景圖(可動 .webm 或靜態)
- 文字:倒數計時 / "Starting soon..."
- BGM(VLC 播放器)

開台前 5-10 分鐘掛這個,讓早到的觀眾不要看到你在調 OBS。

場景 2:Just Chatting(雜談主場景)

- Live2D 模型(右下,大)
- 攝影機畫面(不需要的話省略)
- 聊天室 overlay(右側)
- 訂閱 / 追蹤通知 overlay
- 麥音量視覺化(讓觀眾知道音訊還在)

最常用的場景,你大部分時間在這。

場景 3:Game(遊戲)

- 遊戲擷取(全螢幕)
- Live2D 模型(左下,小)
- 聊天室 overlay(透明)

玩遊戲時切到這個。

場景 4:BRB(暫離)

- 暫離畫面(動圖 + 文字)
- BGM(降音量)
- Live2D 模型(可選)

去廁所、回應 Discord 訊息、技術故障時切換。有 BRB 場景的直播看起來專業很多

場景 5:Ending(結尾)

- 結尾畫面 + 文字「謝謝大家」
- 下次直播時間
- Discord / Twitter 連結
- BGM

直播結尾掛這個 1-2 分鐘,讓觀眾看完通知 + 跟上你的下個平台。

OBS 編碼器設定(防止掉幀的關鍵)

進 OBS → Settings → Output → Output Mode: Advanced

推薦設定(NVIDIA 顯卡有 NVENC)

Encoder:        NVIDIA NVENC H.264 (new)
Rate Control:   CBR
Bitrate:        4500 Kbps   (1080p 30fps)
                6000 Kbps   (1080p 60fps)
                2500 Kbps   (720p 30fps)
Keyframe Interval: 2 seconds
Preset:         Quality
Profile:        high
Look-ahead:     OFF (省 CPU)
Psycho Visual Tuning: ON
GPU:            0
B-frames:       2

為什麼 CBR:固定比特率,網路上傳穩定。VBR 在動態場景會爆。

為什麼 keyframe 2 秒:YouTube / Twitch 都要求 2 秒以下。

沒 NVIDIA 顯卡的話(x264 軟編)

Encoder:        x264
Rate Control:   CBR
Bitrate:        3500 Kbps   (1080p 30fps 偏低)
CPU Usage:      veryfast    (新手別碰 medium / slow)

CPU 會吃很重,veryfast 是新手底線,不要試圖追品質。

Live2D + VTube Studio 串接

Step 1:模型放進 VTube Studio

VTube Studio 預設模型路徑:

Steam\steamapps\common\VTube Studio\VTube Studio_Data\StreamingAssets\Live2DModels\

把 Live2D model 資料夾(裡面有 .moc3 / .model3.json)拖進去。

Step 2:校正臉部追蹤

開 VTube Studio → 模型選你的 → 點右下相機按鈕 → 用手機 APP「VTube Studio」當 face tracker(免費版有效)

手機放在螢幕上方,距離 50-70cm。校正完成後動嘴 / 眨眼 / 點頭應該都會跟。

Step 3:把模型送進 OBS

方法 A(推薦):用 Spout / Syphon

VTube Studio Pro 才有 Spout/Syphon 輸出。Spout 是「螢幕共享 to OBS」的低延遲管道,延遲 < 16ms。

OBS 加 Source → Spout2 → 選 VTube Studio。

方法 B(免費):視窗擷取

如果你用免費版,只能用 OBS Window Capture 抓 VTube Studio 視窗。延遲約 50-80ms,可接受但不完美。

Step 4:背景去掉

VTube Studio 預設有彩色背景。設定 → Background → 透明,然後 OBS 加 Chroma Key filter 把殘留邊緣處理掉。

VoiceMeeter 音訊路由

這是最折磨新手的部分,但搞懂後永遠不會再有「我聽得到 BGM 但觀眾聽不到」的問題

基本概念

你的電腦音訊有「輸入」(麥)跟「輸出」(喇叭 / 耳機)。VoiceMeeter 在中間多了 3 個虛擬設備:

  • Voicemeeter Input — 給軟體輸出用的「假喇叭」
  • Voicemeeter Aux Input — 第二條「假喇叭」(獨立路由)
  • Voicemeeter Output — 整合輸出的「假麥」(OBS 從這抓)

標準設定

來源送到
你的麥(實體)Voicemeeter → 監聽耳機 + 送 OBS
系統聲音(瀏覽器、遊戲)Voicemeeter Input(觀眾聽 + 你聽)
Discord 聲音Voicemeeter Aux Input(你聽,觀眾不聽)
BGM(VLC 直接送)OBS 直接吃 VLC source(不經 VoiceMeeter)

設定步驟:

  1. Windows 聲音設定 → 預設輸出 → Voicemeeter Input(讓系統音都進 VoiceMeeter)
  2. Discord 設定 → 輸出裝置 → Voicemeeter Aux Input(讓 Discord 走獨立路由)
  3. OBS 設定 → Audio → Mic/Auxiliary Audio → Voicemeeter Output(OBS 從 VoiceMeeter 吃整合音)
  4. 你的監聽耳機 → 設成 A1(Hardware Out)
  5. VoiceMeeter 介面把每個輸入 routing 到 A1 + B1(B1 是給 OBS 用的)

一個常見坑

Discord 朋友會聽到你的 BGM 嗎?

如果你把 BGM 也設成預設輸出,Discord 會接到。所以 BGM 用 VLC 直接餵 OBS,Windows 預設輸出只接「系統音 / 瀏覽器」

直播前 10 分鐘 checklist

每次開台前我會跑這個清單,避免直播當下出包:

☐ OBS 開了,正確場景在 preview
☐ Live2D 模型動作正常(眨眼、嘴型、頭部)
☐ 麥試說一句,VoiceMeeter / OBS 都有反應
☐ 系統音試播一首歌,觀眾端能聽到
☐ Discord 朋友能聽到我說話、聽不到我播的 BGM
☐ 網路測上行 > 8Mbps
☐ 電腦溫度正常(<70°C)
☐ 手機 face tracker 連線穩定
☐ 直播平台(YouTube / Twitch)後台輸入正確 stream key
☐ 通知 Discord / Twitter「我要開台了」

10 分鐘做完這 10 項。

結束後 5 分鐘 checklist

直播結束別忘了:

☐ 停止 streaming(OBS 上方按鈕)
☐ 確認本地錄影檔有存
☐ Twitter / Threads 發「下台了,謝謝大家」
☐ 看 dashboard 留言有沒有要回應的
☐ 把錄影檔搬到「待剪輯」資料夾

我會在隔天剪精華 Shorts。趁印象還新做這件事,品質會好很多。

完整工作流(從直播到後續內容)

直播當下 → 錄影檔 → 隔天剪 1 支 Shorts → 上 YouTube + Twitter
                  → 過 3-5 天剪 1 支精華長片 → 上 YouTube

詳細的剪片流程在 個人創作者的影片剪輯流水線 那篇。

結論:設定 2 小時,享受 6 個月

第一次設定真的痛苦,我那時候花了 2 週才把所有環節串穩。

設定好以後,你 6 個月不用再碰。VoiceMeeter / OBS / VTube Studio 都是一次設定 + 日常使用的工具。

如果你卡在某一步,歡迎在 /contact/ 留言,或加入 Discord(在「🍯 支持冬蜜」彈窗裡)。技術設定的部分,有人陪走真的快很多。

下一篇我會分享 影片剪輯流水線,把直播錄影怎麼變成 YouTube 影片的完整流程寫出來。

常見問題

電腦規格至少要多好?

最低:i5 或 R5 + 16GB RAM + 內建顯卡可勉強跑。流暢:i7 / R7 + 16GB + NVIDIA RTX 30 系以上(有 NVENC 編碼)。我用 i5-12400 + 16GB + GTX 1660 撐了 6 個月,1080p 30fps 沒問題。

VTube Studio 跟 nizima LIVE 哪個好?

VTube Studio 對新手友善、社群大、外掛多。nizima LIVE 是官方的、品質穩,但相對封閉。建議從 VTube Studio 開始。

為什麼要用 VoiceMeeter?

讓你「麥克風 + 系統音 + BGM」分軌進 OBS,觀眾聽得到 BGM 但 Discord 朋友只聽得到你的聲音。少了 VoiceMeeter,你只能把麥跟系統音綁在一起播。

我家網路只有 50Mbps,夠直播嗎?

夠。直播上行需要 ~5Mbps(1080p 30fps CBR 4500)。但你的上行(Upload)要先測,有些網路上下行不對等。用 fast.com 測 upload 速度,有 8Mbps 就 OK。