← MentorAI GPU 工作紀錄

StudioV1 2026-06-21 Demo:授權聲音教學影片工作紀錄

這頁專門記錄 MentorAI StudioV1,不是 studio2/v2。把這次「參考影片分析 → 逐字稿 → 分鏡腳本 → 人物設計 → 授權聲音 → 影片生成 → 驗收」完整攤開,讓 demo 進度可視、可回放、可比較。

Demo target 2026-06-21 Updated 2026-06-14
Asia/Taipei

目前狀態

Demo 倒數
7 天
6/19 必須凍結可播放備援版
影片素材
可回放
已有 1080p + AAC 備援 MP4
授權聲音
已建檔
provider 尚待選定與接入
程式狀態
通過
API typecheck pass

可回放素材

Current backup: childhood-wonder

定位
StudioV1 目前備援影片,作為 demo safety net;新版黑板/授權聲音完成後替換 final。
檔案
backup-current-childhood-wonder.mp4
規格
1920x1080, H.264 video, AAC audio
長度
70.83 秒
驗證
已用 ffprobe 確認 video/audio streams。
下一步
生成授權聲音 MP3 後,重跑 StudioV1 黑板版,放入同一頁比較。

版本比較

目前備援版

已有可播放的 StudioV1 影片,可在 6/19 前作為不被遠端模型卡住的 demo backup。它證明 renderer、音畫合成、Pages 發布都可走通。

playable 1080p not final style

目標最終版

StudioV1 黑板講解版、分段教學旁白、授權老師聲音或明確 fallback。最終 demo 會播放此版本,並展示從逐字稿到影片的完整證據鏈。

blackboard authorized voice provider pending

一週倒排

06/14
計劃與資產鎖定

建立執行計劃、demo 包、聲音授權資料夾、備援 MP4。

06/15
Voice provider 決策

選 provider,產出 segment 01 授權聲音 sample。

06/16
八段聲音產出

完成 segment-01 到 08 MP3,或鎖定 Edge-TTS 備援。

06/17
重跑黑板視覺

生成新插圖與 slide,確認文字沒有溢出。

06/18
第一支完整候選片

ffprobe 驗證音畫,記錄 review notes。

06/19
備援凍結

demo package 必須可離線播放,不再賭模型。

06/20
彩排與修細節

5 分鐘 talk track、10 分鐘 Q&A notes。

06/21
Demo day

播放 final MP4,展示證據鏈與下一步 roadmap。

可視工作流

1. 參考影片

YouTube 影片、音訊、截圖與逐字稿已落在內部 `storage/research/v2EN9GVEeMc/`;公開頁只放分析與工作證據,不公開完整逐字稿。

2. 教學分析

抽出黑板教法、題解、字詞、修辭與「觀察力 + 想像力」主軸。

3. 原創腳本

每段拆成原文、focus、board notes、narration、visual prompt。

4. 人物設計

現代國中國文老師;聲音授權與肖像授權分開記錄。

5. 聲音生成

優先讀取授權聲音 MP3;缺檔時可 fallback Edge-TTS。

6. 影片合成

StudioV1 使用 SVG 黑板 slide + segment MP3,自動依音訊長度組 final MP4。

完整紀錄與證據

類別 檔案 / 資產 狀態 用途 下一步
執行計劃 2026-06-21-demo-execution-plan.md ready 每日里程碑、critical path、fallback、驗收標準。 每日更新實際完成狀態。
Demo 講稿 demo-walkthrough.md ready 5 分鐘 demo flow 與 backup talking point。 6/20 彩排後收斂。
聲音授權 voice-rights-summary.md ready 說明授權資料夾、生成規則與商用前補件。 補 signed consent 或 email 截圖。
Voice manifest training-manifest.json ready 描述 cleaned WAV、duration、sample rate 與使用模式。 接 provider 後回填 provider voice id。
Voice config voice-model.json provider pending provider-neutral 生成設定與 fallback。 選定 provider 後填入 provider / voice id。
驗證紀錄 verification-current.md ready 目前備援 MP4 的 ffprobe 證據。 final MP4 出來後新增正式 verification。
工作流範例 v1-teaching-video-workflow.example.json ready 機器可讀的分鏡/角色/授權聲音架構。 補滿 8 段正式 storyboard。

檔案入口

Demo 驗收 Checklist

  1. API typecheck 通過。
  2. Final MP4 存在並可播放。
  3. Final MP4 有 video/audio stream。
  4. Segment 01-08 slides 存在。
  5. 黑板文字不溢出。
  6. 聲音模式有記錄:authorized clone 或 fallback TTS。
  7. 授權聲音紀錄存在。
  8. Demo walkthrough 已彩排。
  9. 6/19 前備援 MP4 已凍結。
  10. 所有 demo 檔案都在 `storage/demo/2026-06-21/`。