#0062026-03-08Yomibito Shirazu

「透明なスタジオ」——アルゴリズムを見せる3層構造

スキャン・合議・物理演算の完全公開がなぜ最強の営業資料になるか

visualizationplaygroundDSPTRIVIUMtransparencyUX
1.

問題——「魔法の箱」の罠

「このAIで処理したら音が良くなった」——それだけを示すサービスは全員やっている。差別化できない。

問題はもっと根深い。なぜ良くなったのかを説明できないサービスは、 法人エンジニアの信頼を得られない。「魔法の箱」に月額を払うのは個人ユーザーだけだ。 TuneCoreの技術部門が導入判断をするとき、彼らが見るのは音ではなくアーキテクチャだ。

透明性は思想ではなく工学的戦略だ。プロセスを見せることが、そのまま差別化になる。

2.

3層構造の完全公開

aimastering.devのプレイグラウンドは3つの層を順番に見せる。

Layerコンポーネントユーザーに見せるもの
1Gemini Scan全曲スキャン結果——LUFS・RMS・周波数帯域・セクション構造・ジャンル推定をJSON形式で完全表示
2TRIVIUMGRAMMATICA / LOGICA / RHETORICA 3者の議論ログと重み付き合議結果(consensus_minutes)
314-Stage DSP各段のパラメータ——LR crossover係数、EQ gain、limiter threshold、dither設定まで全開示
3.

Layer 1: Geminiスキャン

GeminiはMP3/WAVを受け取り、dynamic_mastering_formplan_v2 スキーマに従ってJSONを返す。 プレイグラウンドはこのJSONをそのままレンダリングする——隠さない、加工しない。

scan_output.json (抜粋)
{
  "track_identity": {
    "genre": "Club / Techno",
    "bpm": 134,
    "key": "Am"
  },
  "whole_track_metrics": {
    "integrated_lufs": -14.2,
    "dynamic_range_lu": 8.1,
    "peak_dbtp": -0.4,
    "spectral_balance": { "sub": -2.1, "low": 0.3, "mid": -0.8, "high": 1.1 }
  },
  "macro_form": {
    "sections": [
      { "label": "Intro", "start": 0, "end": 32, "energy": 0.42 },
      { "label": "Drop1", "start": 32, "end": 96, "energy": 0.91 },
      { "label": "Break", "start": 96, "end": 128, "energy": 0.55 }
    ]
  }
}
4.

Layer 2: TRIVIUM合議ログ

3エージェントが独立して意見を出し、consensus_arbiter.py がweighted medianで統合する。 合議の議事録(consensus_minutes)はプレイグラウンドに全文表示される。

consensus_minutes.json (抜粋)
{
  "target_lufs": {
    "GRAMMATICA": -9.0,
    "LOGICA":     -8.5,
    "RHETORICA":  -8.0,
    "consensus":  -8.6,
    "method":     "weighted_median",
    "weights":    [0.55, 0.25, 0.20]
  },
  "unresolved_tensions": [
    {
      "field": "high_shelf_gain",
      "GRAMMATICA": "+0.5 dB (ceiling constraint)",
      "RHETORICA":  "+1.8 dB (presence target)",
      "note": "GRAMMATICA veto applied. Final: +0.5 dB"
    }
  ]
}
unresolved_tensions は「議論の痕跡」だ。最終値だけを見せる従来ツールとの差異がここに現れる。 RHETORICAが+1.8dBを主張し、GRAMMATICAが拒否権を発動した——そのプロセスが残る。
5.

Layer 3: 14段DSP物理演算

Blueprint JSONが確定した後、control_layer.py がセクション別DSPパラメータへ変換し、 14段のDSPエンジンが順番に処理する。プレイグラウンドは各段の入出力を表示する。

#Stage表示パラメータ
01DC Offset Removaloffset_db
02LR Crossover Splitcrossover_hz × 3 (complementary Linkwitz-Riley)
03–06Per-Band EQgain_db × 4 bands × section
07Multiband Compressorthreshold / ratio / attack / release × 4 bands
08MS Processingmid_gain_db / side_gain_db
09Stereo Widthwidth_factor (0.0–2.0)
10Harmonic Saturationdrive_db / character (tube|tape|solid)
11LR Crossover Mergemerge_gain_db
12True Peak Limiterthreshold_dbtp / ceiling_dbtp (stereo-linked)
13Oversampled TP Safetyoversample_rate / final_ceiling_dbtp
14TPDF Ditherbit_depth / noise_shaping: none
6.

透明性が営業資料になる

ホワイトラベル交渉で相手が最初に聞くのは「どんなAIを使っているか」ではない。 「なぜこの音になるのか説明できるか」だ。

観点魔法の箱型透明なスタジオ型
法人の信頼「良くなった」の主観のみアーキテクチャで説明可能
監査対応不可能Blueprint JSON + logs で完全追跡
導入障壁「中身が分からない」「中身が全部見える」
差別化なし(全員同じ主張)プロセス自体が固有資産
IP評価低い(ブラックボックス)高い(説明可能なパイプライン)
7.

「透明なスタジオ」宣言

このプレイグラウンドは「体験」を売らない。「工学的プロセスの完全公開」を売る

Geminiが何を読んだか、TRIVIUMが何を議論し何を否決したか、14段のDSPがどのパラメータで動いたか—— すべてが見える。隠す理由が何もないからではなく、隠すことが最大の弱点になるとわかっているからだ。

透明なスタジオが発するメッセージ:

"Every decision is visible. Every parameter is yours to override."

— すべての判断が見える。すべてのパラメータは、あなたが上書きできる。

← Dev Log 一覧次回: TRIVIUM命名の記録