aimastering.dev / dev log
Post #022 · 2026-03-08

TikTok・YouTubeでABテストを設計した

20パターン、1分、映像付き。

そして決定的なデータが手に入った——(続く)

AB testTikTokYouTubereelsdata1min
1.

次の問いは「何が機能するか」だった

Beatport 110件は「構造は機能する」を証明した。

しかし110件の購買者が何に反応したかは、まだわからない。 曲の構造か、タイトルか、ジャンルタグか、アルゴリズムの偶然か。 再現性を確保するには、変数を特定する必要があった。

「ABテストを音楽に適用する」——自分の仕事では当たり前の手法だ。 なぜ今まで音楽に使わなかったのかが、そもそもおかしい。

2.

設計——4軸、20パターン

変数を4軸に分解した。1分の尺に限定したのは、 プラットフォームのリテンション測定が最も精度高く取れる長さだからだ。 全パターンに映像を付けた——映像なしのテキスト投稿との比較は別フェーズとした。

A — 曲の構造スクロール離脱率に最も影響すると仮定した変数
A: ビルドアップ優先(:00–:30)B: ドロップ先行(:00–:10)C: 静寂スタート(8小節無音→爆発)
B — 映像の質感音との一致感がリテンションに影響すると仮定
A: AI生成・抽象的サイケデリックB: 実写風・自然/水C: 和テイスト・筆・墨
C — タイトル言語プラットフォームごとのレコメンドアルゴリズムへの影響を観測
A: 日本語のみB: 英語のみC: 日本語+ローマ字
D — 投稿時間帯サイケデリック・トランスのコアリスナー地域がどこかの検証
A: 日本時間 20:00–22:00B: ヨーロッパ時間 20:00–22:00 CETC: 両プラットフォーム同時
3 × 3 × 3 × 3 = 81パターン理論値 → 実用20パターンに絞り込み(重複・無意味な組み合わせを除外)
3.

実行——TikTokとYouTubeリール、同時展開

TikTokとYouTube Reelsに同じパターンを並行投稿した。 プラットフォームごとのアルゴリズム差異も観測変数に入れた。

項目TikTokYouTube Reels
投稿数20パターン20パターン(同一)
60秒固定60秒固定
映像パターン別・同一素材パターン別・同一素材
測定指標完全視聴率・保存率・シェア率視聴維持率・クリック率・インプレッション
観測期間投稿後72時間投稿後72時間
4.

決定的なデータが手に入った

72時間後、データが出た。

「決定的」と書いたのは誇張ではない。 20パターンの中に、他と比較にならない数値を叩き出したパターンがあった。 そしてそのパターンが示した変数の組み合わせは—— 自分が「当たるはず」と思っていたものではなかった。

データの詳細は次の投稿で公開する。

#023 へ続く