aimastering.dev / dev log
Post #015 · 2026-03-08

アホAIへの怒りが、設計要件になった

論理的再現性への渇望と、とんちんかん発言を壊すシステムの必要性

LLMreproducibilityrageTRIVIUMsystem design
1.

本能で片付けていいのか

「なぜ踊るのか」という問いに、「本能だから」という答えがある。

猫でも子どもでもマイケルジャクソンを聞けば体が動く。これは事実だ。 リズムへの同期衝動は人間どころか哺乳類の神経系に刻まれている。

しかし自分はそこで止まれない。

本能で片付けた瞬間に、再現性が消える。 「なぜこのビートで踊れてあのビートで踊れないのか」に答えられなくなる。 感情論では設計できない。

仕事柄、論理的なロジックが見えないと動けない。 再現性がないものは自分の中で「存在しない」に等しい。 それは弱点かもしれないし、この開発の原動力かもしれない。どちらでもある。

問いの規模は膨大で時間はない。だからこそ、感情を設計の燃料に変換する必要があった。 その燃料の源になったのが、仕事のLLM案件での「怒り」だった。

2.

とんちんかんAIの記録

仕事でAIエージェントを使ったドリブンの仕事が増えた。クライアントへの提案、構造化、要件整理。 毎回LLMに聞く。毎回発言のたびにとんちんかんなことを言う。

「とんちんかん」の定義を正確にする。

症状実際に起きたこと
文脈の断絶前のターンで確認したはずの制約を3ターン後に無視して回答する。覚えていない。
自信過剰な誤答「〜です」と断言した内容が完全に間違っている。しかし語調は確信に満ちている。
問いの取り違え「この設計の問題点を指摘してくれ」と頼むと「この設計の良い点」を回答する。
平均への収束毎回「バランスが大切です」「両者にメリットがあります」という結論に着地する。
否定の消滅強く反論するつもりが「一方で、おっしゃる通りの側面もあります」と言い換えられる。

腹が立った。壊したいと思った。「壊す」は比喩ではなく、 このアーキテクチャそのものへの否定の衝動だった。 しかし壊すだけでは何も変わらない。

3.

怒りを分解する

怒りを分解すると、5つの「できないこと」が出てきた。

これはLLMへの不満リストではない。設計に欠けている構造のリストだ。

01「役割」がない

単一のモデルはすべての問いに「答えようとする」。しかし人間の専門家集団は「これは俺の領域ではない」と言う。役割の境界が品質を生む。

02「否定する義務」がない

人間はYesを言うコンサルタントを信用しない。しかしLLMはデフォルトで肯定方向にバイアスがかかっている。拒否権は設計で付与しなければ存在しない。

03「対立」がない

正しい答えは多くの場合、2つの正しい答えのぶつかり合いから生まれる。単一のモデルは自分自身と対立できない。

04「収束の条件」がない

議論は「どちらも正しい」で終わってはいけない。ナッシュ均衡——誰も一方的に動けない状態——まで進まなければ出力ではない。

05「専門分野の重み」がない

EQの問いにリミッターの専門家が答えていても検証できない。領域ごとに発言力が変わる構造が必要だ。

4.

設計要件として書き直す

「怒り」を「要件」に変換するとこうなる。

設計要件 v0.1 — LLMの怒りから導出
REQ-001: エージェントには固定された役割と領域がある
REQ-002: エージェントは拒否権を行使できる(否定の義務)
REQ-003: 複数エージェントは互いに対立する(合議の前提)
REQ-004: 収束条件はナッシュ均衡——誰も一方的に改善できない状態
REQ-005: フィールドごとに発言力(重み)が異なる
議長は存在しない。多数決ではない。平均でもない。

これは「より良いチャットボット」の設計ではない。 「チャットボットが構造的にできないこと」を設計したものだ。

5.

TRIVIUMはここから生まれた

REQ-001〜REQ-005を満たすアーキテクチャを考えたとき、3という数が出てきた。

2では対立しても収束しない(合議不能)。4以上では収束が遅くなり複雑性が増す。 3は最小の対立が成立する数だ。

エージェント役割REQとの対応
GRAMMATICA物理法則の番人REQ-001 + REQ-002(数値根拠なき提案を拒否)
LOGICA楽曲構造の解釈者REQ-001 + REQ-003(構造破壊に対立)
RHETORICA美学的表現の演出家REQ-001 + REQ-003(無個性解に対立)

REQ-004(ナッシュ均衡まで収束)とREQ-005(フィールド別重み)は 合議プロセスとスコアリングの実装として落とし込まれた。

アホAIへの怒りは感情だった。しかし怒りの正体は、設計の不在への怒りだった。

TRIVIUMは、その不在を埋めるために設計された。

「なぜ踊るのか」という問いはまだ完全には答えられていない。 しかし「なぜAIは間違い続けるのか」という問いには、設計で答えることができた。 その設計がマスタリングエンジンと接続されたとき、TRIVIUMが完成した。