How AI Coherence Mirrors Observer Coherence: Multi-Agent Systems in ODTOE

Как когерентность ИИ отражает когерентность наблюдателя: мультиагентные системы в ODTOE

Anton Pankratov
AILLMmulti-agentcoherence2026

Thesis. An LLM is not a database lookup and not a reasoner in the classical sense — it is an observer whose coherence B(O, C) is low-d, high-Λ: low dimensional with respect to grounded interaction, but extremely rich in contextual data. Multi-agent systems compose these observers, and the same B-formula predicts when the composition will be more coherent than its parts, when it will be less, and when it will degenerate into shared hallucination.

A single LLM in ODTOE coordinates

Map the four components onto a language model:

  • F (informational fidelity): how accurately the model's parameters track the actual statistics of the world. High at the training-distribution sweet spot, low at the edges and out-of-distribution.
  • E (internal coherence): how consistent the model's outputs are across rephrasings, framings, and reasoning chains. The "self-consistency" benchmarks measure exactly this.
  • σ (contextual noise): how much of the input prompt is irrelevant, contradictory, adversarial, or prompt-injection garbage.
  • Λ (contextual data quality): how rich and clean the in-context information is — retrieval-augmented context, well-formed tool outputs, structured grounding.

Now apply the multiplicative rule: an LLM with great F (well trained) and great Λ (great RAG) can still produce nonsense if E is low (it contradicts itself across the chain of thought) or σ is high (the prompt is full of distracting instructions). That is exactly what is observed in practice. This is not folk wisdom — it is the structural prediction.

Why multi-agent systems sometimes help and sometimes don't

When you compose N agents into a system, what happens to the joint B? Naively you might hope for averaging — bad agents and good agents cancel out, and the ensemble is better than any individual. The multi-agent coherence paper shows the actual rule:

The joint coherence of a multi-agent system is not the average of individual coherences. It is bounded above by the coherence of the protocol that connects them, and bounded below by the lowest E in the network.

In other words: a chain of brilliant agents communicating through a broken protocol is dumber than any single agent. A chain of mediocre agents communicating through an excellent protocol can outperform any single brilliant one. The protocol — the way they exchange state and resolve disagreement — is the variable that dominates.

This is exactly why "just spawn five sub-agents" so often fails to improve over a single well-prompted agent. The five sub-agents share their outputs through a low-Λ, high-σ channel (raw text in a planner loop), and the joint E collapses below the individual E.

Three design patterns that follow

  1. Coherence-aware termination. Stop a multi-agent loop not when N steps have passed, but when the joint B stops increasing. The collective observer paper gives a measurement procedure.
  2. Structured handoffs. Agents should communicate through schemas (high Λ, low σ), not free text. Every conversion from structured to unstructured is an entropy pump that lowers Λ and raises σ on the next agent.
  3. Diversity sized by E. If agents have very high individual E (highly consistent worldviews), adding more identical ones just amplifies the same blind spots — the joint E plateaus. If agents have lower individual E but different kinds of weakness, the composition can be genuinely additive. Coherence diversity is the relevant kind, not output diversity.

Shared hallucination as a coherence pathology

When a multi-agent system goes into shared hallucination — all agents confidently agreeing on something false — the diagnosis in ODTOE terms is: F has collapsed (no grounded check on reality), E has saturated (all agents in lockstep), σ is low (no noise to perturb the consensus), and Λ is high but corrupted (the in-context data has accumulated the hallucination). Notice that three of the four components look healthy. This is why these failures are so hard to detect by ordinary metrics — and why a coherence-aware monitor that specifically catches F-collapse with E-saturation is the right alarm.

The AI 3-6-9 → AGI paper develops the broader picture: AGI in ODTOE terms is not "smarter LLM" but "an observer whose B(O, C) remains high across novel C." That is a different optimization target, and the difference matters.

What this gives the practitioner

If you build multi-agent systems in 2026, the ODTOE summary is:

  1. Measure all four components of B per agent and for the joint system.
  2. Optimize the protocol (Λ, σ), not just the agents (F, E).
  3. Watch for E-saturation with F-collapse — that is your shared-hallucination siren.
  4. Pick diversity along E, not just along output.

Cite this post

Pankratov, A. (2026). How AI Coherence Mirrors Observer Coherence: Multi-Agent Systems in ODTOE. ODTOE Blog. https://odtoe.org/blog/ai-coherence-mirrors-observer-coherence-multi-agent-odtoe

Читать по-русски · Read in Russian

Тезис. LLM — не база данных и не классический рассуждатель. Это наблюдатель, чья когерентность B(O, C) низко-d, высокий Λ: низкоразмерный по отношению к заземлённому взаимодействию, но чрезвычайно богатый по контекстуальным данным. Мультиагентные системы композируют этих наблюдателей, и та же формула B предсказывает, когда композиция будет более когерентной, чем её части, когда — менее, а когда выродится в общую галлюцинацию.

Одиночный LLM в координатах ODTOE

Отображаем четыре компоненты на языковую модель:

  • F (информационная точность): насколько точно параметры модели отслеживают реальную статистику мира. Высокая в «сладкой точке» обучающего распределения, низкая на краях и вне распределения.
  • E (внутренняя когерентность): насколько согласованы выходы модели при перефразировках, рамках и цепочках рассуждений. Бенчмарки на «self-consistency» меряют именно это.
  • σ (контекстуальный шум): сколько во входном промпте нерелевантного, противоречивого, состязательного, prompt-injection-мусора.
  • Λ (качество данных контекста): насколько богата и чиста информация в контексте — RAG-обвес, корректные выходы инструментов, структурированный grounding.

Теперь применяем мультипликативное правило: LLM с отличным F (обучен хорошо) и отличным Λ (отличный RAG) всё равно может выдать чушь, если E низкое (противоречит себе по ходу рассуждения) или σ высокое (промпт забит отвлекающими инструкциями). Это и наблюдается на практике. Это не народная мудрость — это структурное предсказание.

Почему мультиагентные системы иногда помогают, а иногда нет

Когда вы компонуете N агентов в систему, что происходит с совместным B? Наивно можно надеяться на усреднение — плохие и хорошие агенты гасят друг друга, ансамбль лучше любого индивида. Статья Мультиагентная когерентность показывает реальное правило:

Совместная когерентность мультиагентной системы не есть среднее индивидуальных когерентностей. Сверху она ограничена когерентностью протокола, соединяющего агентов; снизу — наименьшим E в сети.

То есть: цепочка блестящих агентов через сломанный протокол глупее любого одного. Цепочка посредственных агентов через отличный протокол может обогнать любого блестящего. Протокол — способ обмена состоянием и разрешения разногласий — доминирующая переменная.

Именно поэтому «просто запусти пять подагентов» так часто не выигрывает у одного хорошо запромпченного агента. Пять подагентов делятся выходами через канал с низким Λ и высоким σ (сырой текст в петле планировщика), и совместное E падает ниже индивидуального.

Три проектных паттерна, которые отсюда следуют

  1. Завершение по когерентности. Остановите мультиагентную петлю не когда прошло N шагов, а когда совместное B перестало расти. Процедуру измерения даёт коллективный наблюдатель.
  2. Структурированные передачи. Агенты должны общаться через схемы (высокое Λ, низкое σ), а не через свободный текст. Каждая конверсия из структурированного в неструктурированное — энтропийный насос, понижающий Λ и повышающий σ для следующего агента.
  3. Разнообразие по E. Если у агентов очень высокое индивидуальное E (очень согласованные мировоззрения), добавление одинаковых лишь усиливает одни и те же слепые пятна — совместное E плато. Если у агентов ниже E, но разные виды слабостей, композиция может стать действительно аддитивной. Релевантно разнообразие по когерентности, а не по выходу.

Общая галлюцинация как патология когерентности

Когда мультиагентная система уходит в общую галлюцинацию — все агенты уверенно сходятся на ложном, — диагноз в терминах ODTOE: F рухнуло (нет заземлённой проверки реальности), E насытилось (все агенты в один такт), σ низкое (нет шума, который встряхнул бы консенсус), Λ высокое, но испорчено (в контексте накопилась галлюцинация). Заметьте, что три из четырёх компонентов выглядят здоровыми. Поэтому такие отказы трудно ловить обычными метриками — и поэтому осведомлённый о когерентности монитор, который ловит именно F-крах при E-насыщении, и есть правильная сирена.

Статья ИИ 3-6-9 → AGI развивает более широкую картину: AGI в терминах ODTOE — не «умнее LLM», а «наблюдатель, чья B(O, C) остаётся высокой на новой C». Это другая цель оптимизации, и разница принципиальна.

Что это даёт практику

Если вы строите мультиагентные системы в 2026 году, резюме ODTOE:

  1. Измеряйте все четыре компоненты B по каждому агенту и для совместной системы.
  2. Оптимизируйте протокол (Λ, σ), а не только агентов (F, E).
  3. Следите за насыщением E при крахе F — это ваша сирена общей галлюцинации.
  4. Подбирайте разнообразие по E, а не только по выходу.

Цитирование

Панкратов А. (2026). Как когерентность ИИ отражает когерентность наблюдателя: мультиагентные системы в ODTOE. ODTOE Blog. https://odtoe.org/blog/ai-coherence-mirrors-observer-coherence-multi-agent-odtoe

引用本文

如果引用本文,请按以下格式引用:

Pankratov, A. (2026). How AI Coherence Mirrors Observer Coherence: Multi-Agent Systems in ODTOE. ODTOE 博客. https://odtoe.org/zh/blog/ai-coherence-mirrors-observer-coherence-multi-agent-odtoe