What Does It Mean to 'Measure' Coherence? Operational Recipes for B(O,C)

Что значит «измерить» когерентность? Операционные рецепты для B(O,C)

2026年4月10日Anton Pankratov

coherencemeasurementmethodologyoperationalization

Thesis. A theory whose central quantity cannot be operationalized is not a theory; it is a mood. ODTOE survives this objection by providing five distinct recipes for estimating B(O, C) — each appropriate to a different empirical situation — and by being explicit about which recipe to use when. This post catalogues them.

Recipe 1: Paired-comparison elicitation

Use when: you have a human observer and you want a fast, defensible scalar estimate of their B on a specific class of claims.

Procedure: present pairs of claims (one in the observer's strong domain, one in a weak domain) and ask which they would defend more strongly under counter-evidence. Iterate until preferences are stable. The implied B-ranking is the elicited value. See Measuring B-parameter for the formal protocol and the standard error analysis.

Trades off: low cost, low precision. Good for screening, not for publication-grade measurement.

Recipe 2: Regression on known outcomes

Use when: the observer has produced many decisions and you can score the outcomes.

Procedure: regress outcome quality against the four components (F, E, σ, Λ) measured at decision time. The fitted exponents are the implied weights w1..w4; the predicted B for any new context is then computable.

Trades off: requires data and ground truth. Cleanest for forecasters, traders, and engineers; harder for one-off decisions.

Recipe 3: Perturbation response

Use when: you want to test whether a claimed B is real.

Procedure: perturb the context — inject noise (raise σ), redact some data (lower Λ), or present a contradiction (probe E). Measure how much the observer's stated position shifts. High-B observers shift less; low-B observers shift more. The slope of position-shift vs. perturbation is an indirect measure of B.

Trades off: invasive but rigorous. This is the technique closest to a physics experiment.

Recipe 4: Inter-observer convergence

Use when: you have several independent observers on the same configuration.

Procedure: compute pairwise agreement (e.g., Cohen's κ or analog), weighted by independent estimates of each observer's individual F. The convergence rate as you add observers — and the asymptote — give an estimate of the joint B of the panel. This is the technique used in the coherence measurability paper.

Trades off: requires multiple observers and an independent F-estimate. Best for collective claims (science, journalism, jurisprudence).

Recipe 5: Lambda-grounded decomposition

Use when: you have detailed context data and want a component-wise B.

Procedure: decompose Λ explicitly into its sub-components (source diversity, source recency, source independence, source verifiability). The lambda empirical reinforcement paper gives the canonical decomposition. Then estimate F and σ relative to the decomposed Λ. E is estimated from the observer's emotional alignment with the corpus. This is the most thorough recipe and the one used in formal corpus work.

Trades off: heavy machinery. Use when you need component-level diagnostics, not just a scalar.

When to use which

Single human observer, fast read: Recipe 1.
Track record exists: Recipe 2.
Adversarial / rigorous setting: Recipe 3.
Several observers: Recipe 4.
Full diagnostic / publication-grade: Recipe 5.

What you should not do

Do not collapse B to a single Bayesian credence. Do not report B without specifying the recipe. Do not aggregate B across very different contexts C — B is context-relative, and a high B in one context says nothing about another. The belief paper has the full list of common pitfalls.

Cite this post

Pankratov, A. (2026). What Does It Mean to 'Measure' Coherence? Operational Recipes for B(O,C). ODTOE Blog. https://odtoe.org/blog/what-does-measuring-coherence-mean-operational-recipes

Читать по-русски · Read in Russian▼

Тезис. Теория, центральная величина которой не операционализуема, — не теория, а настроение. ODTOE переживает это возражение, предоставляя пять различных рецептов оценки B(O, C) — каждый подходит к своей эмпирической ситуации — и эксплицитно указывая, какой рецепт когда применять. Этот пост каталогизирует их.

Рецепт 1: Элицитация парных сравнений

Использовать когда: у вас человек-наблюдатель и вам нужна быстрая, защитимая скалярная оценка B на конкретном классе утверждений.

Процедура: предъявляйте пары утверждений (одно в сильной области, одно в слабой) и спрашивайте, какое наблюдатель защищал бы решительнее под контр-доказательствами. Итерируйте, пока предпочтения не стабилизируются. Полученное ранжирование — оценка B. Формальный протокол и анализ ошибок — в Измерение B-параметра.

Компромиссы: дёшево, неточно. Годится для скрининга, не для публикаций.

Рецепт 2: Регрессия по известным исходам

Использовать когда: наблюдатель принял много решений, и вы можете оценить исходы.

Процедура: регрессируйте качество исхода на четыре компоненты (F, E, σ, Λ), измеренные на момент решения. Подогнанные экспоненты — это веса w1..w4; предсказанное B для нового контекста становится вычислимым.

Компромиссы: требует данных и эталона. Чище всего для прогнозистов, трейдеров, инженеров; сложнее для одноразовых решений.

Рецепт 3: Реакция на возмущение

Использовать когда: нужно проверить, реально ли заявленное B.

Процедура: возмущайте контекст — впрыскивайте шум (поднимайте σ), скрывайте часть данных (опускайте Λ), предъявляйте противоречие (тестируйте E). Меряйте, насколько сдвигается позиция наблюдателя. Высокое B — сдвиг мал; низкое — велик. Наклон «сдвиг vs. возмущение» — косвенная мера B.

Компромиссы: инвазивно, но строго. Техника, ближайшая к физическому эксперименту.

Рецепт 4: Межнаблюдательная сходимость

Использовать когда: есть несколько независимых наблюдателей на одной конфигурации.

Процедура: считайте парное согласие (κ Коэна или аналог), взвешенное по независимым оценкам индивидуального F. Скорость сходимости при увеличении числа наблюдателей и асимптота дают оценку совместного B панели. Эту технику применяет Измеримость когерентности.

Компромиссы: требуются несколько наблюдателей и независимая оценка F. Лучше всего для коллективных утверждений (наука, журналистика, юриспруденция).

Рецепт 5: Декомпозиция через Λ

Использовать когда: есть подробные контекстуальные данные и нужна покомпонентная B.

Процедура: разложите Λ явно на подкомпоненты (разнообразие источников, свежесть, независимость, проверяемость). Каноническая декомпозиция — в Λ как эмпирическое подкрепление. Затем оцените F и σ относительно разложенной Λ. E — по эмоциональной согласованности наблюдателя с корпусом. Самый тщательный рецепт, используется в формальной корпусной работе.

Компромиссы: тяжёлая машинерия. Применять, когда нужна покомпонентная диагностика, а не скаляр.

Что когда применять

Один наблюдатель, быстрое чтение: Рецепт 1.
Есть история: Рецепт 2.
Состязательная / строгая обстановка: Рецепт 3.
Несколько наблюдателей: Рецепт 4.
Полная диагностика / публикация: Рецепт 5.

Чего делать не стоит

Не сворачивайте B к одному байесовскому credence. Не отчитывайте B без указания рецепта. Не агрегируйте B по очень разным контекстам C — B контекстно-относительно, и высокое B в одном контексте ничего не говорит о другом. Полный список типичных ошибок — в статье о вере.

Цитирование

Панкратов А. (2026). Что значит «измерить» когерентность? Операционные рецепты для B(O,C). ODTOE Blog. https://odtoe.org/blog/what-does-measuring-coherence-mean-operational-recipes

引用本文

如果引用本文，请按以下格式引用：

Pankratov, A. (2026). What Does It Mean to 'Measure' Coherence? Operational Recipes for B(O,C). ODTOE 博客. https://odtoe.org/zh/blog/what-does-measuring-coherence-mean-operational-recipes

← 所有博客文章