5–7 инженеров + врач (Катя, медицинский ревьюер) + CEO (Вася) + со-архитектор (Ильдар). Полностью удалённо, основное общение — Slack, периодические созвоны.
Где сейчас: системные источники напряжения проговорены вслух (Mar 12 — прозрачность, Apr 1 — выгорание, Apr 9–17 — расхождения по 100%). Закреплённых процессов на их разрешение почти нет — разговоры есть, процедуры догоняют.
Прозрачность архитектуры как ожидание
Ильдар требует от сервисов читаемости — чтобы архитектуру можно было перечитать и понять без многочасового погружения. Когда сервис воспринимается как «непрозрачный ящик», это блокирует уверенность остальных при изменениях и концентрирует нагрузку на одном человеке. Что считать «прозрачным» — не сформулировано, спор возвращается каждый раз при значимом архитектурном изменении.
Три позиции и нерешённый критерий: см. architecture-transparency-expectation.
Долг за чужое непродуманное
Когда в системе случается риск, на одного инженера падают последствия пробелов, которые он не создавал. Артур разгребает дыры в нормализации/LOINC, унаследованные от решений до его прихода; Никита — поломки в опроснике, которые поднимаются как срочные с негативным фидбэком.
«когда какой-то риск происходит, тебе приходится отвечать за очень большую часть системы. И если кто-то про неё не подумал хорошенько, то долг остается на тебе.» — Ильдар, Apr 1
Способа перераспределить этот долг или хотя бы пометить «это последствия чужих пробелов» — нет.
Выгорание — системное, не личное
Apr 1 команда зафиксировала: выгорание у инженеров не личностное, изменились условия. Раньше — маленькие чёткие цели (прототип Орландо, правка промптов). Сейчас — задачи разрастаются бесконтрольно, в одну фичу с дешёвым LLM-кодом запихивается 10 улучшений, давление в общении («можешь получить пизды» за баг). Артём указал корневую причину: разработка растёт быстрее тестирования — сквозной автоматизированный прогон команда ещё не построила.
Направление — увеличивать долю автоматизации тестов (см. ниже).
Недоверие к LLM-тестированию + ручное = красный флаг
Когда LLM пишет код и LLM же тестирует, нет гарантии что тест покрывает реальные failure modes. Оценка уверенности (по аналогии с CodeRabbit) предложена как смягчение, не реализована.
Установка Ильдара: ручное тестирование = красный флаг. См. manual-testing-red-flag — отдельная decision-страница с следствиями и реализацией через auto-verify / Agent Browser.
100% точности — расходящиеся ожидания
Само позиционирование «прибор, не рекомендация» — отдельная страница: medical-as-instrument-not-recommendation. Здесь — про расхождение ожиданий внутри команды от него.
Три устойчивые позиции, в одно не сводятся:
- Вася (коммерция): 100% не каприз, требование рынка. Врач после ошибки уходит навсегда и тянет за собой сеть. Иерархия метрик в бенчмарках: точность → консистентность → цена → скорость; без первых двух остальные не считаются.
- Ильдар (инженерия): асимптотическая позиция. Многошаговый LLM-пайплайн → ошибки складываются; стремимся к асимптоте, ошибки исправимы итеративно но не до нуля. Изначально (Apr 9) сомневался в логике «всё или ничего», после разговора с Васей принял рыночную природу требования.
- Катя (медицинский ревьюер): 100% и даже 90% — нереалистичные цели; при повторении шагов суммируются новые типы ошибок, а не просто снижается вероятность исходной.
Расхождение: маркетинг говорит «100% on Stanford MedBenchmark» (питч-дек Apr 22), инженерия держит асимптоту, врач видит сложение ошибок ниже маркетинговых утверждений. Влияет на объём фич и внешнее позиционирование. Бенчмарк и продакшн-данные — разные вещи; этот разрыв ещё не зафиксирован в общении с клиентами.
См. 100-percent-accuracy-debate — математика складывающихся ошибок и маркетинг.
Паттерны общения
- Никита редко пишет в публичные Slack-каналы — почти всё в личку. Контекст багов и тестирования не попадает в общий канал, идёт через Ильдара или напрямую.
- Постоянный пинг от Васи про «сдвинулся ли процент» создаёт давление быстро-залатать вместо продуманных решений.
- Приватный Slack-канал на кейс (Mar 18, инициатива Ильдара для FHIR-бенчмарка) — один тред = один кейс = ограниченный круг. Эксперимент снизить ощущение «за тобой смотрят». Не масштабировано.
- Откровенный разговор как практика — Apr 1 ~20 минут на тему выгорания без технической повестки, Ильдар явно просит «делиться, даже грубо». Признано, но не закреплено как ритм ретро.
Врач внутри команды
С апреля 2026 в команде работает Катя (анестезиолог-реаниматолог) как медицинский ревьюер. Не оформлена как штатный участник на полную ставку; формат её участия (советник / ревьюер / соавтор медицинских промптов) не зафиксирован, фидбэк идёт через Артура без явного процесса. При этом она удерживает медицинскую логику в продуктовых обсуждениях (5% borderline, 100% точности, источники медконтента) и даёт «незамыленный взгляд» на UX, которого у команды больше нет.
Связанные решения
- architecture-transparency-expectation — status: contested — что значит «прозрачный сервис»
- medical-as-instrument-not-recommendation — status: active — продуктовое позиционирование как прибор
- manual-testing-red-flag — status: active — установка про автоматизацию тестирования
Открытые вопросы
- Механизм перераспределения долга за чужое непродуманное: формулировка есть, процесса нет. Без способа пометить «это последствия чужих пробелов» долг невидим в роадмапе.
- Оценка уверенности / отчёт для LLM-кодящих изменений — предложена Артёмом, не реализована.
- Онбординг в существующие сложные сервисы (LOINC, нормализация) — чтобы пробел в знаниях у новых не повторял ситуацию Влада.
- Формат участия Кати как медицинского ревьюера.
- Ритм командного ретро — Apr 1 был ad-hoc.
Связано
- normalization-service — сервис в центре спора про прозрачность
- loinc-harmonization-service — рядом
- 100-percent-accuracy-debate — пересекается с расхождением ожиданий
- llm-safety-in-medicine — Quality Unit / ответственность
- уроки — методологические уроки (manual testing red flag)
Источники
Сноски
-
2026-04-01 «Портирование LOINC» (выгорание, разрастание задач, ручное тестирование как красный флаг, долг за чужое непродуманное), accessed 2026-05-17, https://github.com/Realai-plus/meeting-digests/blob/main/data/digest/2026/04/2026-04-01T11%3A07%3A08.000Z_портирование_loinc_01KN4BKJSP8PSGBSN23VFZ25M0.md. ↩
-
2026-04-09 «Беклог проектов» (Ильдар vs Вася: 100% — каприз или необходимость; рыночная природа требования принята), accessed 2026-05-17, https://github.com/Realai-plus/meeting-digests/blob/main/data/digest/2026/04/2026-04-09T14%3A08%3A50.000Z_Беклог_проектов_01KNS960XNDSP0BK956RBTV6DE.md. ↩
-
2026-04-17 «брейншторп!» (иерархия метрик точность → консистентность → цена → скорость; «врач может ошибаться, прибор — нет» разделено с Катей), accessed 2026-05-17, https://github.com/Realai-plus/meeting-digests/blob/main/data/digest/2026/04/2026-04-17T15%3A07%3A01.000Z_брейншторп%21_01KPDZP9JZ6B7MGFXTCYJKTY2J.md. ↩
-
2026-04-17 «эти липопротеины б» (Катя: 100% технически невозможно — асимптота vs накопление новых ошибок), accessed 2026-05-17, https://github.com/Realai-plus/meeting-digests/blob/main/data/digest/2026/04/2026-04-17T10%3A01%3A00.000Z_эти_липопротеины_б_01KPDE5R6GGZJ8MTZ0W7H2S3R2.md. ↩
-
2026-03-18 «Обсуждаем прогресс по бенчмарку FHIR» (Никита и общение, васин пинг, частный канал-на-кейс), accessed 2026-05-17, https://github.com/Realai-plus/meeting-digests/blob/main/data/digest/2026/03/2026-03-18T08%3A59%3A18.000Z_Обсуждаем_прогресс_по_бенчмарку_FHIR_01KM02QE1QSR5SAZP6YE2NP9Z1.md. ↩