UPD по beast-plan — теперь beast-forge v3Два месяца назад

2026-04-05 22:09

Читать оригинал

UPD по beast-plan — теперь beast-forge v3

Два месяца назад постил про beast-plan — штуку которая гоняет план через 5 ролей пока Critic не скажет "20+, approved". С тех пор я работал с ним каждый день и нашёл главную проблему.

Планирование работает. А вот "готово" — нет.

Claude уверенно говорит "всё сделано, тесты прошли" — а через два дня обнаруживаешь что половина не интегрирована, пруфы не от тех команд, а один тест проверяет что файл существует, а не что фича работает. Когда у тебя 10+ задач в день и ты один — физически нет времени перепроверять каждую.

Ключевой инсайт: агент который писал код не может его проверять. Это как аудитор который аудирует свою бухгалтерию. Confirmation bias встроен в процесс.

Поэтому в v3 добавил вторую машину — Verification Chain:

1. Evidence Collector — свежий агент, который НИКОГДА не видел работу executor'а. Берёт только план и идёт проверять каждый пункт сам: запускает тесты, дёргает API, смотрит в базу
2. Auditor — ещё один свежий агент. Берёт отчёт первого и перепроверяет 30-50% команд. Если его output не совпадает с заявленным — fake proof, обратно в работу
3. Second opinion от другой модели (Codex CLI) — другая архитектура, другие blind spots

Нашёл gaps? Записывает паттерн в Common Failures. Следующий запуск уже знает на что смотреть. Система учится.

Plan Forge тоже переработал: теперь перед планированием грепает CLAUDE.md на мины в файлах которые будешь трогать, ищет прецеденты в прошлых планах, спайкает всё что можно проверить за 5 минут. И получает second opinion — "как это сломается?" — до того как написана первая строка.

Open source, плагин для Claude Code:
github.com/malakhov-dmitrii/beast

Читать оригинал

Комментарии: 0

Добавить комментарий +

Навигация по постам

Предыдущий пост

с хорошим человеком пообщаться всегда приятно 😁

2026-03-26 12:13

Следующий пост

тот момент когда у тебя несколько подписок Claude Code Max 2

2026-04-09 08:50