UPD по beast-plan — теперь beast-forge v3Два месяца назад постил про beast-plan — штуку которая гоняет план через 5 ролей пока Critic не скажет "20+, approved". С тех пор я работал с ним каждый день и нашёл главную проблему.Планирование работает. А вот "готово" — нет.Claude уверенно говорит "всё сделано, тесты прошли" — а через два дня обнаруживаешь что половина не интегрирована, пруфы не от тех команд, а один тест проверяет что файл существует, а не что фича работает. Когда у тебя 10+ задач в день и ты один — физически нет времени перепроверять каждую.Ключевой инсайт: агент который писал код не может его проверять. Это как аудитор который аудирует свою бухгалтерию. Confirmation bias встроен в процесс.Поэтому в v3 добавил вторую машину — Verification Chain:1. Evidence Collector — свежий агент, который НИКОГДА не видел работу executor'а. Берёт только план и идёт проверять каждый пункт сам: запускает тесты, дёргает API, смотрит в базу2. Auditor — ещё один свежий агент. Берёт отчёт первого и перепроверяет 30-50% команд. Если его output не совпадает с заявленным — fake proof, обратно в работу3. Second opinion от другой модели (Codex CLI) — другая архитектура, другие blind spotsНашёл gaps? Записывает паттерн в Common Failures. Следующий запуск уже знает на что смотреть. Система учится.Plan Forge тоже переработал: теперь перед планированием грепает
CLAUDE.md на мины в файлах которые будешь трогать, ищет прецеденты в прошлых планах, спайкает всё что можно проверить за 5 минут. И получает second opinion — "как это сломается?" — до того как написана первая строка.Open source, плагин для Claude Code:
github.com/malakhov-dmitrii/beast