Вчера
@denissexy скинул датасет Hacker News — 47 млн записей с 2006 года. И написал "если бы мне не лень, я бы сделал модельку которая предсказывает как воспримут проект в западном интернете".Мне стало не лень.hackernews-simulator — кидаешь заголовок поста, получаешь:- предсказанный score- 5 симулированных комментов в стиле HN (скептицизм, "well actually", пассивно-агрессивные ссылки на Wikipedia)- объяснение почему такой score- лучшее время для постинга- сравнение нескольких вариантов заголовкаПод капотом LightGBM на 144К постов + RAG по похожим историям + Claude для комментов.Прогнал тулзу на себе. Вот что она сказала:> throwaway_ml: This is a Claude wrapper that calls itself ML. The 'realistic simulated comments' part is just prompting an LLM. That's not a prediction, that's fanfiction.> old_hn_lurker: Someone builds one of these every couple of years.Предсказала себе score ~6 апвоутов если повезет. Честная.
github.com/malakhov-dmitrii/hackernews-simulator