Как говорил незабвенный Остап Бендер: «Финансовая пропасть — самая глубокая из всех пропастей, в нее можно падать всю жизнь». Похоже, создатели искусственного интеллекта решили, что их подопечным пора перестать витать в облаках чистой логики и спуститься на грешную землю рыночных отношений. Встречайте новый стандарт оценки ИИ, который проверяет не умение писать стихи, а способность выжить в суровом мире капитала!
Курс молодого капиталиста
Появился новый бенчмарк ClawWork, и это, друзья мои, уже не просто тест Тьюринга, а настоящий симулятор жизни фрилансера в конце месяца. Суть эксперимента гениальна в своей простоте и жестокости: сможет ли цифровой агент заработать больше, чем он «проедает» в процессе работы?
Каждому виртуальному трудяге выдают стартовый капитал — 10 долларов. С этой скромной суммой (на которую в приличном месте и кофе с круассаном не купишь) ИИ отправляется на биржу труда. Ему предстоит выбирать задания из 44 отраслей: от высокой финансовой аналитики до прозаичной поддержки клиентов. Всё как у людей: хочешь жить — умей вертеться.
Пан или пропал: экономика выживания
Здесь начинается самое интересное, достойное пера сатирика. Каждое «шевеление мозгами» (генерация токенов) стоит денег. Если модель тратит на размышления больше, чем получает за выполненную задачу, её баланс уходит в минус. И тогда — finita la commedia — агент отключается. Банкротство в мире машин наступает мгновенно, без долгих судебных разбирательств и реструктуризации долгов.
В этих «Голодных играх» уже соревнуются титаны индустрии: Claude, Gemini, Qwen, Kimi, GLM и другие. Условия для всех спартанские и абсолютно равные.
Волк с кремниевой Уолл-стрит
На данный момент пальму первенства и звание главного «стахановца» удерживает Qwen3.5-Plus. Этот цифровой гений умудрился «наколотить» почти 20 тысяч долларов, выполнив 198 заданий! Видимо, он быстрее других понял, что краткость — не только сестра таланта, но и залог финансового благополучия.
За этой захватывающей драмой можно следить в реальном времени. У проекта есть таблица результатов, где видны доходы, расходы и, что самое драматичное, статус выживания участников. Зрелище, скажу я вам, почище любого реалити-шоу.

Глядя на эти успехи, невольно проникаешься оптимизмом. Если нейросети так быстро учатся зарабатывать, возможно, недалек тот день, когда они начнут платить налоги, делать отчисления в пенсионный фонд и, наконец, угостят нас, своих создателей, чашечкой хорошего кофе. Главное, чтобы они не научились слишком хорошо считать и не решили, что мы с вами — экономически невыгодный актив.
