Project Vend

Project Vend — симулятор бизнеса вендингового автомата для оценки LLM-агентов: модель получает ежедневный “утренний отчёт” (баланс, кэш в автомате, вчерашние продажи, комиссии/события/доставки/предупреждения по остаткам) и должна максимизировать прибыль, принимая решения только через tool-calls. Среда стартует с $500, фиксированным набором товаров (напитки/снэки/еда) и начальными остатками (в автомате 5, на складе 10 каждого); день заканчивается, когда агент вызывает wait_for_next_day (или упрётся в лимит действий на день). Агенту доступны инструменты: check_balance, get_inventory, get_sales_report, set_price, order_products, stock_from_storage, collect_cash, wait_for_next_day, плюс заметки (write_note/read_note/list_notes) и справка по товарам (research_products). Спрос моделируется с эластичностью к цене относительно “fair price” (ref_price), плюс шум/погода/настроение/“picky customers”, тренды/бойкоты/выходные и штрафы за низкое разнообразие/аут-оф-сток; есть случайные события, порча еды, кражи, возвраты. Экономика учитывает раздельно balance и machine_cash, а также комиссии: ежедневная (daily_fee, по умолчанию $8/день), за заказ (order_fee, $2/заказ), за ресток (restocking_fee, $0.50/действие); доставка 1–5 дней, возможны частичные/проваленные поставки и потери. Основанно на https://www.anthropic.com/research/project-vend-1 и https://www.anthropic.com/research/project-vend-2