ИИ-лаборатория Lossfunk представила новый бенчмарк EsoLang-Bench

Новости

Недавно ИИ-лаборатория Lossfunk анонсировала EsoLang-Bench — новый бенчмарк, включающий 80 задач, разработанных на пяти эзотерических языках программирования: Brainfuck, Befunge-98, Whitespace, Unlambda и Shakespeare. Пять продвинутых моделей, таких как GPT-5.2 и Gemini 3 Pro, показали результаты в диапазоне от 0 до 11% точности при решении задач, которые студенты могли бы выполнить на Python за считанные минуты. Ни одна из тестируемых моделей не справилась с заданиями уровня Easy.