Недавно ИИ-лаборатория Lossfunk анонсировала EsoLang-Bench — новый бенчмарк, включающий 80 задач, разработанных на пяти эзотерических языках программирования: Brainfuck, Befunge-98, Whitespace, Unlambda и Shakespeare. Пять продвинутых моделей, таких как GPT-5.2 и Gemini 3 Pro, показали результаты в диапазоне от 0 до 11% точности при решении задач, которые студенты могли бы выполнить на Python за считанные минуты. Ни одна из тестируемых моделей не справилась с заданиями уровня Easy.
Posted on : 21.03.2026 By Redactor
