Илья Никишин — 13 октября 2025
Как оценивают большие языковые модели
Разбираем, как формируется рейтинг LLM-моделей на Open LLM Leaderboard и LLMerboard и LLMArena: какие тесты сейчас в колонках таблицы, какие метрики применяются и что эти цифры значат на практике.
