Как работает аналитическая платформа ScoreSight

Обзор

ScoreSight — аналитическая платформа для спорта и киберспорта, использующая собственные ML-модели для прогнозирования исходов и других ключевых событий. Сегодня платформа охватывает Dota 2, CS2 и футбол, а в дальнейшем будет расширена на другие киберспортивные дисциплины и виды спорта: кто победит, сколько карт продлится серия, и множество других специфических событий.

Задача платформы

ScoreSight дает пользователю аналитику, которую сложно получить самостоятельно: вероятности, рассчитанные на основе данных о 350 000+ матчей, индивидуальных профилей игроков и анализа драфта в реальном времени.

ScoreSight дополняет каждый прогноз расширенным аналитическим контекстом: пользователи получают доступ к ключевым рыночным индикаторам, а также к детализированным срезам по турнирам, командам и игрокам. Платформа объединяет прогнозные модели, исторические данные и удобные виджеты в едином интерфейсе, помогая быстрее находить ценные инсайты и принимать решения на основе объективной аналитики.

ScoreSight работает в трёх режимах:

  • до драфта
  • после драфта
  • в реальном времени по ходу матча

Прогноз обновляется автоматически на всех стадиях — пользователь видит актуальную картину в любой момент.

Этот документ объясняет, как платформа устроена изнутри: откуда берутся данные, как работают модели и какие технические решения обеспечивают стабильность и точность аналитики.

Определения ключевых терминов, используемых в этом документе, приведены в разделе Глоссарий.

Как работает аналитика

ScoreSight не предсказывает точный исход матча. Платформа оценивает вероятности — и честно показывает, насколько уверена в своём прогнозе.

На странице каждого матча три вкладки:

  • Обзор матча

    Вероятность победы каждой команды в процентах и текущий счёт в реальном времени.

  • Объяснение прогноза

    Текстовый разбор: что повлияло на прогноз, как оценён драфт, какие факторы сыграли ключевую роль.

  • Аналитические виджеты

    Ключевые инсайты: форма команд, статистика игроков, турнирный контекст, история очных встреч и другие важные метрики.

Прогноз обновляется автоматически по мере поступления новых данных: сначала до драфта, затем с учётом драфта, затем в реальном времени по ходу матча. Всё это происходит на одном экране — без переключения между разделами.

ML-архитектура

Это основа платформы. Прогнозы ScoreSight формирует собственный многоуровневый ML-пайплайн, обученный на реальных матчевых данных за последние три года.

Три модели на каждый матч

Для каждого матча последовательно работают три модели.

  • Pre-draft модель

    Оценивает вероятность победы до того, как стали известны герои или карты. Она опирается на форму команд, историю личных встреч и рейтинги игроков.

  • Post-draft модель

    Подключается после того, как стали известны герои или карты. Она анализирует конкретный состав героев или карт и пересчитывает вероятности с учётом синергий, контрпиков, и статистики по отдельным картам.

  • Live-модель

    Работает в реальном времени по ходу матча. Она учитывает текущий счёт, игровое состояние и обновляет прогноз непрерывно.

Эмбеддинги героев Dota 2

Чтобы модель понимала героев, каждому из 163 героев присвоен числовой паспорт — эмбеддинг. Это вектор чисел, который описывает героя не через абстрактные характеристики, а через его реальное поведение в матчах: роль, силу в разные фазы игры, взаимодействие с союзниками и противниками.

Ключевое свойство эмбеддингов

Похожие по роли и стилю герои оказываются рядом в числовом пространстве — как точки на карте. Это позволяет модели улавливать синергии и контрпики так, как их чувствует опытный игрок. Например, модель самостоятельно обучилась тому, что Io и Tiny усиливают друг друга, а Broodmother проигрывает против AoE-составов — не потому что это было прописано вручную, а потому что паттерн повторялся в сотнях тысяч матчей.

Эмбеддинги обучены на 90 000+ драфтов и обновляются вместе с метой, т.е. по мере выхода новых патчей и изменения игрового баланса.

Собственная рейтинговая система

ScoreSight ведёт свои рейтинги — отдельно по командам и отдельно по игрокам — более чем для 8 000 команд в Dota 2 и CS2.

Главное отличие от других рейтинговых систем

Рейтинг пересчитывается после каждого матча, а не еженедельно или ежемесячно. Это важно, потому что форма команды может измениться за несколько дней — и прогноз на следующий матч должен это учитывать.

Рейтинг игроков учитывает индивидуальные показатели с поправкой на роль и игровой контекст. Методология не публикуется — это внутренняя разработка, которая лежит в основе качества предиктов. На платформе рейтинги используются в каждом прогнозе.

Масштаб обучающей выборки

ПоказательЗначение
Матчи Dota 2210 000
Матчи CS2140 000
Игроки CS2 с индивидуальными профилями5 200+
Игроки Dota 2 с индивидуальными профилями1 100+
Герои Dota 2 с эмбеддингами163
Драфты90 000+
Уникальных моделей (pre-match + live)20+
Переменных на модельдо 50+

Данные

Прогнозы ScoreSight строятся на двух типах данных.

Исторические данные

За три года команда собрала и структурировала историю матчей по Dota 2 и CS2 — включая все патчи и все значимые турниры. Для работы с демками матчей написан собственный парсер, который извлекает данные в структурированном формате: пики и баны, предметы по секундам, количество убийств.

Главное — XYZ-координаты каждого героя в каждую секунду матча. Это значит, что модель видит не просто итоговую статистику, а весь ход игры: куда двигались герои, когда использовали смоук, как развивались ганки. Например, если модель видит, что пять героев движутся в одну точку — она понимает, что назревает сражение, и может оценить, как это повлияет на дальнейший ход матча.

Live-данные

Данные о текущих матчах поступают от официальных провайдеров организаторов турниров — PGL, ESL и других. Передача идёт по веб-сокету со скоростью трансляции, то есть с задержкой уровня Twitch-стрима. Всё, что происходит в игре прямо сейчас, live-модель видит и учитывает немедленно.

Важный нюанс

ScoreSight строит прогнозы на основе собственных данных о командах, игроках и матчах. Котировки букмекеров не используются в качестве входных данных для модели.

Архитектура платформы

Платформа построена на микросервисной архитектуре: каждый компонент отвечает за конкретную часть логики и может обновляться независимо от остальных. Это обеспечивает гибкость при росте нагрузки и устойчивость к сбоям отдельных сервисов.

Backend и обработка данных

Обработка данных асинхронная — система не блокируется при пиковом трафике. Очереди и кэширование сглаживают нагрузку и позволяют пересчитывать данные поэтапно без потери производительности.

Frontend и доступ к аналитике

Фронтенд использует server-side rendering (SSR): страницы формируются на стороне сервера, что ускоряет загрузку и снижает зависимость от характеристик устройства. Интерфейс адаптирован под десктоп и мобильные платформы.

Работа в реальном времени

ScoreSight обрабатывает игровые события в потоковом режиме — данные учитываются в расчётах сразу по мере поступления. При изменении входных данных аналитические показатели пересчитываются автоматически.

Надёжность и масштабируемость

Сервисы развёрнуты в контейнерах — это упрощает масштабирование и обновление без остановки платформы. Автоматический рестарт восстанавливает работу при сбоях. Регулярное резервное копирование снижает риск потери данных.

Постоянный мониторинг инфраструктуры позволяет выявлять проблемы до того, как они влияют на пользователей. Дополнительно работает контроль качества данных: система автоматически выявляет аномалии и несоответствия, которые могут повлиять на корректность расчётов.

Безопасность

Платформа использует аутентификацию и разграничение прав доступа в зависимости от уровня подписки. Пользовательские сессии защищены современными методами управления токенами. Верификация учётных записей снижает риск несанкционированного доступа.

Платежи и доступ к функциям

Платёжная логика отделена от аналитических компонентов. Оплата подписки проходит через внешние платёжные сервисы. После подтверждения платежа система автоматически открывает доступ к соответствующему уровню функций.

Подробнее об условиях подписки — на странице Подписка.

Глоссарий

Асинхронная обработка
Способ обработки данных, при котором задачи выполняются параллельно, не ожидая завершения предыдущей. Позволяет системе оставаться отзывчивой при высокой нагрузке.
Веб-сокет
Протокол передачи данных, обеспечивающий непрерывный поток информации между сервером и клиентом без необходимости делать отдельный запрос на каждое обновление.
Драфт
Этап выбора героев (Dota 2) или карт (CS2) перед началом матча, включающий пики и баны. Состав драфта напрямую влияет на стратегию команды и вероятность победы.
Контрпик
Выбор героя, который по своим характеристикам и способностям имеет явное преимущество над конкретным героем противника.
Контейнер
Изолированная программная среда, в которой запускается отдельный сервис платформы. Контейнеры позволяют обновлять и масштабировать компоненты независимо друг от друга.
ML-пайплайн
Последовательность этапов обработки данных и применения ML-моделей: от получения сырых данных до формирования итогового прогноза.
Микросервисная архитектура
Подход к построению системы, при котором каждая функция платформы реализована как независимый сервис со своей логикой и хранилищем данных.
Очереди
Механизм, при котором задачи выстраиваются в порядке ожидания и обрабатываются последовательно. Сглаживают пиковую нагрузку и предотвращают перегрузку системы.
Парсер
Программа, которая считывает данные из файла или потока и преобразует их в структурированный формат, пригодный для дальнейшей обработки моделью.
Pre-draft модель
ML-модель, рассчитывающая вероятность победы до того, как стал известен состав героев или карт. Опирается на форму команд и исторические данные.
Post-draft модель
ML-модель, пересчитывающая вероятность победы после завершения драфта с учётом конкретного состава, синергий и контрпиков.
Live-модель
ML-модель, обновляющая прогноз в реальном времени по ходу матча на основе текущего счёта и игрового состояния.
Рейтинговая система
Внутренняя система ScoreSight для оценки уровня команд и игроков, пересчитывается после каждого матча и используется как входной фактор для всех моделей.
Синергия
Взаимное усиление героев в составе одной команды: способности или характеристики одного героя усиливают эффективность другого.
SSR (server-side rendering)
Технология, при которой HTML-страница формируется на сервере и передаётся пользователю в готовом виде. Ускоряет загрузку и снижает зависимость от производительности устройства.
Токен
В контексте авторизации — зашифрованная строка, подтверждающая личность пользователя и его права доступа. Не связан с криптовалютными токенами.
Эмбеддинг
Числовое представление объекта (героя, игрока, карты) в виде вектора, которое модель использует для понимания отношений между объектами — синергий, контрпиков, ролей.
Как работает платформа ScoreSight: аналитическая платформа для киберспортсменов | ScoreSight