Перейти к содержимому
Machine LearningOpen SourceЗаконность10 мин

Как Machine Learning превращает отзывы в рыночные данные

В мире Big Data 2026 года данные стали главным залогом выживания бизнеса. Покупка сервиса MPSTATS банком «Точка» за миллиарды подтверждает: аналитика маркетплейсов — легальный и критически важный инструмент.

Мадияр Хамзанов
Мадияр Хамзанов
Co-founder · 13 февраля 2026
90%
Точность
предсказания продаж
6 мес
Горизонт
прогнозирования
0
ПДн
персональных данных
OSINT
Метод
открытые источники

Почему это работает

Маркетплейсы скрывают прямые данные об остатках и продажах. Но есть открытые индикаторы, которые позволяют восстановить реальную картину рынка. Главный из них — динамика отзывов.

Отзыв = Покупка. В экосистеме Kaspi оставить отзыв может только реальный покупатель после получения товара. Это неоспоримый факт сделки.

Как данные превращаются в аналитику

1
Сбор открытых данных
Парсинг публичной витрины без авторизации
2
Очистка
Удаление дубликатов, стандартизация
3
ML-обогащение
Расчёт продаж по отзывам
4
Прогноз
Предсказание на 6 месяцев
5
Аналитика
Графики и отчёты
Важно: На каждом этапе соблюдаем rate-limits и не создаём нагрузку на сервера. Никакого DDoS — только вежливый сбор открытых данных.

Метод «Верифицированного следа»

Наш алгоритм использует систему косвенных индикаторов для восстановления реального объёма продаж:

1
Отзыв = Покупка

На Kaspi оставить отзыв может только покупатель после получения. Это верифицированный факт сделки.

2
Коэффициент органики

ML-модели вычислили % покупателей, оставляющих отзывы в каждой категории (электроника — 5-8%, одежда — 3%).

3
Предиктивный анализ

Алгоритм сопоставляет дату отзыва, текст, рейтинг и статус наличия для восстановления объёма продаж.

Коэффициент органики: сколько % покупателей оставляют отзыв

ML-модель учитывает разную конверсию в отзывы для каждой категории.

Пример: Если в электронике 7.2% покупателей оставляют отзыв, то 100 новых отзывов = ~1,400 продаж.

Machine Learning: как достигается 90% точности

Наша ML-модель обучена на 68,000+ верифицированных примерах. Чем больше данных — тем точнее прогнозы.

Что учитывает модель

Динамика отзывов
скорость появления
Сезонность
праздники, распродажи
Категория
коэффициент органики
Ценовой сегмент
полка ₸–₸₸₸₸₸

Точность ML-модели растёт с каждым месяцем

Чем больше данных — тем точнее прогнозы. Сейчас модель достигла 90% точности.

90%
Точность сегодня
68K
Обучающих примеров
6 мес
Горизонт прогноза

Прогнозирование на 6 месяцев вперёд

ML-модель не только анализирует прошлое, но и предсказывает будущее. Мы учитываем сезонность, тренды категории и макроэкономические факторы.

Сезонность

Новый год, 8 марта, Black Friday — модель знает паттерны продаж

Тренды

Рост или падение категории за последние месяцы

Конкуренция

Количество продавцов и динамика входа новых игроков

Прогноз продаж на 6 месяцев вперёд

ML-модель анализирует сезонность, тренды и динамику отзывов для предсказания будущих продаж.

Фактические продажи
Прогноз ML

Мы строго следуем законодательству Республики Казахстан и международным стандартам работы с данными.

Отсутствие ПДн
Закон РК «О персональных данных»

Не собираем ФИО, контакты, адреса. Анализируем только товары, бренды, категории.

Открытые источники
ст. 5 Закона РК «О доступе к информации»

Вся информация взята с публичной витрины, доступной без авторизации.

Интеллектуальный продукт
Закон РК «Об авторском праве»

Результат — оригинальный аналитический продукт, защищённый как ИС.

Чего мы НЕ делаем: Не собираем персональные данные покупателей. Не публикуем контакты продавцов. Не используем закрытые API. Не DDoS-им сервера.

Этика и Безопасность

Никаких «сливов»

Мы не раскрываем внутреннюю кухню конкретных ИП. Показываем общую температуру по рынку: какой бренд лидирует, какие товары востребованы.

Прозрачность для экономики

Банки покупают такие сервисы, потому что это делает рынок прозрачным. Аналитика помогает селлерам не банкротиться.

Rate-limiting и антиDDoS: Мы соблюдаем rate-limits и делаем паузы между запросами. DDoS — это плохо. Наш код содержит задержки и ограничения, чтобы не создавать нагрузку.

Open Source: Смотри сам

Мы верим в прозрачность. Базовый код парсинга категорий Kaspi.kz — в открытом доступе. Никакой магии, никаких закрытых API.

Open Source примеры

Мы открыли исходный код базового парсера категорий Kaspi.kz. Смотри, как это работает — никакой магии.

Открыть репозиторий
kaspi_categories.ipynb
Jupyter notebook со сбором категорий
utils.py
Утилиты и rate-limiting
requirements.txt
pandas, requests, pyarrow

Итог

  1. Открытые данные. Работаем только с публичной витриной, доступной любому без авторизации.
  2. Без ПДн. Не собираем персональные данные граждан РК.
  3. Без DDoS. Соблюдаем rate-limits, не нарушаем работу систем.
  4. Интеллектуальный продукт. Результат — оригинальная аналитика, а не копия данных.

RedStat — это инструмент рыночной разведки на основе открытых данных. Мы помогаем предпринимателям принимать решения, основываясь на математике, а не на интуиции.

Методология аналитики: ML и открытые данные | RedStat