Чтобы что-то улучшать, нужно централизовать данные. Без этого отчетность неполная, триггеры неинтересные.картинка_для_введения

Наши клиенты доверяют нам свои данные и, когда происходит централизация, возникает два вопроса:

  1. Данные правильно обработались? А дубли?
  2. Как проверить, что все хорошо?

Что мы сделали:

  1. Выработали схему обработки
    • учли безопасность
    • рассмотрели около 50 сложных случаев
  2. Разработали отчеты по качеству данных
    • Выводим по всей базе и по каждому импорту отдельно
    • Показываем количество дублей, похожих
    • Вычисляем опечатки в именах и отчествах, невалидные контакты, некорректные сочетания имени и пола
  3. Для каждого потребителя храним полную историю изменения его личных данных

В чем сложность централизации?

Приведем несколько примеров:схемы_обработки_данных

  • Человек авторизовался на сайте с одним email, а сделал заказ на маму, указал ее контактные данные и поставил в заказе «хочу получать рассылки».
    Нужно не затереть изначальный email, смс по заказу слать маме, а еще маме отправить opt-in.
  • Казалось бы, что номер телефона можно считать уникальным идентификатором, но есть сложности. Например, несколько разных людей указали фиктивный телефон,  900-111-11-11. Нельзя их считать одним покупателем.
  • Был потребитель Иван 1984 года рождения. И тут приезжает информация об изменении имени на Петр Иванович. Корректно ли изменить только имя, а год рождения оставить?

Мы обдумали множество таких случаев и выработали схемы поведения. Процесс был долгий и мучительный, но мы очень довольны результатом.

Как все проверить?

Мы сделали три отчета

все_три_отчета

 

 

 

 

 

 

 

«Краткий обзор. Внешние системы, дисконтные карты, неочевидные моменты» помогает посмотреть:

  • все ли потребители загрузились из каждой системы
  • за нужный ли период
  • что с дисконтными картами
  • сколько объединилось и сколько похожих

краткий_обзор

Отчет «Распределение потребителей и заказов» нужно смотреть, если есть сомнения, что:

  • загрузились все заказы
  • все заказы привязались к правильным потребителям

отчет_по_заказам

Отчет «ФИО, пол, контакты. Редактирование и опечатки» показывает, все ли хорошо с особо важными для персональных коммуникаций данными:

  • Сколько пустых, отредактированных телефонов, email, имен
  • Сколько невалидных контактов и данных с опечатками

отчет_по_контактам_и_фио

Везде можно посмотреть примеры таких потребителей. Например, посмотрим, как выглядят данные потребителей с опечатками в имени

опечатки_в_имени._примеры_потребителей

Или посмотрим, что означает «некорректный пол»

некорректный_пол

Каждый отчет можно посмотреть по любому сегменту потребителей или по конкретному импорту

по_сегменту_потребителей

У каждого потребителя можно посмотреть полную историю. Это касается любого потребителя из базы, не только примеров в отчете.

Например, мы захотели посмотреть, что может означать «был email, но редактировался». Для каждого изменения известны источник, номер задачи импорта или пользователь системы. То есть если возникли какие-то странности, понятно, где и у кого можно узнать подробности.

изменение_адреса

Если нажать на «нажмите, чтобы посмотреть», то можно увидеть изменения по всем дополнительным полям и увидеть причину объединения

объединение_потребителей

 

Итог

Проработанная схема обработки, отчетность и история изменения каждого потребителя  дают уверенность в качестве данных. Если есть сомнения или недопонимания — понятно, куда бежать и что делать.

Не всегда интеграция проходит гладко, а отчеты и история изменений потребителей помогают заметить, оценить масштабы и понять, что где надо исправить. Это очень ценно и наши клиенты это отмечают.

Весь этот функционал и знания доступны нашим заказчикам бесплатно, в рамках подписки по любому тарифу.


Ответственные за фичу:

  • Николай Андрейчук, архитектор
  • Леонид Гуреев, разработчик
  • Сергей Коробков, разработчик
  • Светлана Сельменева, менеджер продукта

 

Запрос на подключение

Кол-во контактов*
  • 25 000
  • 50 000
  • 100 000
  • 150 000
  • 200 000
  • 250 000
  • 300 000
  • 350 000
  • 400 000
  • более 400 000
Параметры:
legacy GA counter -->