Аналитика и статистика

Профессия: аналитик данных

Рассказываем, чем занимается аналитик и где на него учиться

Кто такой аналитик

Аналитик — специалист, который занимается обработкой данных и составлением на их основе прогнозов, стратегий, планов и рекомендаций клиентам.

Существует несколько профессий, в названии которых также есть слово «аналитик» — финансовые аналитики, программные аналитики, системные аналитики. Все они занимаются анализом той или иной информации, но не обязательно используют в своей деятельности математику, статистику и языки программирования. Их нужно отличать от отдельной профессии «аналитик данных».

Аналитик данных должен хорошо разбираться в математике, статистике, информатике, компьютерных науках, бизнесе и экономике.

Данные, которые обрабатывает аналитик, зависят от сферы деятельности, которой он занимается. Например, аналитик в области рекламы определяет целевую аудиторию для рекламных кампаний: составляет алгоритм, с помощью которого ищет в базах данных информацию о потенциальных клиентах, анализирует рекламные стратегии с точки зрения отклика, оценивает показатели эффективности кампаний.

В чём заключается моя работа

Я работаю ведущим аналитиком в рекламном подразделении таргетированных смс-рассылок мобильного оператора. По соображениям конфиденциальности назвать компанию я не могу, она входит в так называемую «большую тройку». Моё подразделение занимается рассылкой рекламы абонентам, сегментируя их по опредёленным социально-демографическим, поведенческим и другим признакам. Аналитик занимается тем, что из всей абонентской базы выбирает абонентов, которые отвечают этим признакам, чтобы рекламодатель рассылал рекламу именно тем людям, которых она может заинтересовать.

Например, к нам приходит клиент, директор стоматологии, и заказывает рекламную кампанию. Аналитик и клиент вместе определяют набор признаков, по которым абоненты могли бы заинтересоваться этой конкретной стоматологией — проживание в определённом районе, обращение за стоматологическими услугами в недалёком прошлом и так далее. Составив список этих признаков, аналитик направляет запросы в базу данных, чтобы реклама была отправлена релевантным абонентам. Для формирования запросов используется специальный язык программирования SQL, предназначенный для работы с базами данных.

Такая реклама называется таргетированной, от английского слова target — цель. Основная задача аналитика — правильно определить эту цель. Чем точнее определён круг признаков и правильнее составлен запрос, тем успешней рекламная кампания.

По результатам кампании аналитики собирают и анализируют данные о её эффективности: смотрят, как много абонентов откликнулись на рекламу— , то есть позвонили по указанным телефонам, обратились в эту стоматологию;, и анализируют, от чего зависит эффективность рекламы, когда она срабатывает, а когда нет. Это похоже на настоящее научное исследование.

Как я стала аналитиком

Меня с детства интересовали математика и программирование, работа с данными, таблицами, поиск и анализ закономерностей. Работа аналитика включает все эти аспекты.

Я закончила НИУ ВШЭ по направлению, связанному с маркетингом. На факультете нам преподавали математику, статистику, прогнозирование, эконометрику, и эти предметы мне нравились больше всего. Кроме того, я занималась программированием на дополнительных курсах.

После окончания вуза я стала работать в PR, но вскоре поняла, что эта сфера деятельности мне не нравится. Мне было неинтересно, работала я через силу, заставляя себя приходить в офис. Поэтому я решила сменить направление. В вузе я узнала, как работает статистика, какие математические инструменты используются для анализа данных, познакомилась с языком программирования SQL. С этими навыками в резюме я решила посмотреть вакансии аналитика и вскоре нашла мою нынешнюю работу. Поначалу мне поручали и другие задачи, но постепенно аналитика стала моим основным занятием.

За три года я стала ведущим аналитиком— руководителем подразделения. В мои обязанности входит не только составление запросов в базы данных, но и распределение задач внутри моей команды, взаимодействие с заказчиками рекламных кампаний или аккаунт-менеджерами, которые ведут этого рекламодателя.

Где учат на аналитиков

Профессию аналитика получают на направлениях, связанных с информатикой, математикой, программированием. Эти направления есть практически во всех ведущих вузах страны.

Список вузов от редакции:
МГУ им. М.В. Ломоносова — факультет вычислительной математики и кибернетики, направление «Прикладная математика и информатика».

СПБГУ — направления «Математика и компьютерные науки», «Математика, алгоритмы и анализ данных», «Прикладная математика и информатика», «Прикладная математика, фундаментальная информатика и программирование», «Программирование и информационные технологии», «Системный анализ и прикладные компьютерные технологии».

НИУ ВШЭ — направления «Экономика и статистика», «Бизнес-информатика», «Прикладная математика и информатика».

Национальный исследовательский университет МЭИ — Институт автоматики и вычислительной техники, направление «Прикладная математика и информатика».

Национальный исследовательский технологический университет МИСиС — факультет «Информатика и вычислительная техника».

Московский политехнический университет — факультет информационных технологий, направление «Прикладная информатика (большие и открытые данные)», «Прикладная математика и информатика», «Бизнес-информатика (IT-менеджмент)».

Московский технический университет связи и информатики (МТУСИ) — факультет экономики и управления (ФЭУ), направление «Прикладная информатика».

Финансовая академия при правительстве России — направления «Прикладная математика и информатика», «Бизнес-информатика», «Прикладная информатика».

Какие качества нужны, чтобы успешно работать аналитиком

1. Любовь к тишине и одиночеству

Работа аналитика по большей части заключается в том, чтобы взаимодействовать с компьютером, а не с людьми. Аналитик, если он не руководитель подразделения, мало общается даже с коллегами, не говоря уже о клиентах. Он не проводит встреч, его рабочий день проходит у монитора за обработкой данных. Есть люди, которым обязательно нужно общение — им такая работа не подойдёт!

2. Развитый логико-математический интеллект

Важно, чтобы человеку нравилось оперировать статистическими данными, составлять графики и таблицы, видеть закономерности, структурировать информацию, выделять главное, отбрасывать второстепенное.

3. Терпение

Аналитик — профессия не творческая. Каждый день аналитику приходится заниматься одним и тем же: сбором, анализом, оценкой данных. Эта работа очень похожа на главное увлечение моего детства — собирание пазлов. Мне доставляло удовольствие взять набор непонятных разрозненных деталей и часами собирать из них что-то целостное, разумное, имеющее смысл. Так же работают и аналитики.

4.Точность и скрупулёзность

Аналитик по большей части имеет дело с точными категориями: данными, цифрами, алгоритмами. Составляя запросы, нужно совершать как можно меньше ошибок и максимально точно подбирать аудиторию.

5. Внимательность

Аналитик должен учитывать все факторы, которые могут повлиять на результат анализа, не упустить ни одной важной детали, иначе на выходе он получит неверные данные и сделает ошибочные выводы.

Карьера, график работы, зарплата

Карьера. Внутри компании можно из простого аналитика стать тимлидом, руководителем подразделения и развиваться в направлении менеджмента — разрабатывать и курировать собственные продукты, придумывать стратегии их развития.

Можно совершенствовать навыки программирования, повышать свою квалификацию как аналитика данных, переходить в более крупные компании, на более востребованное и престижное направление, заниматься дата-моделированием, большими данными (big data), делать прогнозы и предсказания.

График работы. Аналитики в офисе работают по обычному графику с 9:00 до 18.00 или с 10:00 до 19:00. Иногда приходится задерживаться на работе, но это зависит от нагрузки конкретного аналитика.

Аналитик может работать и удалённо: консультировать заказчиков, которым необходим анализ данных, писать приложения. Всё, что ему для этого нужно — компьютер или ноутбук, выход в интернет и доступ к базам данных.

Зарплата. Зарплата аналитика зависит от его опыта и квалификации, от компании, в которой он работает. В начале карьерного пути я получала 45 тысяч рублей, сейчас зарабатываю больше.

Средняя зарплата аналитика в Москве — 70 тысяч рублей. Начинающий аналитик сразу после окончания вуза может получать от 25 тысяч рублей.

Аналитик данных в будущем

Современный бизнес во многом строится на анализе данных о клиентах, продажах, эффективности рекламных стратегий, поэтому профессия аналитика сейчас очень востребована и останется такой в ближайшие десятилетия. Перспективные направления: работа с большими данными, дата-моделирование, экономическое прогнозирование. Кроме того, умение работать с большим количеством информации (анализировать, структурировать её, делать выводы) востребовано не только в экономике и финансах, но в любой другой сфере деятельности.

Читать еще:  Договор о полной коллективной материальной ответственности

Я считаю, что профессию надо выбирать по зову сердца, ориентируясь на то, что нравится делать. Какой бы перспективной ни была профессия, в ней невозможно достичь высот, если не получаешь от неё удовольствия.

Хотите получать новые статьи во «ВКонтакте»? Подпишитесь на рассылку полезных статей

Аналитика и статистика

По мнению работодателей, аналитическое мышление даже важнее владения конкретными инструментами:

— Сквозной курс, 24 недели, 3 ч/нед
— 15 комплексных проектов по аналитике
— 48 кейсов для всех этапов работы с данными
— Индивидуальная и групповая работа

Согласно анализу, в 84% вакансий аналитиков с опытом от 1 до 3 лет требуется знания SQL:

— Курс-тренажёр, 3 недели, 4 ч/нед
— 6 модулей, упорядоченных по сложности
— 240 упражнений
— Подборки внешних инструментов для дополнительной практики
— Возможность задать вопросы по обучению экспертам

Математическая статистика — третье по популярности требование для кандидатов-аналитиков:

— Курс-тренажёр, 6 недель, 4 ч/нед
— 12 модулей, от базовых понятий теории вероятности до множественных регрессий
— 400 упражнений
— Возможность задать вопросы экспертам

Владение таблицами – базовая компетенция. А решить сложные задачи, не изобретая велосипед — мастерство:

— Курс-тренажёр, 3 недели, 4 ч/нед
— 6 модулей, нацеленных на продвинутых пользователей
— Анализ данных и визуализация
— 240 упражнений
— Подборки внешних материалов
— Возможность задать вопросы экспертам

Скриптовый язык требуется в 83% вакансий для специалистов с опытом от 1 до 3 лет. В ближайшее время владение Python станет блокирующим для роста в сфере:

— Курс-тренажёр, 8 недель, 4 ч/нед
— 16 модулей, от введения в программирование до работы с API
— 480 упражнений
— Подборки внешних материалов
— Возможность задать вопросы практикам

Chief Marketing Officer, SkillFactory
ex-Руководитель отдела маркетинга «Нетология»
Менеджер по маркетингу Electronic Arts

Стоимость обучения

currentPrice basePrice
priceComment

Можно в рассрочку на 12 месяцев
installmentPrice в месяц
Подробнее

Уроки с упором на практику

Вы не просто изучаете алгоритмы, а учитесь использовать их в решении реальных бизнес-задач. После обучения сможете сразу использовать навыки в деле, а не разбираться с тем, как приспособить знания к жизни.

Уроки доступны на онлайн платформе, для вдумчивого изучения в любое время.

Помощь преподавателя и коллектива

Если что-то не получается, вы не остаетесь один на один с трудностью. Рядом преподаватель, который поможет разобраться с проблемой.

Учиться в коллективе лучше, когда видишь успехи остальных. Если у кого-то получается лучше, это подстегивает к более активным действиям. Если получается лучше остальных, то вы помогаете коллегам.

Делаем домашние задания

Тут все очевидно: чтобы научиться, нужно практиковаться. Дома вы делаете задания, пишете код, а преподаватель и сокурсники вам в этом помогают.

Работаем в команде на хакатоне

Вы будете работать в команде в условиях жесткого дедлайна: создавать гипотезы, кодить, проверять. Опыт проведения хакатонов на других наших курсах доказывает, что это очень важный и полезный для студентов навык.

Курс для вас, если вы:

1. Хотите научиться работать с данными и правильно подходить к решению аналитических задач. Выработать систему и изучить инструменты для анализа данных. Вы сможете применить знания в своих текущих проектах или в новой области.

2. Хотите сменить направление деятельности и стать аналитиком данных. Наш курс постепенно погрузит вас в реальную работу аналитика, а опытные наставники помогут решить сложные вопросы. После окончания у вас будет 3 полноценных проекта для портфолио и стройная система знаний в голове.

Основной ответ такой — наша специализация не является заменой бесплатным онлайн-курсам. Напротив, онлайн-курсы — это очень хорошо и полезно. Но у наших курсов есть неоспоримые преимущества: системность, фокус на практике, помощь преподавателя и поддержка группы.

Вместе с опытным аналитиком с опытом работы в топовых отечественных и зарубежных компаниях вы решите реальные бизнес-кейсы по анализу данных и пройдете все этапы проекта: сбор данных, обработка и анализ, формулировка и представление выводов. Вы научитесь правильно подходить к решению аналитической задачи, изучите все инструменты для обработки данных, математику и статистику для правильной интерпретации результатов.

Если вы столкнетесь с проблемой при выполнения задания, вам всегда будет, к кому обратиться: вы сможете получить совет от одногруппников и помощь преподавателя в закрытом сообществе в Slack.

Профессия Data Scientist: анализ данных

Станьте специалистом по анализу данных: используйте продвинутые методы и инструменты, чтобы автоматизировать рутину, работать быстрее или получить высокооплачиваемую должность.

Первым 20 участникам курса — скидка 40%

  • Подходит студентам без опыта
  • Преподаватели практики
  • Реальный проект для диплома
  • Зарплата от 80 000 р. в месяц

Курс идеально подойдет

Получите структурированные знания и начнете свой путь в профессии аналитика данных. Овладеете технической специальностью, даже если у вас нет глубоких знаний в теории вероятностей и статистике.

Аналитикам

Сможете автоматизировать и ускорить свою работу, строя достоверные прогнозы и подкрепляя свои выводы статистикой. Получите повышение или сможете перевестись на более интересную и высокооплачиваемую должность.

Менеджерам и бизнесу

Научитесь извлекать из массивов данных информацию для правильных управленческих решений. Автоматизируете рутину, сделаете бизнес-процессы прозрачными, поменяете Excel на продвинутые инструменты анализа.

Чему вы научитесь

Новые знания и навыки можно будет сразу же применять на практике.

Освоите программирование на Python

это самый популярный язык для работы с данными.

Сможете работать с источниками данных

CSV, XML и XLSX, JSON.

Научитесь визуализировать данных

с помощью библиотеки Matplotlib.

Разберетесь в программировании на R

сможете обрабатывать статические данные и работать с графикой.

Создадите аналитические панели.

разработаете визуальные дашборды с интерактивной инфографикой на фреймворках Shiny и Dash.

Поработаете с СУБД

будете использовать базы данных Vertica, Exasol, ClickHouse.

Записаться на курс скидка 40% первым 20

Программа курса

Программа курса содержит 3 основных блокa.

Аналитика. Начальный уровень

Статистика и теория вероятностей

Аналитика. Средний уровень

Получите полную программу и индивидуальную консультацию

Преподаватели

  • Валентин Пановский преподаватель МАИ, Chief Data Scientist в Skillbox
  • Михаил Овчинников Методист Skillbox. Докладчик крупнейших IT-конференций России.
  • Александр Джумурат руководитель команды разработки рекомендательной системы в ivi.ru
  • Алла Тамбовцева преподаватель НИУ ВШЭ
  • Лидия Храмова Team Lead Data Scientist группы бизнес-моделирования в Qiwi
  • Александр Крашенинников руководитель отдела Data Engineering в Badoo

Как проходит обучение

Вы выполняете домашние задания и открываете доступ к новому уникальному контенту по теме. Достаточно выделить 3–5 часов в неделю.

Изучаете
тему

В курсе — полезные видеоуроки.

Выполняете домашнее задание

В том темпе, в котором вам удобно.

Общаетесь с наставником

Закрепляете знания и исправляете ошибки.

Защищаете дипломный проект

И дополняете им свое портфолио.

Ваше резюме после обучения

Аделина Ветрова аналитик данных

Ожидаемая зарплата от 80 000

Python Язык программирования общего назначения, применяется для работы с данными.

Jupyter Notebook Командная оболочка для интерактивных вычислений.

NumPy Библиотека с открытым исходным кодом для Python.

Pandas Программная библиотека на Python для обработки и анализа данных.

SQL Язык программирования для работы с реляционными БД.

Matplotlib Библиотека на Python для визуализации данных 2D-графикой.

MongoDB Документоориентированная СУБД с открытым исходным кодом, не требует описания схемы таблиц.

R Язык программирования для статистической обработки данных и работы с графикой.

Shiny Пакет языка R, которые позволяет легко создавать интерактивные веб-приложения.

Plotly|Dash Фреймворк для создания аналитических дашбордов.

Ключевые навыки:

  • Python для работы с данными
  • Чтение и запись данных, работа с библиотеками.
  • Визуализация данных на Matplotlib.
  • Написание A/B-тестов.
  • Анализ временных рядов.
  • Выявление аномалий данных.
  • Создание аналитических панелей на R.

Диплом Skillbox

Подтверждает успешное прохождение курса «Профессия Data Scientist: анализ данных»

Профессия Data Scientist: анализ данных

Стоимость обучения

Скидка 40% первым 20

Стоимость обучения 102 000

2 550 Рассрочка без первого взноса

61 200 Для первых 20 студентов

Читать еще:  На меня написали заявление участковому

Гарантия возврата денег в течение 14 дней

Запишитесь на курс

Дата начала: 19 января

Осталось: 15 мест

О Skillbox

Максимально практическое обучение от лидеров digital-рынка. Курсы от компаний, работающих на реальных проектах.

После обучения вы можете трудоустроиться в эти компании или к партнёрам университета.

студентов учатся на наших курсах

студентов довольны преподавателями

выпускников получают карьерный рост

выпускников довольны курсом и результатом

Часто задаваемые вопросы

Я никогда не программировал. У меня получится?

Курс подходит для людей, не имеющих навыков работы с данными, языками программирования. Наши методики и система поддержки позволят вам научиться всему с нуля.

Какой график обучения? Получится ли совмещать его с работой?

Вы можете работать с материалами курса в любое удобное время, двигаясь по программе в подходящем вам темпе. Более того, все уроки будут доступны и по окончании курса, навсегда. Так что вы сможете освежить свои знания в любой нужный момент. Весь формат обучения построен таким образом, чтобы вы могли совмещать его с работой, учебой и личной жизнью.

Сколько часов в неделю мне нужно будет уделять учебе?

Вы сами выбираете нагрузку и скорость, с которой будете проходить курс. Хотите — занимайтесь два часа в неделю, хотите — шесть часов в день. Но в любом случае не забывайте отдыхать.

Я могу общаться с преподавателем?

Да, у вас будет доступ к закрытому Telegram-чату. Преподаватель будет лично комментировать домашние задания и давать полезные советы. Так вы сможете перенять уникальный опыт, профессиональные знания и лайфхаки от нашего преподавателя.

Действуют ли какие-нибудь программы рассрочки?

Да, вы можете купить курс в рассрочку — и спланировать свой бюджет, разбив всю сумму на мелкие ежемесячные платежи.

А я точно смогу трудоустроиться?

Курс дает достаточно знаний, чтобы получить позицию аналитика данных. Конечно, многое будет зависеть и от вас самих.

Записаться на курс или получить консультацию

Появились вопросы по курсу?

Оставьте ваш номер телефона, и наш специалист свяжется с вами, чтобы дать подробную информацию.

г. Москва, метро Октябрьская,
Ленинский проспект, дом 6, строение 20

Статистика в веб-аналитике, или Как стать настоящим Data Scientist

Получайте новые статьи на эл. почту

Зачем нужна статистика в веб-аналитике

Итак, что делать с информацией, которую вы собираете на своем сайте? Первое и самое простое, что можно узнать — откуда приходит трафик и его основные характеристики, число посещений, клики и т.д. Для этой задачи достаточно стандартных отчетов в Google Analytics.

Однако для расчета относительных метрик ( ROAS Прибыль от размещения рекламы = доход от размещения рекламы / расходы на рекламу × 100% , CPC Сумма, которую рекламодатель платит за один клик по его рекламе и др.) Google Analytics не подходит — иначе получится, как в анекдоте, средняя температура по больнице. Если не учитывать специфику отдельных рекламных каналов, внешние факторы и запущенные тесты, достоверность вычисляемых метрик сводится к нулю.

Есть вопросы и бизнес-задачи, ответы на которые можно найти, применив статистические методы. Например:

  • Классифицировать пользователей, чтобы эффективней работать с рекламными кампаниями.
  • Оценить изменения в дизайне сайта. К примеру, узнать с помощью A/B тестирования, как уменьшение количества полей в форме заказа повлияло на конверсию.
  • Понять, насколько критичной является просадка либо рост той или иной метрики. Для этого необходимо определить интервал допустимых значений основных метрик на сайте.
  • Спрогнозировать поведение пользователя на сайте по тем или иным показателям. Определить потенциальных покупателей и запустить для них рекламные кампании.

Условно весь процесс анализа данных можно разделить на три части:

  1. Digital-аналитика — сбор и анализ полученных данных. Этот этап включает в основном поверхностный анализ взаимодействий пользователей с сайтом и оценку маркетинговых усилий. Digital-аналитики помогают, к примеру, определить самые популярные страницы и категории товаров, найти слабые стороны в функционале сайта.
  2. Data governance — управление данными. Этот этап включает координацию задач между разными отделами в компании и управление доступом к данным.
  3. Data science — наука обработки и управления данными. На этом этапе происходит более глубокий анализ собираемых данных: поведение пользователей на сайте, офлайн-продажи, продажи через колл-центр, данные из CRM. Data Scientists могут оценить влияние того или иного фактора (источник привлечения, геолокация, день недели и т. д.) на наблюдаемый результат, например, конверсию и построить прогноз.

Чем Digital-аналитик отличается от Data Scientist

Фактически Digital-аналитика — это первая ступень на пути к Data Science. Наука о данных широко применяется в различных сферах: аналитике, биологии, медицине, психологии, политологии и т.д. Независимо от сферы деятельности любой Data Scientist должен:

  • Разбираться в предметной области и анализировать имеющиеся результаты.
  • Работать с большим объемом данных (владеть языками программирования R и Python, применять машинное обучение).
  • Разбираться в статистических методах анализа (математическая подготовка).

Если изобразить эти требования схематически, то получится вот такой рисунок, на котором Data Scientist будет в самом центре:

Чтобы понять разницу между Digital-аналитиком и Data Scientist, рассмотрим конкретный пример. Допустим, доход от сайта снизился на 3% по сравнению со средним значением прошлой недели.

  • Подсказать источник, где есть резкое падение трафика.
  • Определить время, когда проявилось снижение.
  • Подсчитать точный процент падения трафика для разных источников.

Data Scientist, используя методы математической статистики, будет рассматривать ситуацию с другого ракурса. Для начала он ответит на вопрос, выходит ли полученное значение дохода за границы области допустимых значений этой метрики (так называемый доверительный интервал). Является ли изменение дохода критичным. Возможно, на это изменение не стоит реагировать, например, если сегодня доход ниже чем на прошлой неделе, но не ниже среднего показателя за месяц.

В целом направление Data Science позволяет решать следующие задачи:

  • Управлять рисками, то есть советовать управленческие решения, которые снизят вероятность неблагоприятного результата и минимизируют возможные потери бизнеса. Подробнее о методах оценки риска вы можете почитать в этой статье.
  • Прогнозировать практически любые важные для вашего бизнеса показатели. Можно использовать для этого модель Бокса-Дженкинса. К примеру, построить прогноз по продажам конкретных товаров на заданный срок. Благодаря этим прогнозам можно планировать закупки, ценовую политику, рекламные кампании и акции.
  • Классифицировать пользователей с помощью логистической регрессии, пробит-регрессии или ROC-кривой. Например, для таргетирования. Вот интересный материал о том, как использовать логистическую регрессию для диагностики заболеваний и оценки кредитоспособности.

А теперь давайте разберем подробнее пару задач, для решения которых нужно применять статистические методы.

Как применять статистические методы в A/B тестировании

A/B тестирование, пожалуй, одна из самых распространенных задач в веб-аналитике. Чтобы результаты тестирования стали по-настоящему полезной информацией, на которую можно положиться, их нужно проверять на значимость. В этом-то и поможет статистика. При проведении A/B тестов следует учитывать такие понятия, как статистическая мощность, длина выборки, доверительный интервал и статистическая значимость. А теперь давайте на примерах разберем, что они означают.

Статистическая мощность измеряется в процентах и определяет, насколько вероятно, что тест покажет разницу между вариантом А и В, если она есть. К примеру, вы хотите проверить гипотезу, что мужчинам больше нравится зеленый цвет, чем красный. Если вы покажете разные варианты кнопки двум мужчинам и один нажмет красную кнопку, а другой — зеленую, можно ли говорить, что ваша гипотеза опровергнута? Конечно нет, потому что один из двух мужчин мог оказаться любителем ярких цветов или дальтоником. Если же вы покажете кнопки, например, тысяче посетителей сайта мужского пола, то уже сможете определить, кнопка какого цвета нравится мужчинам. То есть, чем больше длина (размер) выборки для теста, тем выше его статистическая мощность. Не стоит доверять тестам, статистическая мощность которых ниже 80%.

Так какой же должна быть выборка, чтобы результат был достоверным? Это зависит от того, какой статистической мощности и значимости (о ней мы напишем чуть ниже) вы ждете от теста. К счастью, считать длину выборки вручную совсем не обязательно — есть огромное количество удобных онлайн-калькуляторов, например этот. Как пользоваться этим калькулятором, вы можете почитать в статье.

Читать еще:  Договор дарения 1 2 доли квартиры образец

Следующий аспект, который нужно учитывать при A/B тестировании — это статистическая значимость. Она определяет, насколько вероятно, что тест показал разницу между вариантом А и В, которой в действительности не существует. Оптимальный уровень значимости для А/B теста (также его называют доверительной вероятностью) составляет 95%. То есть вероятность ошибки (так называемое Р-значение) составляет оставшиеся 5%. Статистическая значимость теста зависит от доверительных интервалов и площади их пересечения.

Доверительный интервал Предельные значения показателя, который с заданной доверительной вероятностью будет находиться в этом интервале при выборке большего объема показывает, насколько стабилен показатель, который вы получили в результате теста, то есть повторится ли он, если увеличить выборку. Допустим, вы показали тысяче посетителей своего сайта зеленую кнопку (вариант А), и 30% на нее нажали. Вычисляем погрешность для доверительного интервала с помощью онлайн-калькулятора и получаем ± 2,8%. Это значит, что если увеличить выборку, то с вероятностью в 95% на зеленую кнопку нажмут от 27,2% до 32,8% посетителей. Другой тысяче посетителей вы показали красную кнопку (вариант B), и на нее нажали 26%. Доверительный интервал для этой группы — от 23,3% до 28,7%.

Если сравнить доверительные интервалы для вариантов А и B, мы увидим, что они пересекаются в диапазоне от 27,2% до 28,7%. Графически это выглядит так:

На горизонтальной оси графика — KPI (в нашем случае конверсия), на вертикальной оси — плотность вероятности (плотность распределения случайной величины).

Чем меньше площадь пересечения доверительных интервалов, тем выше достоверность результатов тестирования. В нашем примере это пересечение составляет 1,5%. Эта цифра не превышает Р-значение в 5%, а значит тесту можно доверять.

Существует ряд статистических критериев, которые помогают решить, принимать или не принимать изначально поставленную гипотезу. Один из самых известных и применяемых — t-критерий (или критерий Стьюдента). На самом деле под t-критерием, как правило, понимают не один конкретный метод, а целый класс методов проверки статистических гипотез, основанных на распределении Стьюдента. Вот пример калькулятора, с помощью которого можно рассчитать t-критерий и проверить корректность теста. Просто заполните зеленые ячейки своими значениями, которые вы получили в результате тестирования.

А для гиков есть формулы 🙂

Применить t-критерий можно только при следующих условиях:

  1. Исходные данные должны иметь нормальное распределение.
  2. Если применяется двухвыборочный t-критерий для независимых выборок Проверяет гипотезу о равенстве средних значений в двух выборках. Применяется, например, когда нужно сравнить оценки по итоговому экзамену в двух разных ВУЗах , дисперсии должны быть равны.

Двухвыборочный t-критерий для независимых выборок

Если размеры выборок отличаются незначительно, применяется упрощённая формула приближенных расчетов:

где и — случайные величины, n1 и n2— количество элементов выборки, а

Количество степеней свободы рассчитывается как:

Основные преимущества t-теста в том, что он:

  • Нормально работает с огромными выборками (нет ограничения на объем данных).
  • Учитывает распределение и величину выборки.
  • Подходит для измерения разных параметров (можно сравнивать и количественные показатели в том числе).

Итак, вы решили стать Data Scientist. С чего начать?

Мы сделали подборку самых популярных и интересных ресурсов для легкого старта на пути от аналитика до Data Scientist.

В сети доступно множество бесплатных курсов, которые проводятся в формате лекций. После каждой лекции вы получаете небольшой список заданий и тем для самостоятельного изучения. Если что-то не выходит, вы можете задать вопрос преподавателю на форуме. Кроме того, по завершению курса можно получить платный сертификат. Вот несколько доступных площадок:

Язык программирования R — наиболее распространенный инструмент для работы с большими данными. Вот несколько ресурсов, которые помогут вам выучить язык и пообщаться с профессионалами:

И приятная плюшка — онлайн-игры по теории вероятностей и математической статистике:

Мы обещали парочку примеров использования статистических методов, а в статье уместилось только A/B тестирование. Оставьте свой email, и мы пришлем вам файл с примером, как классифицировать пользователей. Вы сможете выделить сегменты с наиболее высоким и низким LTV Прибыль, которую компания получает от одного клиента за все время сотрудничества с ним , чтобы применять для них разные маркетинговые стратегии.

Надеемся, статья была полезной 🙂 Если у вас остались вопросы, охотно ответим на них в комментариях.

СТАТИСТИКА И АНАЛИТИКА

Модуль статистики и аналитики в Flexcore CMS II занимает особое место и является значимой составляющей программного ядра платформы.

Глубокая интеграция средств сбора статистики и аналитических инструментов с функционалом движка, позволяют предоставлять пользователям максимально полные данные обо всех взаимодействиях посетителей с сайтом и об эффективности маркетинговых активностей.

Информационные виджеты

Виджеты отображают аналитику и статистические показатели сайта в сокращенном виде.

Они выводятся на рабочий стол платформы Flexcore CMS II и позволяют получить быстрое представление обо всех активностях и достижениях проекта.

  • Статистика посещаемости и просмотров страниц;
  • Наиболее посещаемые страницы сайта;
  • Глубина просмотров и среднее время, проведенное на сайте;
  • Популярные запросы (ключевые слова), по которым осуществлялись переходы на сайт;
  • Статистика SEO продвижения по ключевым словам (Яндекс и Google);
  • Информация о количестве заказов (сегодня, вчера, неделя, месяц);
  • Оценка источников совершения заказов в количественном и денежном выражении;
  • Средний чек;
  • Наиболее популярные товары среди просмотренных или приобретенных;
  • Статистика незавершенных заказов («брошенные корзины»);
  • Интеллектуальный советник.

Статистика посещений по сайту

Этот раздел содержит общую статистику всех посещений.

Здесь можно увидеть сравнительные данные о посещаемости за сегодняшний и любой другой день, а так же выбрать интересующий интервал дат для анализа.

В правой части находится график посещаемости и активные диаграммы, которые строятся по следующим типам данных:

  • Точка входа;
  • Страна и город посещения;
  • Браузер и операционная система посетителя;
  • Популярные страницы сайта;
  • Популярные поисковые запросы, в том числе с учетом запросов, которые скрываются поисковыми системами.

Кнопка «Позиции сайта» вызывает модуль SEO продвижение и позволяет посмотреть результаты продвижения сайта по ключевым словам.

В нижней части раздела находится список всех посещений за период.

Он представлен активной динамической таблицей, где цветом выделяются разные типы посетителей:

  • Зеленым подсвечиваются посетители, которые когда-то уже бывали на сайте «Вернувшиеся посетители»;
  • Желтым — посетители, совершившие заказ;
  • Фиолетовым — те кто по каким-то причинам не завершил оформление заказа и покинул сайт.

Детализация посещений

В каждое посещение можно войти и посмотреть детализацию:

  • Откуда пришел и какой путь постранично проделал посетитель;
  • Сколько времени пробыл на каждой странице;
  • На каком этапе совершил заказ, бросил корзину или сделал другое целевое действие;
  • Слева отображаются товары, которые были просмотрены;
  • Снизу — товары, которые посетитель положил в корзину покупок.

При нажатии на кнопку «История посещений» выводится вся история контактов данного посетителя с сайтом.
Можно увидеть, что месяц назад он заходил из Яндекс.Директ, неделю назад из соц.сетей и сегодня совершил целевое действие.

Блок аналитики представлен следующими функциональными разделами:

    «Источники привлечения прибыли» — показывает на каких информационных ресурсах наиболее выгодно размещать товарные предложения или другую информацию о вашем сайте.

Иногда, простая ссылка на сайте поставщика может приносить больше прибыли, чем платная реклама.
Аналитика Flexcore CMS II позволяет измерять эффективность рекламы и таких размещений.

  • «Источники совершения заказов» — рассчитывает эффективность источников трафика по количеству совершенных заказов.
  • Разделы «Брошенные корзины» и «Отказы» предоставляют маркетологу ценный аналитический материал.
    С его помощью можно вычислить слабые места сайта и работать над их улучшением.
  • Статистика

    Блок статистики позволяет объединяет множественные данные о посетителях сайта и предоставляет их пользователю платформы в виде сводных графиков и диаграмм, а так же в виде детализированных списков.

    Функционал блока позволяет делать выборку по датам и сегментировать посетителей по следующим типам данных:

    • Поисковые запросы;
    • Поисковые запросы (с учетом скрытых);
    • Среднее время нахождения посетителей на сайте;
    • Глубина просмотра страниц;
    • Популярные страницы сайта;
    • Популярные товары (покупки);
    • Популярные товары (просмотры);
    • Точка входа;
    • Точка входа, совершивших заказ;
    • Страна;
    • Город;
    • Браузер;
    • Операционная система.

    Если у вас несколько сайтов работает на платформе Flexcore CMS II, можно объединить их статистику и переключаться между сайтами не покидая окна.

    Модуль статистика и аналитика использует технологию распознования данных Flexcore Cerber

    Видео материал «Первое знакомство»

    Ссылка на основную публикацию
    Adblock
    detector