Какой метод представляет собой сплит тестирование а также зачем оно используется
сплит тестирование представляет формат подход проверки двух а также дополнительных версий веб-страницы, экрана, сообщения, CTA-элемента, анкеты, email-сообщения, промо сообщения либо иного веб элемента. Его цель заключается в необходимости задаче, для того чтобы выяснить, который формат лучше работает в практике. Взамен предположений а также субъективных суждений применяется тест на живой аудитории, когда контрольная доля получает вариант A, и другая — формат B.
Этот метод дает возможность формировать решения по результатах данных, вместо этого без опоры на личных мнений либо единичных наблюдений. В обзорных источниках, включая 1win, часто отмечается, поскольку сплит тестирование особенно ценно в ситуациях, при которых точечные изменения имеют шанс сказываться на поведение аудитории: клики, регистрации, отправку заявок, длину просмотра, лояльность, заказы, подключения а также прочие целевые результаты. Эксперимент позволяет проверить, на самом деле ли именно изменение улучшает 1win эффект.
Как работает А/Б эксперимент
Принцип сплит проверки относительно прост. Сначала определяется объект, какой требуется протестировать. Это имеет шанс быть headline, визуальный тон элемента действия, последовательность элементов, текст сообщения, построение анкеты, картинка, стоимость, тип предложения либо место важного шага. Далее создаются не менее двух версии: исходный и тестовый. Вслед за этим трафик делится по версиями согласно заранее определенным условиям.
Контрольная часть пользователей продолжает видеть старую страницу, а тестовая получает обновленную. Инструмент собирает данные касательно реакциях отдельной части затем сопоставляет метрики. В случае если решение B дает лучший эффект при достаточном массиве данных, эту версию допустимо использовать. В случае если отличия не наблюдается или обновленная страница работает хуже, правка отклоняется. Как раз в таком подходе и заключается реальная ценность теста: эксперимент помогает проверять гипотезы до момента окончательного 1вин внедрения.
Почему используется сплит тестирование
А/Б проверка необходимо с целью уменьшения неясности. Внутри веб платформах в том числе незначительная правка имеет шанс влиять по части восприятие дизайна. Один заголовок имеет шанс оказаться яснее другого, короткая анкета способна заполняться регулярнее длинной, а заметно более выразительная CTA имеет шанс увеличить число нажатий. Без тестирования такие решения нередко сохраняются догадками.
Подход позволяет улучшать платформу поэтапно. Взамен масштабной переделки полного сайта а также аппа допустимо оценивать точечные объекты плюс записывать фактический эффект. Это уменьшает угрозу ошибочных изменений, сокращает расход затраты плюс позволяет собирать данные касательно поведении посетителей. Через временем специалисты 1 win собирает не случайный набор оценок, вместо этого базу валидированных решений.
Какого типа элементы допустимо сравнивать
Тестировать допустимо практически любой объект, что сказывается на реакции пользователя. Обычно преимущественно проверяют названия, подзаголовки, CTA для клику, формулировки кнопок, поля регистрации, позицию блоков, визуалы, карточки продуктов, очередность этапов, инструменты отбора, навигацию, промоблоки, сообщения, email-сообщения плюс маркетинговые объявления. Необходимо, чтобы указанный блок оставался соотнесен с заданной задачей.
В случае если ориентир состоит в необходимости увеличении заполненных форм, логично тестировать заявку, сообщение рядом с формы, число элементов ввода а также выразительность элемента действия. В случае если нужно увеличить длину сессии, имеет смысл тестировать навигацию, модули рекомендаций, внутрисайтовые переходы и структуру страницы. Насколько точнее соотношение 1win среди корректировкой а также целью, тем самым информативнее итог эксперимента.
Предположение как база теста
Любой хороший сплит эксперимент запускается на основе предположения. Проверяемая идея показывает, какое именно правка рассматривается, почему такая правка способно сказаться по части эффект и какой именно результат обязан измениться. К примеру, получается допустить, если уменьшение анкеты регистрации сократит количество уходов, так как ведь пользователю нужно будет значительно меньше времени ради окончания процесса.
Хорошая формулировка не следует быть очень общей. Формулировка наподобие «улучшить страницу удобнее» не помогает измерить эффект. Намного более полезный формат: «при условии что обновить длинный надпись кнопки на более короткий а также понятный, количество кликов увеличится, поскольку что именно ожидаемый результат будет очевиднее». Такая формулировка непосредственно 1вин задает элемент проверки, причину а также метрику.
Исходная а также измененная выборки
В сплит эксперименте контрольная аудитория видит старый версию, а проверочная — новый. Это разделение необходимо для корректного сравнения. В случае если только обновить раздел а также оценить результаты перед а также после, эффект может испортиться из-за периодичности, маркетинговой активности, перестройки источников посещений, событий, служебных проблем а также других внешних факторов.
Синхронный запуск разных версий снижает воздействие случайных обстоятельств. Обе выборки остаются в похожей обстановке: тот же а также же идентичный отрезок, схожие идентичные источники пользователей, похожие девайсы плюс единый контекст. Поэтому отличие в результатах с большей 1 win большей долей уверенности связано как раз с данным корректировкой, но не столько с случайными факторами.
Какого типа критерии применяются при сплит экспериментах
Метрика — это число, по чему проверяется итог эксперимента. Подбор критерия строится на основе задачи проверки. В случае страницы с размещенной заявкой важны заполнения заявок, в случае онлайн-магазина — переносы к заказ и покупки, для медиа — длина просмотра плюс время просмотра, ради сервиса — создания аккаунтов, активации, удержание и следующие 1win активности.
Существенно отделять ключевую а также вспомогательные метрики. Основная демонстрирует, ради какого результата запускается эксперимент. Вторичные дают возможность выявить сопутствующие последствия. В частности, правка CTA имеет шанс повысить нажатия, но уменьшить качество последующих шагов. Следовательно полезно смотреть не исключительно только на начальный шаг, но и по последующее поведение: окончание формы, повторные визиты, уходы, сбои а также общую эффективность результата.
Математическая существенность
Расчетная существенность показывает, в какой степени возможно, будто полученная отличие между версиями не является является случайным колебанием. В случае если один решение немного опережает альтернативный после нескольких малого числа сессий, такой результат еще не означает означает преимущество. На фоне ограниченном объеме данных показатель способен резко измениться, после того как 1вин аудитория окажется шире.
Для надежного итога необходимо значительное объем наблюдений. Насколько скромнее предполагаемая дельта между решениями, тем объемнее наблюдений нужно накопить. Когда изменение должна улучшить показатель всего на малое число процентов, эксперименту будет необходимо повышенный объем срока и посещений. Расчетная достоверность дает возможность избегать выносить преждевременные решения по основе временных изменений.
Объем выборки а также длительность проверки
Масштаб аудитории воздействует по части качество результата. В случае если проверка видит слишком мало посетителей, выводы имеют шанс быть сомнительными. В частности, малое число дополнительных кликов внутри конкретной аудитории способны казаться как увеличение, но на значительном масштабе окажутся обычной погрешностью. Из-за этого перед запуском разумно рассчитывать, какое количество людей 1 win а также действий нужно для оценки гипотезы.
Длительность проверки также имеет роль. Очень быстрый тест может не учитывать учитывать различия между будними и выходными сутками, рабочей а также послерабочей активностью, отличающимися потоками посещений. Чаще всего тест должен охватывать полный цикл поведения посетителей. Но при таком подходе очень затянутый эксперимент равно неоптимален, когда сторонние условия могут существенно поменяться.
Почему не стоит менять тест в течение время работы
Одна из из частых проблем — делать правки в проверку после момента начала. Если по ходу середине проверки поменять сообщение, сегмент, оформление, условия вывода а также метрику, данные смешаются. В таком случае окажется сложно выяснить, какое изменение именно сказалось по части итог. Проверка утратит прозрачность, а результаты окажутся ненадежными 1win.
Перед запуском нужно установить гипотезу, варианты, показатели, распределение аудитории и критерии остановки. Вслед за старта лучше не нужно корректировать тест без критичной причины. Когда обнаружена проблема внутри конфигурации либо технический сбой, разумнее закрыть эксперимент, исправить проблему а также создать другой эксперимент, чем пробовать интерпретировать некорректные данные.
Одновременное сравнение многих изменений
Иногда возникает идея проверить сразу группу решений: обновленный headline, иную кнопку действия, укороченную форму плюс перестроенный порядок элементов. Такой вариант имеет шанс дать итоговый эффект, однако не сможет раскроет, какой конкретно блок воздействовал в отношении метрику. Когда новая страница победила, сохранится неясно, какая правка помогло сильнее всего.
Для чистой оценки обычно корректируют один важный объект на 1вин одну проверку. Когда необходимо проверить многие вариаций, применяется многофакторное тестирование. Оно труднее, требует значительного объема посещений и корректной интерпретации. В случае многих задач сплит тест с конкретной понятной проверкой обеспечивает намного более чистый и ценный эффект.
Примеры A/B проверки на уровне дизайне
Внутри дизайнах А/Б тестирование часто задействуется для оптимизации ясности шагов. К примеру, допустимо проверить пару версии заявки: объемную с большим множеством полей а также краткую с небольшим сокращенным числом данных. Если короткая анкета увеличивает количество завершенных регистраций без потери ценности форм, этот вариант получается оценивать гораздо более результативной.
Следующий пример — сравнение формулировки CTA. Сдержанная фраза может оказаться не такой очевидной, по сравнению с точное описание результата. Также проверяют расположение кнопок, порядок информационных блоков, подачу 1 win подсказок, использование прогресс-бара, метод отображения ошибок и объем шагов на протяжении пути. Каждый этот элемент сказывается в отношении то самое, как легко завершить целевое шаг.
А/Б тестирование на уровне содержании
Внутри материалах эксперимент позволяет выяснить, какие headline-блоки, анонсы, схемы плюс форматы сильнее сохраняют внимание. Получается сопоставлять несколько интро, размер текста, логику аргументов, присутствие списков, дизайн блоков, описание плюсов либо манеру подачи трудной темы. Однако при этом необходимо оценивать не лишь клики, однако еще последующее действие.
Headline способен увеличить объем кликов, однако когда контент не совпадает интересам, увеличится часть уходов. Из-за этого текстовые тесты обязаны анализировать ценность контакта: период изучения, скролл, перемещения в пределах платформы, повторные визиты а также завершение заданных результатов. Хороший эффект — является не исключительно получение внимания, вместо этого соответствие ожидания а также содержания.
A/B проверка внутри email-рассылках
Внутри email-рассылках часто тестируют темы писем, название автора, начальные фразы, время отправки, размер email, расположение элементов действия а также формулировки предложений. Одна часть аудитории открывает контрольную формат email, часть — другую. После этим анализируются просмотры, нажатия, отказы от подписки, жалобы и следующие действия на платформе.
Важно не останавливаться значением открытий. Тема письма может быть заметной плюс привлекать внимание, при этом если она не сможет соответствует содержанию, нажатия и лояльность могут снизиться. Поэтому полезный email-тест измеряет полную воронку: просмотр, нажатие, действия после клика а также ответ аудитории на рассылку.