Регулярные выражения в Google Analytics. Примеры использования
Регулярные выражения (RegEx) используются во многих областях, упрощая (в основном) работу. Но я хотела бы остановиться на применении регулярных выражений в Google Analytics. Я думаю, каждый сеошник или интернет-маркетолог должен уметь фильтровать трафик. Согласны? И регулярные выражения – хороший помощник в этом. Так что вперед!
Вот некоторые символы регулярных выражений:
to.lz = toolz, toglz, todlz и т.д.
to..lz = tooolz, tokhlz, tofglz и т.д.
to*lz = toolz, totolz, tolz и т.д.
инструмент|снаряжение = и инструмент, и снаряжение
^дача = дача, но НЕ передача, задача и т.д.
htm$ = htm, но НЕ html
цвет(черный|серый|белый) = цвет черный, цвет серый, цвет белый
/map/country/(.*) – /map/country/belarus, /map/country/russia, /map/country/france и т.д.
\.html = .html, а НЕ «любой символ» и html
Как я написала выше, это лишь часть регулярных выражений, эти я применяю чаще всего. Весь синтаксис можно найти тут.
Применение регулярных выражений в Google Analytics
«Отфильтровать трафик» в GA можно в стандартном отчете или в кастомизированном. В обычном отчете регулярные выражения добавляются через расширенный поиск:
Отчет можно создать и самому (Настройка > Добавить отчет), как это сделала я, добавив простые показатели: Посещения – Достигнутые цели – Коэффициент конверсии цели, все это показывается по целевым страницам. Вот ссылка на этот репорт – https://google.com/analytics/web/template?uid=ZqCh74QsQkK1xJtK0GOfSg, можете сохранить его себе и применить к своему сайту, создав свои фильтры.
Регулярные выражения добавляются в фильтры следующим образом:
RegEx для целого раздела сайта
Предположим, нам нужно узнать статистику определенного раздела сайта. Для примера возьмем внутренние страницы раздела toolz.by/instrumentyi-dremel.html. Он состоит из нескольких страниц:
toolz.by/instrumentyi-dremel/graveryi.html
toolz.by/instrumentyi-dremel/lobzik.html
toolz.by/instrumentyi-dremel/akkumulyatornyie-bormashinyi.html
toolz.by/instrumentyi-dremel/graveryi/bormashina-dremel-4000.html
toolz.by/instrumentyi-dremel/kleevyie-pistoletyi/kovrik-dremel-gg40.html
toolz.by/instrumentyi-dremel/kleevyie-pistoletyi/dremel-910.html
toolz.by/instrumentyi-dremel/lobzik/moto-saw-ms20.html
Тут общая часть – /instrumentyi-dremel/, поэтому регулярное выражение будет следующим:
/instrumentyi-dremel/(.*)
Имя домена в регулярное выражение включать не нужно, потому что оно включено по умолчанию. Но если у вас в одном профиле находится сайт и поддомены, настроен фильтр по хосту, тогда имя домена в регулярное выражение включить стоит. В моем случае оно выглядело бы так:
toolz\.by/instrumentyi-dremel/(.*)
Создание регулярного выражения для некоторых страниц одного раздела
Возьмем тот же раздел, но статистику лишь по некоторым страницам. Например, этим:
toolz.by/instrumentyi-dremel/graveryi.html
toolz.by/instrumentyi-dremel/akkumulyatornyie-bormashinyi.html
toolz.by/instrumentyi-dremel/kleevyie-pistoletyi/dremel-910.html
toolz.by/instrumentyi-dremel/kleevyie-pistoletyi/kovrik-dremel-gg40.html
Одна общая часть у нас уже есть – /instrumentyi-dremel/, ищем дальше. В первых двух адресах нет ничего общего, они будут выглядеть так:
/instrumentyi-dremel/(graveryi|akkumulyatornyie-bormashinyi)\.html
В третьем и четвертом адресах есть общая часть /kleevyie-pistoletyi/, поэтому:
/instrumentyi-dremel/kleevyie-pistoletyi/(dremel-910|kovrik-dremel-gg40)\.html
При этом, если на сайте /kleevyie-pistoletyi/ есть только в разделе /instrumentyi-dremel/, то регулярное выражение можно немного уменьшить:
/kleevyie-pistoletyi/(dremel-910|kovrik-dremel-gg40)\.html
В итоге регулярное выражение для предложенных 4ех страниц будет выглядеть так:
/instrumentyi-dremel/(graveryi|akkumulyatornyie-bormashinyi)\.html|/instrumentyi-dremel/kleevyie-pistoletyi/(dremel-910|kovrik-dremel-gg40)\.html
Или
/instrumentyi-dremel/(graveryi|akkumulyatornyie-bormashinyi)\.html|/kleevyie-pistoletyi/(dremel-910|kovrik-dremel-gg40)\.html
Создание регулярного выражения для страниц из разных разделов
Предположим, нам нужна статистика для следующих страниц:
toolz.by/sadovyij-inventar/toporyi.html
toolz.by/slesarnyij-instrument/otvertki.html
toolz.by/yashhiki-dlya-instrumentov/organajzeryi/allit-flex-37-10.html
toolz.by/instrumentyi-dlya-xobbi/dlya-turizma.html
Как видно, в этих адресах общего вообще нет (ну кроме html), поэтому их придется включать в регулярное выражение практически полными:
(/sadovyij-inventar/toporyi|/slesarnyij-instrument/otvertki|/yashhiki-dlya-instrumentov/organajzeryi/allit-flex-37-10|/instrumentyi-dlya-xobbi/dlya-turizma)\.html
Но это регулярное выражение слишком длинное, поэтому нужно посмотреть, как еще его можно преобразить. Я люблю работать в сторону уменьшения символов в регулярных выражениях.
Если на сайте адреса страниц четко отражают структуру и не повторяют одни и те же товары в разных разделах, тогда уменьшить полученное выражение будет просто:
(/toporyi|/otvertki|/allit-flex-37-10|/dlya-turizma)\.html
Ну вот, так намного лучше.
Теперь о том случае, если на сайте есть страницы подобного плана:
toolz.by/kontaktyi.html
toolz.by/belarus/kontaktyi.html
toolz.by/russia/kontaktyi.html
toolz.by/france/kontaktyi.html
То есть тут часть kontaktyi.html повторяется, но в первом адресе она идет сразу за хостом, а в остальных трех – за названием раздела. Такое регулярное выражение найдет все региональные страницы контактов и добавит общую:
/kontaktyi\.html
Но предположим, нам нужно включить в отчет статистику по страницам контактов Беларуси, России и общей страницы. Тогда получится следующее:
^/kontaktyi\.html|(belarus|russia)/kontaktyi\.html
Отключение поиска страниц, содержащих переменные в адресах
С помощью фильтров можно как включать в страницы отчет, так и исключать их. Например, у меня есть страницы с различными переменными в адресах, но все они включают либо ?, либо =, чаще – и то, и другое. Мне неинтересна статистика по ним, поэтому я их исключаю из отчета с помощью следующего регулярного выражения:
\?|=
Подводим итоги
Регулярные выражения очень полезны при правильной настройке (и настрое:)). Я привела далеко не все многообразие примеров их использования. В моей недавней статье о том, как установить Тег Менеджер на сайт и настроить теги я упоминала об использовании регулярных выражений при создании правил срабатывания тега. Так что для работы с Тег Менеджером регулярные выражения также необходимы.
Пару советов напоследок:
Нужно искать общее в адресах страниц и группировать их в соответствии с этим. Таким образом, можно сократить количество символов в регулярном выражении.
Ваше регулярное выражение должно быть БЕЗ ПРОБЕЛОВ. Если вы не заметите пробел, то часть выражения после него работать не будет. Поэтому прежде, чем добавлять регулярку в фильтр, вставьте ее в Word, включите отображение значков скрытого форматирования и проверьте, не закрался ли к вам пробел.
Тестируйте, тестируйте и еще раз тестируйте! Только таким образом можно постоянно развиваться и учиться новому.
Буду рада, если в комментариях вы расскажете о своем опыте использования регулярных выражений!
Кристина, подскажите, пожалуйста, как настроить цель в google analytics, чтобы она считала переходы по контекстной рекламе рся? Там есть повторяющиеся выражение https://an.yandex.ru/count/….. Как записать это правильно в регулярных выражениях? И еще такой момент, это же получается переход не по внутренней ссылке сайта, а по внешней, событие я на нее создать не могу, и записать что то вроде: урл начинается с /count/, потому что GA подставит в начале урл моего сайта… Запутался совсем.
Здравствуйте, Дмитрий. Вы совершенно правы в том, что Вы не можете настроить regex с правилом “урл начинается с /count/”, т.к. эти адреса будут находиться не на Вашем домене.
Я вот не вижу смысла в настройке цели по переходам из РСЯ. Оттуда человек все равно приходит на Ваш сайт, и в браузере у него в итоге отображается урл именно Вашего сайта, поэтому этот урл можно затегать. Например: site.ru/?utm_source=YandexDirect&utm_medium=cpc&utm_campaign=YandexDirect. Статистику по таким переходам в Гугл Аналитике можно найти в Кампаниях. В моем примере статистика будет в кампании “YandexDirect”.
Быстро тегать адреса страниц можно с помощью этого сервиса – https://support.google.com/analytics/answer/1033867?hl=ru
Спасибо за столь развернутый ответ. Но вы наверное не совсем поняли что требуется сделать. У меня информационные сайты, которые не рекламируются через рся, а наоборот размещают рекламные блоки в себе. Переходы по контекстной рекламе и есть главный источник заработка на сайте, следовательно мне важна цель – клик по директу.
Да, Вы правы, я не совсем поняла, поэтому и ответила не то)
Клик по баннеру можно отследить событием в Гугл аналитике. Вот нашла для Вас этот пост – https://internet-marketolog.com/otslezhivanie-sobytij/. Надеюсь, поможет.
Спасибо. Сегодня узнал как открыть (not provided) в GA, могу поделится.
Это слинковать с Вебмастером? Или как-то по-другому?
Расскажите, конечно!
Да, нужна линковка с вембастером, вы наверное знаете этот способ )
Да, знаю)
Но у этого способа есть минус: вы не можете посмотреть на какие страницы переходили по ключевикам. А если включите страницы, то, соответственно, не сможете посмотреть ключи. Все очень хитро))
Для Гугла было бы глупо убирать все в (not provided) и давать потом доступ через Вебмастер.
Дмитрий, вы молодец! Делитесь своим опытом, буду рада
Спасибо :). Если выгрузить весь список ключевых слов, а потом найти самую релевантную страницу по каждому ключу через поиск в гугл по сайту, то можно узнать по каким ключам на какие страницы заходят (примерно, так сказать приоткрыть завесу). По моему Кейколектор умеет находит самую релевантную, можно в него загрузить.
Да, можно и так, но это крайне трудозатратно, если ключевиков много, и только примерно. Я бы не зацикливалась на этом)
Кстати, по поводу трекинга событий в Гугл Аналитике: тестирую сейчас отслеживание через Тег Менеджер кликов по внешним ссылкам. Очень даже интересно) Позже напишу и об этом.
Буду ждать
В первую очередь хочу поблагодарить Вас за прекрасную статью. Информация изложена просто и одновременно есть достаточно полезной и понятной.
Смотрите, у меня есть сайт. Нужно настроить отслеживание кликов по форме оформления обратного звонка, которая спрятана в коде страницы. При клике на ссылку URL формируется следующим образом: site.com#oredercall, site.com/category#ordercall, site.com/category/product# ordercall
Как я не пробовал настроить отслеживание кликов, у меня ничего не получалось.
Вы бы не могли помочь в этом вопросе?
juis недавно опубликовал(а)…Тренди Google в якості скрінсейвера
Здравствуйте! Спасибо)
Я не пробовала настраивать события для такого рода урлов, но я уверена, что они не сработают. Я думаю так, потому что в Аналитиксе не отображаются такие якоря, вместо этого все подобные страницы
site.com/category/product#ordercall
site.com/category/product#new
site.com/category/product#smth
будут склеиваться и отображаться как просто site.com/category/product
Все потому, что добавление к адресу якоря # не делает этот адрес уникальным.
Но суть в том, что Вам не нужен урл, чтобы настроить отслеживание кликов по кнопке. Я писала инструкцию, как настроить это через Гугл Тег Менеджер – https://promored.ru/2014/05/otsledit-otpravky-form-i-klikov-po-knopke/
Подскажите, пожалуйста, как можно решить следующую задачку.
Есть список урлов, примерно 50 000.
Необходимо определить посещаемость каждой. Как это можно сделать быстро и за один подход?
А если еще и в excel можно будет выгрузить, будет вообще бомба)
Здравствуйте, Никита.
Статья, к которой вы пишете вопрос, полностью на него отвечает.
Еще вариант – поставить расширение Google Analytics в excel.
Кристина, подскажите, как с помощью регулярки найти все урлы начинающиеся с определенного идентификатора. Пример урла https://site.by/категория/подкатегория/подподкатегория/39363-слова-через-тире.html. Допустим нужно посмотреть посещаемость новости с 2000 по 4000 ID? Спасибо.
Здравствуйте, Борис.
И где в вашем примере id, не могу понять? 39363? Просто ваш пример не “начинается с определенного идентификатора”, а начинается с категории.
Да, идентификатор 39363 и соответственно категории разные могут быть (экономика, политика и т.д.)
Обычно такие вещи можно вывести с помощью диапазона в квадратных скобках. В вашем случае, [2000-4000] – такое выражением должно включать в себя все новости с 2000 до 4000