- (Обновлено: ) Андрей Рыбкин
Как спарсить метаданные с помощью Excel, проверить битые ссылки, получить данные из поисковых систем? В сегодняшней статье мы рассмотрим возможности плагина SeoTools – одного из лучших дополнений Excel для анализа сайтов.
Используете Excel при аудитах сайтов? Тогда вам просто необходимо взять на вооружение плагин SEOtools for Excel. Он совмещает в себе функции Screaming Frog SEO Spider, Netpeak Spider и содержит множество дополнительных формул. Рассмотрим подробнее.
Какие задачи помогает решить?
- Проанализировать Title и метаданные всех страниц сайта или по списку урлов, указанному вручную
- Прогнать сайт по определенному списку показателей (удобно, что вы можете выбирать их самостоятельно и использовать при парсинге регулярные выражения), например, вес страницы, технические ошибки, кодировка, возраст сайта и т.д.
- Найти дубли страниц, спам, незаполненные данные в метатегах
- Проверить наличие ссылок на страницах (по анкорам и nofollow) и т.д.
Как установить?
— Скачиваем с официального сайта по ссылке или тут.
— Выбираем 32/64-битную версию (в зависимости от вашей конфигурации системы), создаем на рабочем столе (или место на ваше усмотрение) папку и туда распаковываем архив.
Как настроить?
Для начала определим, как будем использовать плагин: постоянно (интегрируем в Excel, плагин будет отображаться при каждом запуске Excel) или разово (запускаем через ярлык, не влияет на остальные наши Excel-файлы).
Рассмотрим оба способа:
— Интеграция в Excel:
Заходим в Excel во вкладку «Надстройки», щелкаем правой кнопкой мыши и выбираем «Настройка ленты»:
В появившемся окне выбираем «Надстройки» – «Перейти»:
В появившемся окне щелкаем на «Обзор» и выбираем файл “SeoTools.xll”, в папке, куда мы распаковали плагин:
Теперь у нас появилась новая панель:
Теперь при запуске любого Excel-файла мы можем работать с плагином SeoTools.
Важно! Теперь при открытии любого Excel-файла у нас будет 6-секундная рекламная задержка:
Если вы решили удалить этот плагин, заходим в надстройки (по аналогии с установкой) и снимаем галочку напротив плагина.
— Разовый запуск плагина:
Открываем плагин через файл в распакованной папке:
Таким образом плагин SeoTools будет появляться в Excel исключительно при запуске данного файла.
Совет: При сохранении документа с формулами из данного плагина ваш файл примет стандартный формат “xlsx” или “xls”. Чтобы продолжить работу с ним, открывайте вначале файл “SeoTools.xll”, а потом из него ваш сохраненный файл. Реклама будет отображаться при запуске файла “SeoTools.xll”.
Обзор плагина
Рассмотрим инструменты:
Spider или адаптированный под Excel Screaming Frog
Предназначен для парсинга сайта/списка урлов по определенным параметрам:
Варианты использования:
Задача 1. Нужно спарсить метаданные списка страниц (полезно для анализа текущих Title и метаданных).
Выбираем режим загрузки списка урлов, подгружаем txt-файл с урлами для проверки, выбираем необходимые параметры, запускаем:
На выходе мы получим title и метаданные:
Совет: Пустые ячейки означают, что данные не заполнены на сайте. В среднем на получение данных по одному урлу уходит 1 секунда.
Задача 2. Спарсить Title и метаданные определенного сайта (помогает при поиске спама, незаполненных данных, дублей)
Выбираем режим проверки одного сайта, вставляем его и выставляем лимит поиска побольше (максимальное количество результатов), выбираем необходимые параметры, запускаем:
Совет: Если сайт большой, парсинг затянется, в таком случае лучше запускать ночью или выставить определенный лимит поиска. Не забываем, что процесс жрет немало памяти, так что в игрушки вы вряд ли одновременно поиграете 🙂
У многих показателей есть возможность подсветки по определенному условию. Выделив каждый показатель, можно увидеть с левой стороны его особенности, например, Title подсвечивается по длине:
В данном случае мы подсвечиваем Title, длина которых меньше 10 или больше 70 символов, и видим текущую длину:
Кроме метаданных, как вы уже заметили в выпадающем меню, инструмент позволяет анализировать показатели социальных сетей, парсить email и другой контент с сайтов, различные показатели Google, ответы сервера, использовать регулярные выражения и многое другое.
Инструмент Spider удобен, если вам нужно прогнать сайт/сайты по определенному списку показателей.
Но что делать, если вы вручную хотите настроить анализ, самостоятельно прописать формулы, настроить отображение и последовательность?
Тут на помощь нам приходят следующие вкладки:
Onpage и Offpage
По сути, все эти показатели есть в предыдущем инструменте Spider, но если там они представлены в виде комплексного инструмента, то тут они разбиты на отдельные формулы и дают возможность настроить анализ индивидуально.
Как им пользоваться? Все просто – выбираете нужный показатель, а дальше проводите с ним стандартные манипуляции, как и с обычной формулой в Excel.
Задача 1. У нас есть сайт, нам нужно узнать кодировку, вес страницы, количество слов на странице, проверить W3C и ответ сервера (полезно при поиске битых ссылок и других ошибок)
Мы можем выбрать поочередно данные показатели в выпадающем меню для каждой ячейки:
Либо вручную копируем и вставляем в ячейку следующие формулы:
=W3CValidate(«https://ваш_сайт»)
=PageSize(«https://ваш_сайт»)
=WordCount(«https://ваш_сайт»)
=HttpStatus(«https://ваш_сайт»)
=PageEncoding(«https://ваш_сайт»)
Разумеется, фразу “ваш_сайт” заменяем на свой урл.
На выходе мы получаем ошибки, вес страницы, количество слов, ответ сервера и кодировку:
Если мы хотим проверить данные показатели для списка ссылок, то в формулах адрес сайта заменяем на ячейку, в которой находится ссылка:
=W3CValidate(A4)
=PageSize(A4)
=WordCount(A4)
=HttpStatus(A4)
=PageEncoding(A4)
*A4 – ваша ячейка с данными
И “протягиваем” формулы для всех ссылок с помощью мыши:
Вот что мы получим в результате:
Способом, показанным выше, вы сможете самостоятельно составить набор показателей для анализа.
Использование регулярных выражений
Плагин позволяет использовать регулярные выражения. Рассмотрим подробнее:
Задача 1. Узнать Title для определенной страницы
Используем конструкцию <title>([^>]*)</title>, сама формула будет выглядеть так: =RegexpFindOnUrl(«https://ваш_сайт»;»<title>([^>]*)</title>»;1)
Задача 2. Есть список урлов, нам нужно оставить только домен и отсечь все лишнее (полезно при проведении ссылочных аудитов).
Используем регулярное выражение https://([А-Яа-яA-Za-z0-9\.\-]+):
После “протягиваете” формулу вниз и получаете на выходе домены:
Таким образом, вы можете использовать любые регулярные выражения.
Получаем информацию по домену:
Выбираем показатели из выпадающего меню или используем следующие формулы:
=WhoIs(«Ваш сайт»)
=WhoIsDomainCreated(«Ваш сайт»)
=WhoIsDomainUpdated(«Ваш сайт»)
=WhoIsDomainExpires(«Ваш сайт»)
=IsDomainRegistered(«Ваш сайт»)
=InternetArchiveFirstSeen(«Ваш сайт»)
=ResolveIp(«Ваш сайт»)
=DomainAge(«Ваш сайт»)
Вот как это будет выглядеть в Excel для сайта:
Не все коту масленица, или ложка дегтя в плагине
Вы еще не забыли, что мы работаем в бесплатной версии? Инструментами, перечисленными ниже, в ней воспользоваться нельзя:
— Лимит на Spider
— Google Analytics
— Google Adwords
— SEMrush
— Ahrefs
— Moz
— SEOlytics
— Connectors (в выпадающем меню на скриншоте)
— Social (Facebook, Twitter, LinkedIn, Instagram и т.д.)
Лайфхак! Данные инструменты закрыты в текущей версии 5.0., которая скачивается с официального сайта. Но в предыдущей версии 4.3.5 доступны инструменты: Google Analytics! (этот один инструмент по аналитике равноценен всем перечисленным в статье), все показатели в разделе Connectors и Social (это еще около 50 формул, которые значительно облегчат вам анализ сайтов. Например, получение данных из соцсетей, поисковых систем и т.д.), Spider без лимитов. Я лично пользуюсь бесплатной версией 4.3.5, и она меня полностью устраивает, главное нововведение в версии 5.0. – это хайд 40% функционала в платную версию. Так что если решите серьезно работать с бесплатной версией плагина, рекомендую нагуглить версию 4.3.5.
Заключение
Как по мне, этот плагин musthave для всех Excelеманов-SEOшников, которые занимаются аудитами сайтов. Конечно, вы можете найти достаточно недостатков (начиная от скорости, заканчивая загрузкой системы) по сравнению с десктопными платными парсерами. Но не забывайте, что это приложение исключительно под Excel. Бесплатная версия достаточно юзабельная, а если еще взять версию 4.3.5, то единственное, чего недостает, – это отключить рекламу при запуске. Полагаю, что данный плагин займет достойное место среди ваших расширений Excel. Его функционал настолько огромен, что каждый раз, копаясь в инструментах, узнаешь что-то новое для себя.
Всем много-много трафика и хорошего настроения!
Еще по теме:
- Можно ли автоматизировать сбор подсказок в Google? Можно ли автоматизировать сбор подсказок Google? Ответ Самый простой способ сбора поисковых подсказок в Google – использование специализированных программ и сервисов, некоторые из них бесплатные...
- Как проанализировать текстовую релевантность всего содержимого веб-страницы? Как или каким инструментом можно проанализировать текстовую релевантность не только текста на странице, но и всех зон документа в целом, в том числе слова скрытые...
- Парсим сайт при помощи XPath Что такое XPath Терминология XPath и отношение узлов Синтаксис Предикаты Как парсить данные с помощью Google Spreadsheets Синтаксис XPath-запроса для Google Spreadsheets Распространённые выражения Разметка...
- Отслеживание отправки форм на сайте с помощью GTM Ранее мы уже писали о том, как установить и настроить Google Tag Manager на сайт, а также как с его помощью настроить отслеживание кликов. В...
- Обзор кластеризаторов семантики Coolakov Кластеризатор от RushAnalytics Кластеризатор от Serpstat KeyAssort Just-Magic Key Collector Топвизор Semparser Seoquick Кластеризатор от Majento Группировка запросов от Пиксель Тулс Megaindex Заключение Наиболее...
Есть вопросы?
Задайте их прямо сейчас, и мы ответим в течение 8 рабочих часов.
Удалось найти только совсем древнюю версию. Скажите, пожалуйста, где можно скачать или скиньте архив версии 4.3.5
Написал Вам на почту
Поделитесь линкой на скачивание 4.3.5, а то гугление не приносит резултатов.
Написал Вам на почту
На русском версии нет?
Нет, но там достаточно легко разобраться и не зная языка, все интуитивно понятно
Большое спасибо за статью.
По возможности поделитесь пожалуйста версией 4.3.5.
Спасибо!
Написал на почту
здравствуйте, можно мне тоже ссылку?
Добрый день. Отправил на почту.
Такие полезные посты появляются раз в год ))). Связать программу анализатор сайта и эксель это гениальное решение. Сам щас активно изучаю Excel с точки зрения SEO, и нахожу что это удобно и полезно. И, это, скиньте на мейсл ссылку на 4.3.5 версию. Заранее спасибо.
Добрый день. Спасибо ! Отправил на почту.
Здравствуйте.
Поделитесь пожалуйста ссылкой, если не сложно.
Спасибо.
Отправил
Андрей, спасибо за отличный материал! Тоже не нашла 4.3.5 версию, поделитесь, пожалуйста! =)
Отправил
Здравствуйте, Андрей.
То же "стаю в очередь" за версией 4.3.5 (пытался самостоятельно найти — но не получаеться). И это….., спасибо за отличный материал.
Отправил
Здравствуйте Андрей. Спасибо за статью. Использую в работе Spider и Ваша статья оказалась очень кстати. Буду очень признателен за ссылку на версию 4.3.5
Отправил
Плохо что под мак не работает, а под него софта не хватает(
Хорошая статья, спасибо. Добавлю блог в закладки.
Прошу поделиться ссылкой, на версию 4.3.5
Спасибо! Отправил
Андрей ,спасибо за статью. Поделитесь, пожалуйста, ссылкой на версию 4.3.5
Отправил
Отличный материал, спасибо. А я все по привычке — MySQL -> txt -> xls
Буду благодарна за ссылку на версию 4.3.5
Отправил
Буду признателен за ссылку на 4.3.5
Или может сюда выложите? Тема то актуальная.
Отправил
Здравствуйте. Спасибо за полезную статью. Можно тоже получить ссылку на 4.3.5. Спасибо еще раз!
Приветствую, спасибо за информацию, буду благодарен за ссылку на версию 4.3.5
Здравствуйте, поделитесь, пожалуйста, версией 4.3.5
Статья хорошая, но вот плагин не о чем. Все ошибки и прочее можно получить из spider frog и без платина + подтянуть данные из GA. Скорее всего он нужен только seo-конторам. Спасибо.
Спасибо. Spider frog платный и не работает в экселе 🙂
Да, век живи — век учись…Андрей, спасибо, очень интересно и по делу.
Я тоже в очередь за ссылочко на 4.3.5 🙂
Добрый день! Спасибо, всем отправил письмо на почту.
Привет, Андрей! Искал версию 4.3.5 в своем загашнике, но нашел только 4.2.4 Пришилте и мне тоже Вашу версию. Спасибо!
Добрый день. Спасибо! Отправил.
Большое мерси!
Добрый день! Очень интересная инфа, хотелось бы тоже ссылочку на версию 4.3.5 если можно.
Добрый день, отправил
Здравствуйте.Поделитесь пожалуйста плагином.Спасибо за статью!
Добрый день, спасибо, отправил
С последней версией (с оф сайта) что-то не очень: вообще Ексель 2010 утверждает, что это не файл надстройки Если возможно, дайте пожалуйсто ссылку на 4.3.5
Добрый день. Отправил вам на почту. Возможно вы что-то не так устанавливаете.
Установил присланную Вами, но спайдер в ней имеет ограничение в 50 страниц в free версии ("""Spider без лимитов""") и предлагает перейти на платную версию. Есть лайфхак снять ограничения?
В любом случае — мануал хороший, и расширением пользоваться буду.
Спасибо! Вы запустили данный плагин после установки последней версии с официального сайта? Если да, то удалите полностью версию 5.0. В версии 4.3.5 нет ограничений на паука, а сообщение об обновлении игнорируйте.
Большое спасибо, помогло!
Добрый вечер! Во-первых, спасибо за плагин. Но тоже столкнулся с ограничением в 50 страниц, хотя устанавливал именно вашу версию 4.3.5 (в этом можно убедиться, если нажать кнопку about в надстройке). Пробовал оба способа запуска, но не помогло. Может вы знаете от чего еще заивист успешность работы плагина? Может версия excel не подходит (у меня 2013). Буду рад, если сможете что-нибудь подсказать.
Добрый день, спасибо! Добавлю к своему предыдущему комментарию, удалите полностью все файлы, связанные с версией 5.0, и попробуйте запуститься в Экселе 2010. В чистой версии 4.3.5. программно нет никаких ограничений, но версия 5 и 4.3.5 могут конфликтовать между собой, хоть у вас запущена версия 4.3.5, ограничения могут подтягиваться с версии 5.
Добрый вечер.
И я буду благодарна за ссылку для скачивания версии 4.3.5 🙂
Спасибо за плагин. Но у меня такая же проблема, как у некоторых — выдает ограничение в 50 страниц, хотя ранее установленная версия 5 удалена полностью. Непонятно…
Добрый день. У части пользователей есть лимит, у части нет. Непонятно, с чем это связано. Вероятно, плагин у вас все же проверяет лицензию на официальном сайте.
Спасибо за чудесный мануал, можно тоже плагин получить? А то уж 5 версия дико режет все =(
Здравствуйте, Андрей.
Большое спасибо за статью.
Давно искал что либо подобное, и вот оно нашлось.
В сео немного разбираюсь, делаю оптимизацию сайтов для своих друзей.
Может быть вы сделаете видео или текстовый материал по формулам в эксель.
Если не трудно дайте ссылку на версию 4.3.5.
Еще раз спасибо!
Добрый вечер!! Прошу ссылку на версию 4.3.5. Спасибо!!
Добрый день. Отправил вам на почту
Спасибо за статью. Будьте добры, скинье ссылку на плагин
Здравствуйте. Очень интересный материал! Спасибо. Если можно ссылку на версию 4.3.5?
Добрый день. Такая же ситуация …скачал версию, ограничение на кол-во URL или обновится до PRO версии…Если ест ьвозможность отправте предыдущую версию…Спасибо.
Если не сложно, можно тоже ссылочку на почту. Заранее благодарю.
Добрый день. Андрей просьба поделиться ссылкой на версию 4.3.5 Оправьте пожалуйста стоимость Ваших услуг по SEO оптимизации сайта
Добрый день, Станислав!
По поводу стоимости – чтобы озвучить стоимость оптимизации, нужно ознакомиться с сайтом. Уточните, пожалуйста, URL сайта, оптимизация которого вас интересует.
Подобрана ли семантика для оптимизации страниц? Чтобы обсудить детальнее, вы можете написать нашему аккаунт-менеджеру Юлии на j.surnina@siteclinic.ru.
Плагин отправляем вам на почту.
Андрей, добрый день!
Спасибо за статью и ваш блог.
Можно попросить ссылку или дистрибутив версии 4.3.5?
Добрый день, Роман! Написала вам на почту.
Доброе утро Андрей! можно тоже ссылочку на версию 4.3.5. Спасибо!
Добрый день!
Андрей, если можно пришлите и мне ссылку. Спасибо за очень интересный материал.
Здравствуйте, Сергей! Не могу отправить письмо на указанную вами почту. Вы могли бы написать другой адрес (могу не публиковать его)?
Добрый день!
Спасибо за статью, все просто и понятно. Отдельно спасибо за лайфхак с версиями.
Если не сложно, можно и мне ссылку на дистрибутив?
Спасибо!
Добрый день! Написала вам на почту.
Андрей, большое спасибо за отличную статью, не могли бы вы и мне скинуть версию 4.3.5. Заранее спасибо.
А еще такой вопрос, вы не знаете, коннекторы в бесплатную принципиально нельзя подключить нельзя, или их просто не дают скачивать для бесплатной версии? Я просто нагуглил репозитарий с исходными кодами коннекторов от данного разработчика, теперь вот думаю, а можно ли их прицепить к бесплатной.
Добрый день. Меня в свое время тоже интересовал данный вопрос, структура кода в исполняемых файлах в новой и старой версиях сильно отличается, простые правки в исполняемых файлах не помогут. Но если у вас есть исходники, можете попробовать.
Если не сложно, можно и мне ссылку на дистрибутив?
Спасибо!
Если не сложно, можно тоже ссылку на почту. Заранее благодарю.
Добрый день!
Спасибо за подробное описание.
Андрей, если можно пришлите и мне ссылку.
Нагуглить, к сожалению, не получилось.
Прошу скинуть ссылку на версию 4.3.5 описанного в статье инструмента SeoTools , спасибо автору за познавательную статью.
Здравствуйте, Можно и мне ссылку на 4.3.5?
Здравствуйте, Андрей спасибо за ваш ресурс siteclinic.ru. Я для сео использую excel очень интересная статья у вас есть. Очень интересно. Но когда наткнулся на
плагин SeoTools для Excel. Скачал 7 версию но не стал ставить, наверное будет урезаны, многие функции. Андрей, если можно пришлите мне ссылку на 4.3.5 версию. Заранее благодарен.
Добрый день!
В который раз на вашем ресурсе нахожу мощный материал (как для начинающего).
Скажите пожалуйста — выше описанный плагин актуален в настоящее время?
Если да — буду признателен вам за ссылку на 4.3.5 — а то в выдаче все битые или ведут на весию 8.х.х
Добрый день! Тот же вопрос: если материал актуален и есть рабочая ссылка на версию 4.3.5, то нельзя ли ее получить, плизз.
Добрый день. Не понимаю. Версии 4.3.5 нет в интернете.
Дайте ссылку пожалуйста.