Получи случайную криптовалюту за регистрацию!

Собираем LSI правильно Для тех, кто не в курсе - LSI - латент | Hey, moneymaker!

Собираем LSI правильно

Для тех, кто не в курсе - LSI - латентно-семантический анализ, если проще - список слов, который наиболее часто встречается в рамках конкретной темы. Для примера, автосервисам справедливо наличие слов "машина, автомобиль, ремонт, СТО, ...". Наша задача эти слова найти.

Задача популярная и востребованная, отсюда, как грибов после дождя, развелось огромное количество сервисов, и этот пост не про то, как закинуть список поисковых запросов в один из них. Проблема всех этих сервисов в том, что работают они по следующему принципу:
- на вход подаются поисковые запросы;
- выгружается XML выдача;
- собираются сниппеты;
- ищутся пересечения слов и строится сводная таблица "Слово - Количество упоминаний в сниппетах (!)

Чувствуете насколько ограниченные данные мы получаем? В итоге в список попадают "купить, Москва, цена, стоимость", которые и так мы будем использовать.

Правильный алгоритм:
- Собрать поисковые запросы под статью;
- Выгрузить топовые URL, причем желательно из двух ПС;
- Изучить plain-text;
- Составить таблицу соответствий по текстам;

Теперь по шагам:
- Семантику собираем любым доступным способом, это может быть вордстат или Кейс.со;
- Залетаем в сервис Кулакова;
- Вбиваем предварительно собранные запросы (30-50 шт), получаем топ страниц по видимости, выгружаем;
- Идём в сервис Ленара Амирханова
- Запускаем парсинг, пьём чай (очень быстро) и на выходе получаем список ключей с количеством их упоминаний;
- Отдаём в работу копирайтеру;

Данный метод чуть сложнее готовых сервисов, но даёт в разы более полезный результат. Не забываем, что парсить можно еще и выдачу гугла.