Каждый, кто собирал семантику для сайта в «Кей Коллекторе», в курсе, насколько это муторный процесс. Особенно сейчас, особенно из Украины, если есть нужда пропарсить «Вордстат» и «Директ». Надо купить левые прокси-сервера, антикапчу, дополнительные аккаунты Яндекса, сделать кучу настроек… Короче, штука не из простых.
Я по незнанию думал до этой недели, что эта штука безальтернативная, и это повергало меня в уныние. Оказалось, нет! Есть вполне себе сносный инструмент под названием MOAB. По крайней мере, просто спарсить ядро в нем (без чистки и разгруппировки) будет куда проще и быстрее, чем в старом-добром «Кей Коллекторе».
Плюсы новой проги: скорость и простота. Собирает быстрее, чем «Кей Коллектор». Интерфейс элементарный, сложные настройки не нужны — все решается в два нажатия мышкой. Есть фильтр по минус-словам. Никаких прокси, никакой капчи, никаких блокировок! Просто запустил процесс — и жди результата. Кстати, сбор идет в онлайне, и после запуска программы из нее можно выйти — не придется оставлять комп ночами, покуда продолжается парсинг. По окончании процесса просто выгружаем все ключи вместе с частоткой в форматах xml и txt.
Минусы: цена. Если «Кей Коллектор» требует купить разовую лицензию, и дальше можно работать с ним хоть до конца дней, то здесь придется платить за каждый запрос. Есть разные ценовые пакеты по принципу «чем дороже пакет, тем дешевле один ключ», но все равно, если у вас немаленькое ядро — выйдет недешево. До сотни баксов, а то и больше.
Но если объем ядра у вас не гигантский, то, как по мне, проще заплатить, зато сэкономить силы и время.
Ну и, как писал выше, в MOABе можно только собрать ядро. Чистить все равно придется в «Кей Коллекторе». Поэтому рекомендую две программы комбинировать: запускать парсинг в MOAB, а потом загружать данные в КК и чистить и группировать уже в нем. Сам пошел именно по такому пути.
Кому интересно, оставлю ссылочку.