Как я ставил VPS для A-Parser, бесплатно. Часть 1

На свой первый Macbook Air я ставил Windows, и люди вокруг недоумевали. Мол, зачем тебе Mac в таком случае? Да просто он легкий, тонкий и удобный, но есть софт, который под маком не запустишь.

Когда появился более мощный ноутбук, я попробовал поставить Parallels с Windows. А туда A-Parser.

A-Parser — это софтина, которой можно спарсить что угодно и в каких угодно объемах. И очень быстро. A-Parser стал продолжением крутого софта Forbidden’а. Начиналось все с A-Poster, который с бешеной скоростью “оставлял” сообщения в гостевухах))

А был ли мальчик? Или почему A-Parser

Первым парсером был Outwit Hub, которым мы с Олегом и Жекой Шестаковым парсили ссылочные биржи на предмет качества доноров. Это было года 4 назад. Его подсказал нам Миша Сливинский. Outwit, однако, однопоточный. До сих пор пользуюсь по мелочи.

Не долго мучился со съемщиком позиций в KeyCollector, стало понятно, что-то надо решать. КК — удобный, но часто нужна кастомизация и скорость. И такая, чтобы можно было крутить данные в эксельке или даже загружать в BigQuery, и крутить там (тоже, кстати, бесплатно в разумных объемах).

В A-Parser встроено порядка 20 разных парсеров, на основе которых можно создавать свои. Шаблонизатор Template Toolkit позволяет на выходе получать данные в любом формате.

Описывать подробно не буду, все есть на их сайте и форуме. Скажу лишь одно — это must have для сеошников, которые занимаются прикладными вещами и у которых под боком нет живого программиста.

И вот сегодня мне надоело включать Parallels

Параллелька грузит ноутбук по самые уши, а держать включенным круглосуточно тоже не очень. Самое просто решение — повесить на VPS.

Процесс поиска всегда у меня получается витиеватым. Я вспоминаю про то, что надо бы безопасно хостить PBN (Private Blog Network). И натыкаюсь на сервис, который агрегигрует разные облачные хостинги в одну сущность-панельку. Среди облачного хостинга упоминается Amazon AWS. С ним я знаком по Amazon S3 и Glacier, на которых храню бэкапы (напрямую и через Arq Backup) и фотографии за очень недорого.

Среди прочих сервисов там есть EC2. Это облачные серверы и хостинг. Амазон всегда дает попробовать бесплатно и называет это free tier. В том числе и VPS. Однако он не получится совсем бесплатным. Во-первых, он бесплатный на 12 месяцев. Во-вторых, есть ограничения на передачу данных: 1GB для региональной передачи данных и 15GB совокупной выходной пропускной способности по всем сервисам AWS. То есть за передачу данных придется чуть-чуть платить.

Объем бесплатного диска тоже ограничен. После установки Windows из 30 выделенных гигабайт остается около 8. Но это легко решается подключением контейнера Amazon S3 как сетевого диска. И желательно в том же регионе, чтобы скорость была выше.

Завтра расскажу, как сетапить.

P.S. Для затравочки ниже скриншот настроек А-парсера под Яндекс. Во входном файле в каждой строке указываю запрос, кластер и группу. Кластера могут быть любыми, я пользуюсь рашем, а потом ручками и головой. Еще для кластеризации можно пользоваться Чекушиным, но пока пользовался только его текстовым анализатором.

Выходных файла 3 (на скрин не уместились):

  1. Подсветки тайтлов, сниппетов + урл, запрос, кластер, группа
  2. Позиции + урл, запрос, кластер, группа
  3. Все данные, включая ссылку на кэш. Сюда же можно выдачу по Директу.