Парсим контент вКонтакте с помощью скрипта
При создании сайтов для заработка на различных биржах ссылок самым актуальным и первостепенным являет вопрос контента. Выбор хостинга, домены, админки для сайта — все это можно решить разными методами и на конечный результат оно особо не влияет, а вот тексты для своих сайтов нужно где-то брать. Собственно, тут тоже есть парочка вариантов — использовать сканированный контент, синонимайз, просто копипаст и т.п. Одним из вариантов получения текстов на свои проекты есть закрытые от поисковых системы источники — социальные сети, локальные форумы. Наиболее интересный и доступный для нас источники информации это, конечно же, социальная сеть вКонтакте. Учитывая тот факт, что объемы контента для сайтов весьма велики, без специальной програмки (парсера) тут не обойтись. Данный пост поведаем вам о таком полезном скрипте для парсинга текстов вконтатке.
Данный скрипт позволяет позволяет парсить уникальный контент с закрытых групп вКонтакте в виде галерей, комментариев и обсуждения в группах. Таким образом вы можете заниматься созданием сайтов практически в автоматическом режиме, поскольку задача сводится к поиска подходящих тематических групп и задании параметров (ссылок) для парсинга. Конечно, при этом нужно будет позаботиться о создании сайта, должны образом его оформить, возможно добавить необходимые плагины, но вопрос контента, по сути, решается максимально просто. Копирование информации вручную заняло бы немало времени, с помощью скрипта все делается гораздо проще.
Все тексты из вКонтакта парсятся в систему правления сайтами Livestreet. Когда-то давно я уже писал о бесплатном движке LiveStreet CMS для создания социальных сетей. С тех пор его разработка лишь улучшилась, функциональность сейчас достаточно мощная, к созданию модулей подключились опытные программисты, а примеры сайтов на LiveStreet выглядят весьма качественно. Если кратко говорить о системе для тех, кто с ней не знаком, то у вас имеется что-то вроде сообщества пользователей, каждый из которых пишет в личный или тематический блоги. При этом все пользователю имеют личный кабинет, разные социальные функции в видел голосования, комментирования и т.п. По стилистике проект похож на Хабр, вроде бы он даже по его мотивам и создавался. В целом LiveStreet достаточно интересная система, которая должна весьма хорошо восприниматься поисковиками, небезразличными к разного рода социальным сайтами.
Установка и настройка скрипта парсинга вКонтакте
Данный скрипт распространяется по электронной почте и является платным. Стоимость комплекса 130wmz, давайте рассмотрим что сюда входит и как это все работает. Архив состоит из 3-х частей:
- Исходник системы LiveStreet CMS, подготовленный к работе
- Скрипт парсинга обсуждений закрытых групп
- Скрипт парсинга фотогалерей
Первым делом мы, конечно, устанавливаем LiveStreet, причем нужно брать исходник именно из скрипта, так как в нем представлена более молодая версия системы (ls 3.1), отличающаяся от последней. В качестве требования для функционирования системы указано PHP не ниже версии 5.2.1 с поддержкой расширения mbstring, база данных MySQL 5. По словам разработчиков LiveStreet работает как на вебсервере Apache 2 с включенным модулем mod_rewrite, так и на связке nginx + FastCGI. В процессе установки я также столкнулся с тем, что для парсинга понадобиться установка библиотеки lib_curl, а так в принципе требования вполне стандартные подходящие для всех нормальных хостингов.
На официальном сайте системы вы можете почитать про автоматическую и ручную установку LiveStreet последних версих, я расскажу что нужно делать по скрппту:
- Первым делом копируете все файлы папки (/sborka/ls) на фтп хостинга в корневую директорию сайта.
- Дальше создаем на хостинге новую базу данных и пользователя для нее. Импортируем в нее дамп из файлов sql.sql и gallery.sql.
- После этого в файле config/config.db.php указываем все доступы к созданной БД.
- Запускаем наш сайт, все по идее должно работать.
Дальше непосредственно нужно установить скрипты парсинга. Для каждого из них вы найдете инструкцию по установке в фалах readme.txt. Вкратце вам придется записать эти файлы в ту же директорию, где установлен LiveStreet, плюс в одном из них указать логин и пароль для доступа в систему.
После этого можете запускать скрипт парсера http://site.ru/vkparser/ и копировать информацию. Вам нужно будет указать из какой группы брать тексты, сколько должно быть записей и куда их размещать. Более подробно почитаете в инструкции по установке, выглядит это все приблизительно следующим образом:
Вот в принципе и все. Понятное дело, что одним кликом вы не создадите сотню сайтов и не заработаете миллион. Скрипт парсинга вКонтакте — это всего-лишь инструмент, который поможет вам значительно ускорить процесс создания сайтов, не более того.
К преимуществам скрипта можно отнести:
- Быструю работу.
- Простоту установки и использования.
- Парсинг не только контента, комментариев, но и галереи изображений, что добавит сайту «человечности».
- Много уникального контента из социальной сети вКонтакте, поскольку 95% групп являются закрытыми.
- Использование хорошей системы LiveStreet с большими возможностями, который идеально подходит для отображения контента из социальной сети.
Если вы все будете делать правильно, осторожно и грамотно, то сможете получить хорошие СДЛ сайты с большим числом страниц для заработка на биржах ссылок.
- Стоимость скрипта: 130вмз.
- Для покупки обращайтесь: icq 7084901.
По словам разработчика он весьма успешно использует данный скрипт для парсинга еще с лета. За это время ни один сайт не попал под АГС, потому как контент получается уникальный, отображается с помощью LiveStreet очень естественно.
Удачной всем работы:)
P.S. Постовой. Если вы хотите купить одежду, то можете с легкостью сделать это зайдя в интернет магазин женской одежды — подробный каталог товаров, брендовая одежда.
Грамотная оптимизация и раскрутка сайта от SeoProfy в персональном блоге опытного сеошника.
Для печати листовок обращайтесь в художественно-издательский центр, где услугу цифровая цветная печать москва выполняется максимально быстро и недорого.
Контент с контакта максимум для форумов годится) или для комментов на сайте. И ничего больше!
Не люблю парсинг. Подойдет только для тем на форумах и гостевых книг.
Сомнительное занятие, по сути воровство контента. Да и полезного в Контакте очень мало, как написали выше…
kyoks, ну и нормально, коменты ведь создают эффект живого общения.
Aventura, воровство контента это, конечно, плохо, только самому вконтакту пофигу на авторские права, я уже не говорю о запрещенных материалах:)
Ну выглядят примеры, довольно живыми. Я удивился, что они на вконтакте построенны.
А есть какие нибудь примеры спарсеных сайтов?
Интересно посмотреть, что они из себя представляют, ведь те же самые обсуждения в один пост не засунешь, действительно будет годиться только для комментариев.
Глеб, за примерами нужно обратиться к автору скрипта, палить на разрешил, могу только сказать, что много страниц в индексе и посещаемость небольшая была, визуально все весьма красиво и натурально. Так все обсуждения в один пост и не засовываются, получается что-то вроде тема + комментарии, как в блоге.
Кому будет интересно есть программа для администраторов групп вконтакте: VKGroupCommentsToCSV – сбор комментариев к фотографиям и обсуждениям для групп vkontakte
Интересная темка. Спасибо автору, будем изучать