С помощью парсера получаем прямые ссылки 1000 страниц «Лучшие за все время».
Повторно пропустив ссылки через парсер получаем массив данных:
количество плюсов, название топика, флаги, хабы, автор, количество коментариев.
Данные экспортируем в таблицу csv что дает возможность без проблем обработать их в Excel.
Смотрим полученые результаты.
Чтобы написать хорошую статью нужно быть писателем.
738 человек авторы 1000 лучших постов. Из них количество постов.
37 — alizar
18 — Boomburum
9 — tangro
9 — veveve
8 — forgotten
Зацепить читателя темой топика. Лучшие статьи по количеству плюсов.
(Так они и отсортированы в ленте «Лучшие за все время»)
1448 — Делаем приватный монитор из старого LCD монитора
1154 — Были получены исходники 3300 глобальных интернет-проектов
913 — История игрушки. Поле Чудес
708 — Стив Джобс умер
668 — Принцип цикады и почему он важен для веб-дизайнеров
636 — История интернет-магазина, ставшего мировым монополистом за $5 000
629 — Отказ от устаревших браузеров / Блог компании ВКонтакте
627 — Спать мало, но правильно?
603 — Читаем QR код
564 — Плюсы и минусы работы из дома
Лучшие по количеству комитариев
2265 — Как раздавать инвайты на Google+
1829 — Раздача слонов или инвайты на Google+
1729 — Ещё +2Гб для вашего DropBox аккаунта. На сей раз, промо-акция DropBox и Three.com.hk
1469 — Зачем нужны попы в ВУЗе?
1076 — О том, что сегодня произошло с «аськой» (часть 1-я)
И наконец самое интересное — популярные хабы:
Информационная безопасность
DIY или Сделай Сам
Веб-разработка
GTD
Программирование
Железо
Дизайн в IT
Копирайт
Социальные сети и сообщества
Apple
*empty — блоги компаний и топики без хаба.
ссылка на оригинал статьи http://habrahabr.ru/post/156605/
Добавить комментарий