У меня возникла проблема — как получить видео с всеми известной соц.сети vkontakte.ru. и установить его на сайте. Ключевой момент, я не хотел использовать IFRAME или же ещё какие-то сервисы ВК, я хотел чтобы видео выглядело так, как будто оно лежит у меня на сайте. Облазив пару десятков сайтов, максимально что я нашёл, это сайты для загрузки видео, такие как ВИДЕОСЕЙВЕР и тп. Это всё не подходило, поскольку мне нужен был код которой я мог интегрировать в свой PHP движок.
Нашлось пару самописных PHP скриптов – которые стоили от 30 до 500 у.е. Но половину из них были закодированы Zend Encoder – ом или же просто использовали свои сервера для поиска видео-файлов и не имели особой ценности для меня.
Так началось вдохновение. Я решил использовать мобильную версию поскольку она намного проще. Первым дело я составил алгоритм получение видео с ВК.
Вход В ВК
Первым куском кода был вход в ВК. Я порылся в интернете и нашел нечто подобное:
(Код с учётом моих исправление)
ini_set('error_reporting', E_ALL); ini_set ('display_errors', 1); $user_agent = 'Mozilla/5.0 (Windows; U; Windows NT 6.0; ru; rv:1.9.2.13) ' . 'Gecko/20101203 Firefox/3.6.13 ( .NET CLR 3.5.30729)'; $login = ‘логин’; $password = ‘пароль’; function curl_gets_exec($ch, $redirects = 0, $curlopt_returntransfer = true, $curlopt_maxredirs = 10, $curlopt_header = false) { curl_setopt($ch, CURLOPT_HEADER, true); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); $data = curl_exec($ch); $header=substr($data,0,curl_getinfo($ch,CURLINFO_HEADER_SIZE)); $http_code = curl_getinfo($ch, CURLINFO_HTTP_CODE); $exceeded_max_redirects = $curlopt_maxredirs > $redirects; $exist_more_redirects = false; if ($http_code == 301 || $http_code == 302) { if ($exceeded_max_redirects) { list($header) = explode("\r\n\r\n", $data, 2); $matches = array(); preg_match('/(Location:|URI:)(.*?)\n/', $header, $matches); $url = trim(array_pop($matches)); $url_parsed = parse_url($url); if (isset($url_parsed)) { curl_setopt($ch, CURLOPT_URL, $url); $redirects++; return curl_gets_exec($ch, $redirects, $curlopt_returntransfer, $curlopt_maxredirs, $curlopt_header); } } else { $exist_more_redirects = true; } } if ($data !== false) { if (!$curlopt_header) list(,$data) = explode("\r\n\r\n", $data, 2); if ($exist_more_redirects) return false; if ($curlopt_returntransfer) { return $data; } else { echo $data; if (curl_errno($ch) === 0) return true; else return false; } } else { return false; } } $ch = curl_init(); curl_setopt($ch, CURLOPT_USERAGENT, $user_agent); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_TIMEOUT, 10); curl_setopt($ch,CURLOPT_REFERER,'http://m.vk.com/login?fast=1&hash=&s=0&to='); curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false); curl_setopt($ch, CURLOPT_COOKIEFILE,'cookie.txt'); curl_setopt($ch, CURLOPT_COOKIEJAR, 'cookie.txt'); curl_setopt($ch, CURLOPT_POST, false); curl_setopt($ch, CURLOPT_POST, true); curl_setopt($ch, CURLOPT_URL, 'https://login.vk.com/?act=login&from_host=m.vk.com&from_protocol=http&ip_h=&pda=1'); $answer = curl_gets_exec($ch); $post = array( 'email' => $login, 'pass' => $password ); curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($post)); $answer = curl_gets_exec($ch); </code> Данный кусок кода делает довольно несложные действия – создаётся запрос , такой как будто бы его делал ваш браузер эмулируя вход пользователя в систему ВК, Более детально : <source lang="php"> curl_setopt($ch,CURLOPT_REFERER,'http://m.vk.com/login?fast=1&hash=&s=0&to='); // от куда отправляться данные curl_setopt($ch, CURLOPT_COOKIEFILE,'cookie.txt'); // куда упадут кукисы (не забудьте создать этот файл на сервере и назначить ему права 777 , - 'cookie.txt' ) curl_setopt($ch, CURLOPT_URL, 'https://login.vk.com/?act=login&from_host=m.vk.com&from_protocol=http&ip_h=&pda=1'); // куда отправить данные curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($post)); //Данные для пост запроса (в нашем случае – это ваши пароль и логин)
function curl_gets_exec – это функция для более удобной работы с CURL, обработки редиректов и тп.
Остальные параметры можно найти — php.net/manual/ru/book.curl.php
Парсиг Видео
Теперь оставалось найти видео и распарсить его.
Как известно видеофайлы ВК имеют вид — vk.com/video2409212_161721801
Несложно догадаться что он состоит из 2 кусочков «2409212» и «161721801».
Поэтому я использовал 2 переменных $vid и $oid, которые начал принимать GET запросам
$vid=$_GET['vid']; $oid=$_GET['oid'];
И сформировал такую ссылку
$link="http://m.vk.com/video{$vid}_{$oid}";
Дальше мы отправлем данные ВК и получаем HTML текс с страницы видео, весь HTML ложиться в переменную $answer
curl_setopt($ch, CURLOPT_URL, $link); $answer = curl_gets_exec($ch);
Чтобы много не замариваться, я использовал для парсинга библиотеку simple_html_dom, её можно скачать в интернете или я выложил её здесь – v.plirex.com/simplehtmldom.rar
Создаем обек Simple
include "simplehtmldom/simple_html_dom.php"; $html = new simple_html_dom();
Загружаем в ней HTML текст
$html->load($answer);
Находим первый элемент DOM системы «video», если просмотреть страницу vk.com/video2409212_161721801 в HTML коде то мы видим что ссылочки на видео, хранятся именно в этом элементе
$div_video=$html->find('video',0);
Проверяем есть ли там нужное нам видео
if($div_video->outertext=="")die(“Video not found”);
внутри video примерно такой HTML код
<video preload="none" controls="controls" poster="http://cs527213.userapi.com/u11174769/video/l_18a03288.jpg"> <source src="http://cs527213.userapi.com/u11174769/videos/dc3277461b.720.mp4" type="video/mp4"></source> <source src="http://cs527213.userapi.com/u11174769/videos/dc3277461b.480.mp4" type="video/mp4"></source> <source src="http://cs527213.userapi.com/u11174769/videos/dc3277461b.360.mp4" type="video/mp4"></source> <source src="http://cs527213.userapi.com/u11174769/videos/dc3277461b.240.mp4" type="video/mp4"></source> <div class="img"><img src="http://cs527213.userapi.com/u11174769/video/l_18a03288.jpg" alt=""></div> <div class="no_pl"> Название </div> </video>
Как видно есть элементы ‘source’ в которых содержаться ссылочки на видео.
Хочу заметить что эти ссылочки активны только для этого пользователя, и только после просмотра основного документа видео, те ссылки vk.com/video2409212_161721801.
Ссылки на видео имеют вид — cs527213.userapi.com/u11174769/videos/dc3277461b.240.mp4
Где u11174769 – уникальный кеш, который каждый раз новый.
$sVideo=$div_video->find('source'); //Преобразуем полученные данные в массив ссылок на видео $aBuf=""; $j=0; foreach($sVideo as $post) { /*$aBuf[$j]=$post->outertext; $aBuf[$j]=substr($aBuf[$j],stripos($aBuf[$j],'src="')+5,strlen($aBuf[$j])); $aBuf[$j]=substr($aBuf[$j],0,stripos($aBuf[$j],'" type')); */ $aBuf[$j]=$post->src; $j++; //echo "{$aBuf[$j]} \n |"; }
Сохранение
Берем первую попавшуюся ссылку и скачиваем её
$link= $aBuf[0]; header('Content-type: content=video/mp4'); header("Content-Disposition: attachment; filename=vPlirex.mpg"); header("Pragma: no-cache"); header("Expires: 0"); $tFile = fopen($link,'r'); while (!feof($tFile)) { echo( fgets($tFile)); } fclose($tFile);
Вывод
Я описал краткое руководство для скачивание видео с ВК. Данный код не является идеальным и требует много доработок. 1-м делом избавиться от хранения кукисов в ФАЙЛЕ, а в дальнейшем сделать возможность выбирать какого качества скачивать видео.
Но подобного примера в интернете я не нашел. Так что дерзайте.
Вот ссылка на полный исходник с библиотекой v.plirex.com/v.plirex.com.rar
Также я сделал демку на домене v.plirex.com
ссылка на оригинал статьи http://habrahabr.ru/post/168343/
Добавить комментарий