Php парсер с гугл плей маркет. Парсим версию, и другие данные.

Как спарсить play market на php

Выложу простой код, который на примере «Текущей версии» парсит страницу приложения в play market.

Все работает с использованием file_get_contents. Для одного сайта делал парсер, и если текущая версия отличалась от той, что в маркете — записывалось в текстовый файл. Кроме того, пользователи могли нажать кнопку «Сверить версии«, и дополнительно уведомить админа об обновлениях (если они есть).

Потом админ обновлял приложения у себя на сайте.

Я выложу полный код с комментариями:

Описал в комментариях. Еще у нас были привязаны уведомления в телеграмм. Основное оставил. По сути, все сокращается до

И правильно распарсить строку с версией.

Поменялся html-код страницы play.google.com, что делать

За последние пару месяцев код не менялся, но не исключено. Зайдите в исходный код, посмотрите актуальные классы.

Защита от запросов

Есть ли капча? Не знаю, у нас не было никаких проблем. Возможно, при большом количестве запросов с одного айпи может быть рекапча или еще что-то. Пользуемся в таком случае прокси.

Английская или русская версия

Все зависит откуда парсите, месторасположение сервера (прокси). У нас страница по умолчанию была на английском, поэтому и «Current Version, Varies with device». Можно добавить в адрес url язык, но нам это не нужно было.

Если нужно спарсить другие данные (дата публикации, информация о разработчике, эмейл разработчика), заново вызывать file_get_contents не нужно, страница уже в переменной $html.

Помощь с парсером

Нужна помощь — без проблем. Пишите. Но только если Вы делаете и Вам нужен совет.

Если вы хотите чтобы я сделал парсер, написал код — делаю за деньги, цена от 5000 рублей.

  • Гугл плей сменил дизайн и теперь версия есть только во всплывающем окне, которого по умолчанию в коде нет(( Можно что-то с этим сделать?

    • Уже знаю, переписывать код. По поводу всплывающего — нужно смотреть как сделано, возможно простой аякс-запрос.

    • Версию лучше тащить доп запросом, на некоторых страницах она есть в коде.

  • Можно еще простой пример как передать эти все параметры со страницы? Очень сильно выручите! Спасибо!

    • эм, куда передать? :-)
      мы их парсим — это и есть «передача».

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *