Сбор данных для приложений Android с использованием google-play-scraper в Node.js
Наиболее распространенный метод очистки Интернета - это метод, в котором мы используем selenium & beautifulsoup в Python. Несмотря на то, что это помогает нам в различных задачах, если мы специально хотим извлечь информацию об уже существующем приложении для Android в магазине Google Play для исследовательских целей или даже для самостоятельного использования, есть другой способ сделать что-то.
Google-play-scraper - это модуль Node.js, который помогает извлекать данные приложений из магазина Google Play, предоставляя методы, упрощающие нашу работу.
Монтаж:
npm установить google-play-scraper
Важные методы:
1. приложение: возвращает все данные, связанные с этим приложением.
Параметры:
- appId: идентификатор, связанный с приложением в Google Play. Его можно увидеть в «? Id =» URL-адреса.
- lang: необязательный параметр. Для английского языка по умолчанию установлено значение «en». Если мы хотим, чтобы данные приложения были получены на другом языке. Мы можем предоставить этому параметру двухбуквенный код этого языка.
- страна: это также необязательный параметр. По умолчанию для Соединенных Штатов Америки он имеет значение «нас». Этот параметр полезен, когда рассматриваемое приложение доступно только в определенных странах.
Пример:
var gPlayScraper = require( 'google-play-scraper' ); gPlayScraper.app({appId: 'free.programming.programming' }) .then(console.log, console.log); |
Выход:
[{title: 'Изучение DS и алгоритмов, подготовка к собеседованию по программированию', описание: «GeeksforGeeks - универсальный пункт назначения для программистов. В приложении есть 20000+ вопросов по программированию, 40, 000 + .... ', descriptionHTML: 'GeeksforGeeks - универсальный пункт назначения для программистов .....', резюме: 'Изучите алгоритмы структур данных, программирование на C, C ++, Java, Python, JS, Aptitude ', установил: '500, 000+', minУстановок: 500000, оценка: 4.6594124, ... разработчик: 'GeeksforGeeks', developerId: 'GeeksforGeeks', developerEmail: 'support@geeksforgeeks.org', сайт разработчика: 'https://www.geeksforgeeks.org/', developerAddress: 'Noida, UP, India', privacyPolicy: 'https://www.geeksforgeeks.org/privacy-policy/', developerInternalID: '5323597028845965498', жанр: 'Образование', genreId: 'ОБРАЗОВАНИЕ', ..... '], ..... URL: 'https://play.google.com/store/apps/details?id=free.programming.programming&hl=en&gl=us'}]
2. поиск: извлекает список приложений, в которых выполняется поиск по заданному термину.
Параметры:
- термин: он содержит поисковый запрос.
- num: количество приложений, которые мы хотим получить. Это необязательный параметр со значением по умолчанию 20. Обратите внимание, что максимальное значение этого параметра может быть 250.
- lang: необязательный параметр. Для английского языка по умолчанию установлено значение «en». Если мы хотим, чтобы данные приложения были получены на другом языке, мы можем предоставить этому параметру двухбуквенный код этого языка.
- страна: это также необязательный параметр. По умолчанию для Соединенных Штатов Америки он имеет значение «нас». Этот параметр полезен, когда рассматриваемое приложение доступно только в определенных странах.
- цена: мы можем передать «все», чтобы вернуть как бесплатные, так и платные приложения, «бесплатно» для бесплатных приложений и «платные» для платных приложений.
Пример:
var gPlayScraper = require( 'google-play-scraper' ); gPlayScraper.search({ term: "tech" , num: 2 }).then(console.log, console.log); |
Выход:
[{title: 'CNET: Лучшие технические новости, обзоры, видео и предложения', appId: 'com.cbsinteractive.cnet', URL: 'https://play.google.com/store/apps/details?id=com.cbsinteractive.cnet', икона: 'https://lh3.googleusercontent.com/DeIoPrQ4jp2STHmWzbWI8Ss8JRnPgFrmDoOLje2PXcpA7CQN8hFxOvxXCSOOEGLUUQ', разработчик: "CBS Interactive, Inc.", developerId: "CBS + Interactive, + Inc.", priceText: 'БЕСПЛАТНО', валюта: undefined, цена: 0, бесплатно: правда, резюме: 'Последние технологические новости и практические советы по продуктам, сравнения, советы и подсказки », ScoreText: '4.0', оценка: 4}, {title: "Технический тренер", appId: 'com.asurion.solutohome.verizon', .. оценка: 4.4551244}]
3. Предложить: принимает строковый ввод и возвращает список, содержащий пять предложений для выполнения нашего поискового запроса.
Параметры:
- термин: термин, по которому мы хотим получить предложения.
- lang: необязательный параметр. Для английского языка по умолчанию установлено значение «en». Если мы хотим, чтобы данные приложения были получены на другом языке, мы можем предоставить этому параметру двухбуквенный код этого языка.
- страна: это также необязательный параметр. По умолчанию для Соединенных Штатов Америки он имеет значение «нас». Этот параметр полезен, когда рассматриваемое приложение доступно только в определенных странах.
Пример:
var gPlayScraper = require( 'google-play-scraper' ); gPlayScraper.suggest({term: 'algorithms' }).then(console.log); |
Выход:
['алгоритмы', 'алгоритмы жизни', 'алгоритмы и структуры данных', 'алгоритмы объяснены и анимированы', «алгоритмы кубика рубика»]
4. разрешения: возвращает список разрешений, к которым у приложения есть доступ.
Параметры:
- appId: идентификатор, связанный с приложением в Google Play. Его можно увидеть в «? Id =» URL-адреса.
- lang: необязательный параметр. Для английского языка по умолчанию установлено значение «en». Если мы хотим, чтобы данные приложения были получены на другом языке, мы можем предоставить этому параметру двухбуквенный код этого языка.
Пример:
var gPlayScraper = require( 'google-play-scraper' ); // Let's analyse the permissions requested by SHAREit gPlayScraper.permissions({appId: 'com.lenovo.anyshare.gps'}). .then(console.log, console.log); |
Выход:
[{разрешение: 'снимать фото и видео', тип: 'Камера'}, { разрешение: "добавить или изменить события календаря и отправить электронное письмо по адресу гости без ведома хозяев », type: 'Calendar'}, {разрешение: 'запись звука', тип: 'микрофон'}, {разрешение: 'читать конфиденциальные данные журнала', type: 'История устройства и приложений'}, {разрешение: 'получение запущенных приложений', type: 'История устройства и приложений'}, .... {разрешение: 'отправлять липкую рассылку', тип: 'Другое'}, {разрешение: 'развернуть / свернуть строку состояния', тип: 'Другое'}, {разрешение: 'контролировать вибрацию', тип: 'Другое'}]
Другие методы, на которые вы можете взглянуть, это:
- list: возвращает список приложений из одной из коллекций в Google Play.
- разработчик: возвращает список приложений с указанным именем разработчика.
- reviews: возвращает страницу, полную обзоров указанного в данный момент приложения.
- аналогично: он возвращает список приложений, которые похожи на указанные приложения.
- категории: возвращает список категорий, доступных в магазине Google Play.