0
120
2019-01-22

Настройка Windows для парсинга при помощи simple_html_dom.php и работы с PHP из консоли

Подготавливаем Windows 10 к парсингу при помощи simple_html_dom.php. Я рассмотрю основные этапы приготовления системы. Добавление в окружение Windows php, консоль, настройка php для работы из консоли.
Понравилась страница? Поставь свою оценку!
PLUGIN_STAR_RATINGS.SCORE_TEXTPLUGIN_STAR_RATINGS.VOTES_TEXT

Добавляем php в окружение Windows 10

Что бы у нас была возможность тестировать скрипт нам необходимо что бы консоль разработчика могла взаимодействовать с php. Ниже инструкция по добавлению php 7.2.3 в переменную среды Windows 10.

Вначале загружаем сам php, для этого нам лучше всего подойдет самая при самая оригинальная сборка от разработчиков php. Для загрузки перейдите по ссылке:

https://windows.php.net/download#php-7.3

И загрузите архив php в соответствии битности процессора вашей Windows:

Загрузка php 7.3

Далее распакуйте его на диск “C”. В итоге мы получим данную папку:

php 7 установка в windows

Перейдите в нее, и убедитесь что файл php.exe (ну и все содержимое архива тоже) находится именно в корне данной папки:

Путь к php в windows 10 для добавления в окружение системы

Теперь, когда убедились копируем путь:

C:\php-7.3.1-nts-Win32-VC15-x64

И переходим к добавлению php в “Переменные среды пользователя” в Windows.

Добавление php в “Переменные среды пользователя” в Windows

Для добавления нажмите сочетание клавиш “Win+Pause”, в открывшемся окне нажмите дополнительные параметры системы:

Дополнительные параметры системы Wondows

Далее добавьте путь как это указано на скрине ниже:

Добавляем php в окружение Windows

Все, на данном этапе php должен работать из консоли.

Настраиваем php для работы с simple_html_dom.php

Во время тестирования скрипта для парсинга вываливается ошибка:

PHP Notice: Trying to get property 'innertext' of non-object…

или

Unable to find the wrapper “https” with file_get_contents

Для того что бы побороть данную проблему Вам необходимо сделать следующее:

  1. Скопируйте php.ini-development в php.ini (или просто удалите -development из имени файла).
  2. Раскомментируйте extension=php_openssl.dll строку (удалите “;” перед extension_dir = "ext")
  3. Раскомментируйте эту строку: extension_dir = "ext"
  4. Проверьте есть ли файл php_openssl.dll в каталоге расширений “ext”.

Или загрузите архив SDStudio_php-7.3.1-nts-Win32-VC15-x64.rar в данном архиве я ужи применил все необходимые правки для того что бы php работал оптимально по максимуму.

Используем консоль от Git’a

Я не фанат консоли от Windows, мне больше по душе линуксовая консоль, по этому я буду рекомендовать установить Git который вместе с собой на борту имеет сразу и консоль.

Загрузить Git для Windows

https://git-scm.com/download/win

Как установить правильно, человек в данном видео очень подробно описал:

Полезные ссылки:

Загружаем последнюю версию SimpleHtmlDom

https://sourceforge.net/projects/simplehtmldom/files/simplehtmldom/

Онлайн документация simplehtmldom:

http://simplehtmldom.sourceforge.net/manual.htm

Отличный пост:

https://xdan.ru/uchimsya-parsit-saity-s-bibliotekoi-php-simple-html-dom-parser.html