Як зробити парсер
Відео: Парсинг сайтів на PHP - простий парсер
Парсинг є одним із широко використовуваних прийомів при програмуванні веб сторінок. Він легко і просто дозволяє отримати необхідний сервіс на сайт за допомогою невеликої кількості команд, коли немає можливості самостійно написати необхідний скрипт.
1
Найпростіше здійснити парсинг за допомогою PHP функції file_get_contents (). Вона дозволяє отримати вміст файлу у вигляді текстового рядка. Функція використовує алгоритм «memory mapping», що покращує її продуктивність.
2
Наприклад, щоб написати скрипт, який парсит дані з сайту ЦБ РФ, необхідно отримати за допомогою відповідної функції вміст XML-сторінки, попередньо визначивши дату у відповідному для сайту форматі, після чого за допомогою регулярних виразів розбити її. Для відображення обраної валюти використовується код, отриманий з сайту Банку: $ data = date (ldquo-d / m / Yrdquo -) - $ get = file_get_contents (https://cbr.ru/scripts/XML_daily.asp?date_req=$data ) -preg_match (ldquo - / (. *?) / isrdquo-, $ get, $ string) -preg_match (ldquo - / (. *?) / isrdquo-, $ string [1], $ str) -
3
Якщо потрібно парсити безпосередньо сам файл XML, то для цього існують також відповідні функції. Для початку парсеру необхідно його форматувати за допомогою xml_parser_create: $ parser = xml_parser_create () -
4
Потім вказується перелік функцій, які будуть обробляти відповідні теги і текстову інформацію. Встановлюються відповідні обробники початку і кінця елемента XML: xml_set_element_handler ($ parser, ldquo-startElementrdquo-, ldquo-endElementrdquo -) -
5
Зчитувати дані можна за допомогою стандартної функції fopen () і fgets () в рамках відповідного циклу. Вміст файлів віддається через підрядник в xml_parse (). В останньому параметрі передається прапор зчитування останнього рядка: while ($ content = fgets ($ fparse)) {
if (! xml_parse ($ parser, $ content, feof ($ fparse))) {
echo ldquo-Errorrdquo--
break-}}
if (! xml_parse ($ parser, $ content, feof ($ fparse))) {
echo ldquo-Errorrdquo--
break-}}
6
Для звільнення займаних системою ресурсів використовується функція xml_parser_free (). Ці функції є найбільш дієвими при обробці XML файлів.
Поділися в соціальних мережах:
Схожі
- Як додавати в меню сайту
- Як створити на своєму сайті модуль
- Як встановити скрипт vkontakte optimizer для opera
- Як використовувати flash-відео і flash-aудіо на сайті
- Як вставити скрипт в html
- Як додати стрічку новин на свій сайт
- Як дізнатися завантаженість сайту
- Як вставити час на сайт
- Як запустити скрипт
- Як порахувати кількість сторінок на сайті
- Як безкоштовно створити власний сайт
- Як вибрати безкоштовну програму для створення сайту
- Як переадресувати з сайту на сайт
- Як виконати скрипт
- Як видалити сайт з wordpress
- Як поміняти іконку сайту
- Як розмістити скрипт
- Як зареєструвати сайт в гуглі
- Як писати смс з телефону безкоштовно
- Як очистити кеш сайту
- Як вставити код лічильника