Говоря о сборе семантического ядра для сайта, мы используем термины «парсинг», «парсить». Что это значит? Попробую объяснить простыми словами, что это такое.
Парсинг – это один из способов автоматического сбора и обработки информации из Всемирной сети.
При парсинге проводится лексический анализ собранной информации путем сравнения найденных текстов с определенными образцами, то есть по некоторому шаблону или, как еще говорят, по маске.
Обработанная таким образом информация структурируется по заданным правилам. Аналогией парсинга можно считать работу со словарем. Мы парсим словарь, сравнивая его текст с нужным нам словом, а найдя его, узнаем перевод.
Активнее всего «парсят» всемирную паутину поисковые сервис ы. Их программы парсеры, которые называют поисковыми роботами или пауками, непрерывно просматривают и анализируют сайты, пополняя и обновляя свои базы данных.
Парсинг используется для наполнения сайтов контентом. Активно парсингом занимаются владельцы интернет-магазинов для заполнения описаний товаров, их характеристик, цен. Парсинг необходим для быстрого обновления новостных сайтов и других сайтов, содержащих информацию, которая быстро и постоянно изменяется.
Подробнее о парсинге в статье на блоге >>>
Это интересно
0
|
|||
Последние откомментированные темы:
samsonych***@l*****.ru , 04.05.2016
samsonych***@l*****.ru , 25.12.2015