Технології для пошуку

Для отримання списку сайтів потрібно ввести пошуковий запит, що складається зі слів. Слово як окрема лексична одиниця і є основою для формування видачі.

Завдання пошукового робота обійти якомога більше сторінок в інтернеті і запам`ятати їх зміст, розбиваючи весь текст на слова, щоб створити прив`язку сторінки до певної тематики. Потім враховується, чи зустрічаються все слова з запиту в тексті сторінки і скільки разів їх можна знайти. На основі цих даних і формується видача. Це загальний принцип роботи пошукових систем актуальний і для 2000 років, і для нашого часу.

Що впливає на результати пошуку



Але все ж чинників для формування списку сайтів набагато більше. Сьогодні вважається, що на порядок сайтів в загальному списку впливає не тільки текст, а й те, як інші відвідувачі вели себе на ньому, тобто час, який вони провели, на яких місцях сайтах зупинилися і т.д.

Свій вплив чинять і посилання, поставлені на сторінки з інших джерел, кількість корисної інформації, вік сайту, частота оновлення.

Звичайно, все принципи роботи невідомі, щоб не було штучного маніпулювання списками сайтів. Це і дозволяє людям отримувати потрібну інформацію, уникаючи спаму і небажаних сторінок з вірусами.

Пошуковик сьогодні неймовірно складна система, з великою командою розробників для кожного сервісу. Адже, наприклад, на Яндексі можна дивитися і відео, і шукати картинки, і читати новини. Всі ці сервіси працюють за своїми принципами, також як і пошук по ним.

У кожній пошуковій системі є відділи аналітики, завдання яких з`ясувати чи все влаштовує користувачів. Роботи над удосконаленням алгоритмів ведуться щодня. Для підтримки роботи таких систем потрібні тисячі серверів, розташованих по всьому світу, для забезпечення стабільно високої швидкості доступу до ресурсів.