АРХІТЕКТУРА AI-ПОШУКУ: ЩО НАСПРАВДІ ВІДБУВАЄТЬСЯ ПІД КАПОТОМ GOOGLE, BING, PERPLEXITY Й CHATGPT

Вступ: генеративний пошук — це не один «чарівний» двигун

Генеративні пошукові системи зовні виглядають схожими: ви ставите запитання — отримуєте відповідь у вигляді розумного абзацу з посиланнями. Але всередині це дуже різні машини з різною логікою пріоритизації, прозорості та швидкодії.

Для GEO (Generative Engine Optimization) це критично:
те, що працює в Google AI Mode, може бути майже байдуже Perplexity, а те, що дає вам цитати в Perplexity, взагалі не «зайде» Bing Copilot.

Далі — розбір архітектурних патернів і того, як саме вони впливають на шанс вашого контенту потрапити в відповідь ШІ.

1. RAG: як влаштоване «серце» сучасного AI-пошуку

Більшість генеративних пошукових систем будуються навколо RAG (Retrieval-Augmented Generation) — схеми «знайди → підстав → згенеруй».

Спрощений конвеєр виглядає так:

Кодування запиту
Запит перетворюється на ембеддінг (часто — на кілька, якщо модель мультівекторна).
Пошук по векторному індексу
Система шукає найближчі векторні представлення документів: текстів, відео, зображень, таблиць.
Реранкінг крос-енкодером
Дорожча модель спільно «читає» запит і фрагмент, дає точнішу оцінку релевантності.
Генерація відповіді
Топ-пасажі подаються в LLM як контекст, а модель уже складає людською мовою відповідь із цитатами.

Ключова фішка RAG: модель працює не лише на тому, чому її навчили рік тому, а на тому, що щойно витягнули з індексу.

Для GEO це означає дві вимоги до контенту:

він має бути знаходжуваним (ембеддінги, ключові слова, метадані);
він має бути легко «їстівним» для LLM (чіткі абзаци, факти, списки, визначення).

Якщо ви провалюєтесь на будь-якому з цих етапів — вас просто не буде в синтезі.

2. Векторні індекси: коли кожен фрагмент — точка у просторі

Класичний інвертований індекс поступово доповнюється або замінюється векторною базою.

Кожен документ, абзац, кадр відео, картинка можуть мати свій ембеддінг.
Пошук відбувається не за буквами, а за близькістю у векторному просторі.

Часто це ще й мультимодальний індекс:

текст — окремий набір ембеддінгів;
зображення — свої;
аудіо / відео — через транскрипти й відповідні вектори.

Для GEO:

описуйте те, про що ви хочете ранжуватися, прямою, нормальною мовою, а не SEO-жаргоном;
додавайте смислові alt-тексти й підписи до зображень;
забезпечуйте повні транскрипти для відео й аудіо, а не декоративні «summary в два рядки».

3. Гібридні конвеєри: чому старий добрий SEO ще не помер

Незважаючи на всю красу ембеддінгів, більшість платформ працюють у гібридному режимі:

лексичний пошук (BM25 тощо) — точний по рідкісних словах, артикулів, брендах;
семантичний пошук — добирає «сусідів за змістом»;
реранкер зверху все це переглядає й упорядковує.

Наслідок для GEO очевидний:

ключові слова й надалі потрібні — щоб пройти лексичний фільтр;
семантична повнота й нормальна мова — щоб потрапити у векторний шар;
структура й якість фрагментів — щоб реранкер поклав вас до фінального набору.

Якщо ви повністю відмовитесь від класичного SEO — просто зайдете в AI-епоху з пов’язаними руками.

4. Google AI Overviews / AI Mode: фан-аут, мультиджерела і суворий відбір

Google будує свої AI-поверхні як щільно інтегрований шар поверх пошукової інфраструктури. Це не «прикрутка» до SERP, а частина тієї ж машини.

Архітектурно процес можна умовно розбити на 5 етапів.

4.1. Розуміння запиту

Google паралельно будує для запиту кілька представлень:

лексичне — для класичного індексу;
векторне — для семантичного пошуку;
сутнісне — прив’язка до вузлів Knowledge Graph;
завдання — чи це порівняння, інструкція, факт, маршрут тощо.

Плюс — детекція мови, виправлення помилок, визначення, чи взагалі показувати AI Overview (для чутливих YMYL-тем система поводиться обережніше).

4.2. Query fan-out: один запит → десятки підзапитів

Якщо запит проходить поріг, Google створює пучок підзапитів, що розкривають різні латентні наміри.

Приклад: «best half marathon training plan» може розкластися на:

«12 week half marathon plan»
«beginner half marathon tips»
«half marathon nutrition plan»
«half marathon taper strategy»

Ці підзапити летять у:

веб-індекс (лексика + вектори);
Knowledge Graph;
YouTube-транскрипти;
Shopping / Flights / Maps тощо.

4.3. Мультиджерельний пошук

Кожен підзапит обробляє свій стек.

У вебі: BM25 + ANN-пошук по ембеддінгах, часто з мультівекторним представленням документів.
У KG: обхід графа сутностей.
У YouTube / зображеннях: мультимодальні ембеддінги, пов’язані з сутностями.

4.4. Агрегація, фільтрація, вибір фрагментів

На цьому етапі:

об’єднуються й дедуплюються результати;
відсіюються слабкі або сумнівні джерела (E-E-A-T, безпека, свіжість);
віддається пріоритет фрагментам, які можна відразу підняти в відповідь:
короткі, самодостатні абзаци, чіткі визначення, структуровані списки.

Якщо з вашого тексту важко «вирізати» акуратний шматок — шанс бути процитованим різко падає.

4.5. Синтез Gemini

Відібрані пасажі подаються в модель Gemini, яка:

«склеює» відповідь;
вирішує, де вставити цитати й які саме;
обмежується жорстким бюджетом токенів для AI Overviews (коротка відповідь),
або працює в розмовному режимі AI Mode з додатковими догрузками доказів.

GEO-висновки для Google:

покривайте кілька граней наміру в межах одного матеріалу;
пишіть пасажами, які можна копіпастнути як визначення;
будуйте сильні сигнали авторитетності (E-E-A-T, сутності, топічні кластери), щоб не «відвалитися» на фільтрації.

5. ChatGPT з браузингом: модель без власного індексу

ChatGPT із доступом до мережі — це не пошуковик у класичному сенсі.

Архітектура виглядає так:

Модель формує пошукові запити на базі вашого питання.
Надсилає їх у сторонній індекс (Bing, частково Google).
Отримує список URL.
У реальному часі тягне вміст окремих сторінок.
Читає текст і синтезує відповідь.

Наслідок:

немає довготривалого індекса — є онлайн-витяг;
якщо сайт повільний, заблокований robots.txt, схований за важким JS — він фактично «невидимий»;
класична технічна SEO-гігієна (кроулабельність, швидкість, чистий HTML) тут вирішальна.

Щоб потрапити в відповідь ChatGPT, потрібно:

«виграти» в пошуку Bing/Google на кроці генерації URL;
при завантаженні сторінки віддати зрозумілий, структурований, мінімально зашумлений текст;
чітко вербалізувати те, про що вас можуть запитати.

6. Bing Copilot: класичний Bing у костюмі генеративного асистента

Bing Copilot найближчий до моделі «класичний пошук + генеративний шар».

Спрощений конвеєр:

Розуміння запиту
Створюється лексична форма, ембеддінг, сутнісні прив’язки + тип завдання (факт, інструкція, рекомендація, порівняння).
Гібридний пошук
- BM25 дає точні збіги (імена, артикул, SKU);
- векторний пошук добирає семантичних кандидатів.
Реранкінг пасажів
Крос-енкодер оцінює вже фрагменти, а не цілі сторінки. Паралельно:
- відсіюються дублікати;
- контролюється різноманіття джерел;
- сильно зростає роль витяжних пасажів — списків, таблиць, визначень.
LLM-синтез на основі джерел
GPT-клас модель збирає відповідь, жорстко прив’язуючись до відібраних фрагментів. Мета — скласти, а не вигадати.
Презентація + дії в Microsoft 365
Відповідь супроводжується цитатами, які легко перенести в Word, Excel, Teams зі збереженням посилань.

GEO-висновки для Bing Copilot:

виграти хоча б один із двох коридорів: лексичний (ключі, назви) або семантичний (зміст, контекстні формулювання);
писати так, щоб ключова думка існувала як короткий, чіткий, liftable пасаж;
активно використовувати schema-розмітку сутностей, авторів і брендів;
додавати структури, які зручно переносити в документи (таблиці, чеклісти, списки).

7. Perplexity: прозорий «answer engine» і жива лабораторія GEO

Perplexity відрізняється однією дуже важливою рисою: радикальною прозорістю.

Джерела показуються явно, часто ще до відповіді.
Легко побачити, з яких сторінок зібрано синтез.
Запит завжди супроводжується набором зрозумілих цитат.

Архітектурно:

Perplexity робить запити до Google / Bing;
обирає список URL;
тягне їх у реальному часі;
оцінює релевантність, структурну ясність, екстрактність;
синтезує відповідь із багатьох джерел, чесно показуючи їх.

Що він явно любить:

заголовок або підзаголовок, який майже повторює запит;
відразу під ним — короткий абзац-відповідь без води;
далі — розгортання з деталями, прикладами, діаграмами, кейсами;
багаті на сутності тексти: люди, бренди, продукти, технології чітко позначені й пояснені;
авторитетні контексти — біо авторів, розділи «про нас», прозорий опис джерел.

Perplexity — це ідеальний майданчик, щоб перевіряти гіпотези GEO:

не цитують вас → дивитесь, кого цитують, і чим вони кращі структурно;
цитують → аналізуєте, які патерни ви виконали, й переносите їх на інші сторінки.

8. Спільна мова всіх платформ: від «знайшли» до «процитували»

Незважаючи на різницю в архітектурах, у всіх систем є спільний ланцюжок:

Retrievability (знаходжуваність)
Ви взагалі потрапили в пул кандидатів? Тут працюють технічний SEO, ключові слова, ембеддінги, robots.txt, швидкість.
Extractability (витяжність)
Чи є у вас фрагменти, які можна вирізати й вставити в відповідь без фантомного болю? Це про структуру, ясність, списки, визначення.
Trust (довіра)
Чи гідні ви того, щоб вас процитували замість конкурента з таким самим змістом? Тут у гру входять Е-E-A-T, автори, бренди, лінки, біо, прозорі джерела.
Citation (публічна присутність)
Фінальний шар інтерфейсу: де й як показують посилання, як легко користувачу перейти до вас.

Різні платформи по-різному зважують ці фактори, але послідовність однакова.

9. GEO як архітектурне мислення: не про «ключі», а про «простір намірів»

Головний зсув полягає в тому, що ви більше не граєте в:

«Чи зможу я ранжуватися за цим ключовим словом?»

Питання тепер звучить так:

«Чи займає мій контент правильні позиції в просторі намірів, у якому працюють RAG-системи й векторні індекси?»

Практично це означає:

проектувати сторінки як модулі відповідей, а не як «полотно тексту»;
думати не про один запит, а про пучок латентних запитів і підзапитів, з яких починається fan-out;
тестувати стратегії спочатку в прозорих рушіях (Perplexity), а потім переносити навчений підхід у більш закриті (Google, Bing, ChatGPT).

Висновок: архітектура важить не менше за контент

Якщо дивитися на AI-пошук із GEO-оптикою, стає очевидно:

контент без архітектурного розуміння платформи — це стрілянина навмання;
одна й та сама сторінка може бути зіркою в Perplexity, «примарою» в Bing Copilot і абсолютно невидимою в Google AI Overviews;
найбільша помилка — оптимізуватися «під генеративний пошук узагалі», а не під конкретні конвеєри.

Генеративні системи вже не показують нам «10 синіх лінків». Вони поводяться як редактори: переглядають десятки джерел, вирізають по рядку й збирають власну історію.

Питання, яке варто ставити собі щоразу:

«Чи написана моя сторінка так, щоб її було легко знайти, вирізати і процитувати в цій історії?»

Якщо відповідь «так» хоча б для кількох провідних платформ — ви вже граєте в правильну гру.