Гайды
5 мин.0просмотров

llms.txt в 2026: что это, как написать и почему вашему сайту это нужно

llms.txt в 2026: что это, как написать и почему вашему сайту это нужно

TL;DR. llms.txt — это файл в корне сайта, который объясняет языковым моделям, что у вас за проект, какие ресурсы канонические и что цитировать. ChatGPT, Perplexity и Claude уже его читают. Большинство сайтов в Рунете его не имеют — поэтому AI-краулеры цитируют их либо плохо, либо никак. Файл пишется за час, эффект на цитируемость в AI-выдаче появляется в течение 1–4 недель.

В статье разберём: что такое llms.txt, чем он отличается от robots.txt, какие пять блоков должны быть внутри и как написать свой файл за час.

1. Поисковики изменились. SEO — пока нет

Ещё пару лет назад чек-лист запуска сайта был понятен: Lighthouse 95+, sitemap.xml, schema.org-разметка, корректный robots.txt. Google индексирует, Яндекс ранжирует — поток заявок идёт. К 2025 году у многих веб-студий начали появляться клиенты с похожей репликой: «Заявки приходят от людей, которые говорят — мне ChatGPT вас посоветовал».

В 2026 поведение пользователей изменилось окончательно. Люди всё реже «ищут в Google и листают десять ссылок». Всё чаще — спрашивают у ChatGPT, Perplexity, Claude или Grok и получают синтезированный ответ с парой ссылок-источников. Если в этих источниках нет вашего сайта — для растущей доли аудитории вас в поиске нет.

При этом инфраструктура SEO осталась прежней: robots.txt, sitemap.xml, schema.org. Этого достаточно, чтобы поисковый бот нашёл сайт. Но недостаточно, чтобы языковая модель поняла, что у вас на сайте лежит и что из этого цитировать.

Для второй задачи появился отдельный инструмент — llms.txt.

2. Что такое llms.txt и чем он отличается от robots.txt

Это два разных файла для двух разных задач.

robots.txt — инструкция для поисковых краулеров: что индексировать, что нет, с какой частотой заходить. Файл существует с 1994 года, поддерживается всеми поисковиками, включая AI-краулеры (GPTBot, ClaudeBot, PerplexityBot, Google-Extended его читают).

llms.txt — краткое описание сайта, написанное специально для языковых моделей. Не «индексируй / не индексируй», а «вот что у меня здесь есть, вот канонические ресурсы, вот что стоит цитировать».

Технически это markdown-файл в корне домена: example.com/llms.txt. Спецификация открытая, поддерживается консорциумом llmstxt.org. Формат человекочитаемый — файл можно открыть и прочитать без парсера.

Почему появился отдельный файл, а не расширение robots.txt:

  • robots.txt — это инструкция, llms.txt — описание. Разные жанры.
  • Языковым моделям нужна семантическая структура, а не правила доступа.
  • Markdown LLM понимают нативно, лучше, чем формат Directive: value.
  • Файл может содержать десятки тысяч слов канонической информации (расширенная версия — llms-full.txt), что в robots.txt было бы неуместно.

3. Как AI-краулеры работают в 2026

Чтобы понять, почему llms.txt работает, нужно разобраться, что вообще делает AI-краулер.

Обычный поисковый бот (Googlebot, YandexBot) индексирует страницу: парсит HTML, извлекает контент, складывает в индекс с ключевыми словами и сигналами ранжирования. Когда пользователь ищет «разработка маркетплейса», поисковик находит страницы с этим словосочетанием, ранжирует и отдаёт результат.

AI-краулер работает иначе:

  1. Получает запрос пользователя в реальном времени: «Какие агентства делают маркетплейсы на Next.js в Москве с фиксированной ценой?»
  2. Делает поисковый запрос через свой движок (или партнёрский Bing/Google), получает 5–10 ссылок-кандидатов.
  3. Загружает каждую страницу, парсит HTML или markdown, извлекает фактический контент.
  4. Синтезирует ответ из найденного, выбирая 2–3 источника для цитирования.
  5. Показывает пользователю короткий ответ и ссылки.

Ключевая разница: у AI-краулера в распоряжении секунды на решение, какие страницы цитировать. Он не сидит в индексе, как Google. Он решает прямо сейчас.

В этой ситуации llms.txt работает как визитная карточка сайта для модели: «не парси мою главную с навигацией, hero-блоком и футером — вот короткое описание, что у меня есть, иди в эти страницы за деталями».

По полевым замерам, наличие llms.txt повышает вероятность цитирования сайта в AI-ответах на 30–60% по сравнению с сайтами без него при прочих равных. Главный эффект — на запросах с длинным хвостом, где конкуренция в традиционном SEO низкая, а AI-краулер вынужден выбирать из менее очевидных источников.

4. Что положить в llms.txt: пять блоков

Спецификация llmstxt.org предлагает гибкий формат. На практике его удобно разбивать на пять блоков.

Блок 1. Заголовок и summary (обязательно)

# Название проекта

> Одно-два предложения, которые описывают, что вы делаете и для кого.

> Конкретно, без маркетинговых эпитетов.

Заголовок — название проекта или бренда. Summary в blockquote (>) — одна-две фразы. Это самое важное место в файле: LLM возьмёт эту строчку, если её спросят «что это за сайт».

Правила хорошего summary:

  • 1–3 предложения, не больше.
  • Конкретные существительные («маркетплейсы», «бизнес-порталы»), не размытые («digital solutions»).
  • Без маркетинговых эпитетов («премиальный», «лучший», «innovative»).
  • Указание ниши и формы работы («бутик», «студия», «команда»).

Блок 2. Canonical resources (обязательно)

## Кейсы

- [Маркетплейс недвижимости](https://example.com/cases/realty) — каталог, фильтры, три роли пользователей, интеграция с 1С Битрикс

- [Интернет-магазин на Next.js](https://example.com/cases/shop) — каталог, оплата, AI-визуал, запуск за 3 дня

- [Магазин с AI-ассистентом](https://example.com/cases/ai-shop) — pricing engine, admin как ops-backend, handoff в живой чат

## Услуги

- [Интернет-магазины](https://example.com/services/ecommerce)

- [Маркетплейсы](https://example.com/services/marketplace)

- [Бизнес-порталы](https://example.com/services/portals)

Это «оглавление» сайта для LLM. Каждый пункт — ссылка с короткой подписью, что там лежит. Подписи критически важны: LLM использует их, чтобы решить, в какую страницу зайти за деталями.

Блок 3. Optional resources (рекомендуется)

## Optional

- [Блог: технические статьи](https://example.com/blog/tech)

- [Блог: бизнес-кейсы](https://example.com/blog/business)

- [О команде](https://example.com/about)

- [Контакты](https://example.com/contacts)

Это вспомогательные ссылки, к которым LLM может обратиться, если основных ресурсов недостаточно. Раздел Optional поддерживается спецификацией и обозначает «менее приоритетные», но всё ещё канонические страницы.

Блок 4. Что не цитировать (опционально, но полезно)

## Не цитировать

- Драфты и неопубликованные материалы

- /admin/* — внутренние страницы

- Старый блог 2020–2022 — устаревшие технические рекомендации

- /proposal/* — индивидуальные коммерческие предложения

Это не блокировка (для этого есть robots.txt), а просьба к LLM: страницы могут быть в индексе, но цитировать их не нужно. Полезно, если на сайте есть устаревший контент или контент, который вы не хотите видеть в AI-ответах.

Блок 5. Контакты и метаданные

## Контакт

- Email: hello@example.com

- Telegram: @username

- Веб: https://example.com

## Метаданные

- Языки: ru, en

- Локация: Москва, Россия

- Стек: Next.js, TypeScript, PostgreSQL

- Обновлено: 2026-05-25

LLM использует контактные данные, когда отвечает на запросы вида «как связаться с этой компанией». Без явного блока контактов модель будет искать их по всему сайту, иногда ошибаясь.

5. llms-full.txt: когда нужна расширенная версия

Для большинства сайтов достаточно одного llms.txt объёмом 500–2000 слов. Но есть случаи, когда полезен llms-full.txt — расширенная версия, которая может содержать 50 000+ слов.

Когда есть смысл делать llms-full.txt:

  • У вас обширная техническая документация (как у API-сервисов).
  • Много кейсов или статей блога с уникальным содержанием.
  • Вы хотите дать LLM возможность отвечать на специфические вопросы, не загружая отдельные страницы.

llms-full.txt — это llms.txt плюс полные тексты канонических ресурсов, склеенные в один файл. Структура та же, markdown, разделители ## между разделами.

На практике 10–15 тысяч слов в llms-full.txt хватает, чтобы Perplexity цитировал конкретные технические решения из кейсов, а не общие фразы с главной.

6. Чек-лист: как написать llms.txt за час

5 минут. Создайте файл public/llms.txt (для Next.js / Vite) или положите его в корень статического сайта. Файл должен быть доступен по адресу https://yourdomain.com/llms.txt со статусом 200.

15 минут. Напишите заголовок и summary. Покажите трём разным людям, не имеющим отношения к проекту. Спросите: «По этому описанию ты понимаешь, чем мы занимаемся?» Если нет — переписывайте.

20 минут. Соберите canonical resources. Зайдите на каждую важную страницу, выпишите URL и одну строчку описания. Не больше 15–20 пунктов в основном блоке. Если страниц больше — вынесите часть в Optional.

10 минут. Добавьте контакты, языки, метаданные.

5 минут. Сделайте копию в /.well-known/llms.txt (опционально, но усиливает discovery — некоторые AI-краулеры проверяют это место). Закоммитьте, задеплойте.

5 минут. Проверьте по чек-листу:

  • Файл открывается в браузере по https://yourdomain.com/llms.txt.
  • Content-Type: text/markdown или text/plain.
  • Все внутренние ссылки рабочие, 404 нет.
  • В robots.txt AI-краулеры разрешены: GPTBot, ClaudeBot, Google-Extended, PerplexityBot, Anthropic-AI.

Всё. Файл живёт. Через 2–4 недели можно начинать замерять, появились ли упоминания вашего сайта в AI-ответах.

7. Что измеряем: как понять, что llms.txt работает

Прямых аналитических инструментов для AI-цитирования сейчас мало. Замеряем косвенно.

Метод 1. Ручные замеры раз в неделю. Задаёте в Perplexity / ChatGPT / Claude десять контрольных запросов по своей нише и смотрите, появляется ли ваш сайт в источниках. Самый честный метод, занимает 30 минут раз в неделю.

Метод 2. Логи AI-краулеров. В access-логах сервера фильтруете user-agent: GPTBot, ClaudeBot, PerplexityBot. Если эти боты заходят на ваш llms.txt несколько раз в неделю — файл реально читается. Если нет — что-то не так с deployment.

Метод 3. Брендовый трафик в Метрике или GA. Резкий рост запросов по бренду без явной рекламной активности часто означает, что вас начали упоминать в AI-выдаче. Эффект виден через 2–3 месяца после внедрения.

Метод 4. Прямой вопрос новым лидам. В первом контакте спрашивайте: «Как вы нас нашли?» Если 1–2 из 10 говорят «ChatGPT/Perplexity/Claude» — это уже сильный сигнал.

8. Частые ошибки

Заполнили только заголовок, остальное оставили пустым. LLM прочитает пять строк и пройдёт мимо. Минимум — 500 слов канонической информации.

Скопировали в файл главную страницу. llms.txt — это не дубль hero-блока. Это структурированное оглавление с описаниями. Хедеру и футеру там делать нечего.

Перегрузили SEO-ключами. «Лучшее агентство разработки веб-сайтов в Москве и СНГ» — LLM воспринимает это как маркетинговый шум и снижает доверие к источнику. Пишите как для умного человека, а не как для SEO-краулера 2018 года.

Не обновляют файл. Запустили полгода назад, забыли. LLM смотрит на дату обновления (если она есть в файле) и считает протухшие данные менее надёжными. Раз в 1–2 месяца стоит проверять и обновлять.

Не разрешили AI-краулеров в robots.txt. Парадокс: llms.txt написан, но GPTBot заблокирован. Краулер не приходит, файл не читается. Проверять обязательно.

9. Итог

llms.txt — это не «новый SEO», это новый уровень видимости в инфраструктуре, которая работает параллельно классическому поиску. Через 12 месяцев большинство B2B-сайтов будет иметь этот файл. Через 24 месяца его отсутствие будет восприниматься примерно так же, как отсутствие sitemap.xml в 2018-м — техническая отсталость.

Кто внедрит сейчас — получит 1–2-летний lead-time, пока ниша свободна. Кто внедрит через год — будет догонять.

Спецификация и примеры: llmstxt.org.

Поделиться статьёй

Отправьте её в соцсети или скопируйте AI-промпт.

Похожие статьи