AI-First: Как превратить вашу базу данных (DLE, CSV, Excel) в источник для нейросетей

Или: Почему в 2026 году вам не нужен «сайт». Вам нужен API для роботов, которые приведут людей.


🧠 Пролог: Ваши данные — это нефть. Но она сырая


У вас есть:
  • База данных DLE с 10 000 статей за 10 лет.
  • CSV-файл с остатками запчастей на складе (как в нашем кейсе).
  • Excel-таблица с номенклатурой товаров.
  • База клиентов из CRM.

И это всё — чёрное золото, которое лежит у вас под ногами. Проблема в том, что оно сырое. Вы не можете залить его в бак нейросети и поехать.

Классический сайт с красивым дизайном — это как нефтяная вышка без трубопровода. Она есть, нефть есть, а денег нет.

В эпоху, когда 60% поисковых запросов завершаются без перехода на сайт, ваша задача — не «сделать сайт красивее», а превратить данные в язык, понятный AI-агентам.

Вот пошаговый план, как это сделать на основе нашего CSV-кейса.



🏗️ Акт 1: От CSV к AI-фиду — архитектура сытых нейросетей


Ваш CSV-файл (sklad.csv) — это уже база данных. Просто она не индексируется и не структурирована. Чтобы накормить нейросеть, нужно добавить 5 слоёв обработки.

Слой 1. Чистка и нормализация (сырая нефть -> мазут)


Первый этап — превратить «кривой» CSV в стабильный JSON-источник. В вашем скрипте это уже есть:
  • Удаление BOM-символов.
  • Приведение кодировки к UTF-8.
  • Экранирование спецсимволов.

Совет (улучшение): Добавьте фоновый cron-скрипт, который раз в 10 минут конвертирует CSV в сериализованный PHP-объект или JSON-файл. Это снизит нагрузку на процессор при каждом запросе. Чтение 50 000 строк из CSV при каждом открытии страницы — не лучшая идея.

Слой 2. Структурирование в JSON-LD (мазут -> бензин)



Вы сделали это правильно, добавив микроразметку JSON-LD прямо в карточку товара. Для нейросети это и есть «бензин».

Что нужно проверять (это важно):
  • Тип товара: Product, Vehicle, Product для автозапчастей.
  • Обязательные поля: sku (артикул), name (название), offers (предложение о продаже) с ценой и валютой, brand (марка).
  • Наличие: availability строго по справочнику https://schema.org/InStock или OutOfStock.
  • Условия доставки: shippingDetails — крайне важно для интернет-магазинов.

Если вы не укажете цену в JSON-LD, нейросеть может решить, что товар бесплатный, и ответит пользователю: «Запчасть есть, цена не указана, нужно позвонить». Вы потеряли клиента.

Слой 3. RSS и YML — каналы доставки (бензин -> заправка)


Вы создали rss.php и yml.php. Это каналы, по которым нейросети и маркетплейсы забирают топливо.

RSS — для подписчиков и агрегаторов. YML — для Яндекс.Маркета.
Но это не всё. Добавьте ещё один формат: JSON Feed. Это современная альтернатива RSS, которую многие AI-приложения понимают лучше. Просто реализуйте эндпоинт /api/feed.json, который отдаёт данные как RSS, но в JSON.

Слой 4. API для AI-агентов (заправка -> двигатель)


Самый важный слой. Создайте отдельный эндпоинт для машин, например /api/ai-search.php.

Чем он отличается от обычного filters.php?
  • Отдаёт не HTML, а чистый JSON.
  • Не имеет дизайна и пагинации картинками.
  • Оптимизирован под контекстное окно LLM — текст должен быть коротким, но ёмким.

Этот эндпоинт будут дергать персональные AI-агенты пользователей (Perplexity, ChatGPT search, YandexGPT), когда человек спросит: «Найди мне кольцо уплотнительное для IVECO с артикулом 000.230».

Ваш скрипт найдёт товар в CSV и вернёт роботу чистый JSON. А робот прочитает его и ответит пользователю голосом: «Вот такая запчасть есть на складе, стоит 160 рублей».

Слой 5. Sitemap для роботов (карта навигации)


Вы создали sitemap.php. Отлично. Убедитесь, что в карту включены все динамические страницы:
  • /part/123
  • /brand/IVECO
  • /category/уплотнительные-кольца

Это как раздать карту Google и Yandex, чтобы их роботы нашли все ваши «заправки».



🔄 Акт 2: Применим подход к DLE (Новостной сайт)


А если у вас не CSV, а база данных DLE со статьями? Принцип тот же.

1. Генерация JSON-фида из DLE


Используйте DLE2JSON (плагин) или напишите свой скрипт для экспорта новостей в JSON.
Эндпоинт: /api/news.json?limit=50&category=it

2. Добавление JSON-LD в шаблон



В шаблон DLE (fullstory.tpl или shortstory.tpl) добавьте разметку Schema.org.

Для статей (тип Article или NewsArticle):
  • headline (заголовок)
  • datePublished (дата публикации)
  • author (автор)
  • articleBody (текст статьи).

Важно: Не дублируйте весь текст статьи в JSON-LD, если он уже есть в HTML. Для агентов достаточно заголовка, даты, автора и ссылки на полную версию. AI-агент сам дочитает статью.

3. RSS для каждой рубрики


Создайте страницу rss.php?category=it. По ней AI-агенты и RSS-ридеры будут мониторить новые статьи.

4. API для поиска



Сделайте эндпоинт /api/search.php?q=нейросети+SEO. Он будет искать в базе DLE и отдавать JSON со ссылками на статьи и краткими выдержками.



📊 Акт 3: Матрица готовности к эпохе AI (чек-лист)


Пройдите по пунктам и отметьте, что уже есть:

КомпонентCSV (каталог)DLE (блог)Статус
Нормализация данных✅ Очистка BOM, кодировка❌ Хранится HTML, нужно чистить
Структурированные данные (JSON-LD)✅ Product, Offer, Brand❌ Нет (или только для главной)
RSS-ленты✅ По брендам❌ Только общая лента
YML для маркетплейсов✅ Яндекс.Маркет❌ Не применимо
JSON Feed (AI-формат)❌ Нет❌ Нет⭐ Срочно добавить
API для AI-агентов❌ Нет❌ Нет⭐ Срочно добавить
Sitemap (динамическая)✅ Да✅ Да (в DLE есть)
ЧПУ через .htaccess✅ Да✅ Да (в DLE есть)

⭐ = критически важно для выживания в 2026 году.



🧠 Акт 4: Итоговая философия «Технологического прагматизма»


В 2026 году классический сайт — это не место, куда приходят люди. Это место, откуда AI-агенты забирают данные, чтобы привести людей.

Ваша задача — сделать это место:
  1. Доступным для роботов (не блокируйте JSON-фиды в robots.txt).
  2. Понятным для нейросетей (используйте JSON-LD, а не просто красивый дизайн).
  3. Быстрым для машин (кешируйте тяжёлые CSV-файлы в JSON).
  4. Прозрачным для агентов (создайте специальный API для поиска).

Что будет, если этого не сделать?

Ваш сайт исчезнет из нейросетевого поиска. Когда пользователь спросит у ChatGPT: «Где купить кольцо уплотнительное для IVECO?», он получит ответ от конкурента, у которого есть JSON-LD и API. Ваша запчасть останется лежать в CSV-файле, никому не нужная, как золото на необитаемом острове.



🚀 Эпилог: Вы уже на полпути


Вы уже сделали 80% работы:
  • Есть CSV.
  • Есть набор скриптов.
  • Есть JSON-LD для товаров.
  • Есть RSS, YML, sitemap.

Осталось добавить два ключевых элемента:
  1. Кеширование CSV в JSON (чтобы не грузить процессор при каждом чихе).
  2. API для AI-агентов (чтобы нейросети могли обращаться к вам напрямую).

И тогда ваши данные превратятся в настоящий актив, который работает на вас 24/7.


P.S. Мы в TCSE уже внедряем этот подход для клиентов: CSV -> JSON-LD -> AI-API -> Рост заказов. Схема работает. Если нужно — поможем сделать то же самое с вашими данными, будь то DLE, CSV или старая добрая Excel-таблица.