Зачем это нужно
Алиса и Нейро извлекают ответы из абзацев целиком. Если абзац содержит 2-3 разные мысли, нейросеть не может выделить ту, которая нужна для ответа. Принцип «один абзац — одна мысль» из словаря Алисы — базовое правило структуры контента под AI. Также облегчает чтение собственнику бизнеса с экрана телефона.
Как сделать
Соблюдать чёткие лимиты:
- 3-4 предложения на абзац максимум
- Средняя длина предложения 15-20 слов
- Если в голове две мысли — два абзаца, не один
- Сложноподчинённые предложения с 3+ запятыми разбивать на несколько простых
- Между абзацами — реальный смысловой переход, не «также», «кроме того» подряд
Как проверить
Регекс на абзацы и их длину:
grep -oP '<p>[^<]+</p>' page.html | awk '{print NF}' | sort -n | tail
Самые длинные абзацы должны быть в районе 60-80 слов. Всё, что больше 100 слов — кандидат на разбиение. Дополнительно — оцените текст на телефоне: если абзац занимает больше экрана, разбейте.
Типичные ошибки
Простыни текста из 8-10 предложений — страница теряет извлекаемость. Слишком короткие абзацы по 1 предложению — теряется контекст. Перенасыщение вводными словами «таким образом», «в свою очередь» — снижает плотность смысла.