Автоматический перевод страниц Drupal с помощью ИИ

09/05/2026, by Ivan

Многоязычный бэклог имеет особый запах. В понедельник вы публикуете на английском, обещаете немецкий «на этой неделе», а к пятнице смотрите на 47 обновлённых страниц и не понимаете, как внятно ответить: «Итак… каков реальный статус?»

Я видел, как команды пытались решить это, добавляя ещё больше процесса: таблицы, тикеты на перевод, еженедельные синки. Это работает до тех пор, пока кто-то не правит герой-параграф на 200 страницах. Потом вы снова начинаете гадать.

Наконец у нас сработал подход, когда перевод стали воспринимать как производственную систему: TMGMT для учёта и управления, небольшой кастомный модуль, который автоматически запускает задания через cron, и ИИ‑переводчик, работающий в фоне и умеющий обрабатывать большие поля, разбивая их на чанки.

Эта статья — взгляд менеджера: результаты, риски и вопросы, которые стоит задать команде, чтобы не получить «тихий» бардак.

Сначала — что на самом деле означает «автоматический перевод» (в терминах Drupal)

Если вы представляете себе волшебную кнопку, которая мгновенно превращает весь сайт в пять языков, забудьте. Надёжная версия медленнее и скучнее:

Обнаруживается новый или обновлённый контент.
Создаётся и отслеживается задание на перевод.
Работа выполняется в фоне по расписанию.
Результаты попадают на этап проверки (или автоматически принимаются, если вы выбираете этот риск).
Переведённый контент публикуется, когда соответствует вашим правилам.

Именно концепция «задания» делает TMGMT хорошим фундаментом. Он создан для управления переводом как работой со статусами, трекингом, источниками и плагинами переводчиков.

Поэтому вы покупаете не «ИИ‑перевод». Вы покупаете рабочий процесс, который можно измерять.

Почему cron и очереди — это не «деталь реализации»

Менеджеры обычно слышат «cron» и думают: «плановая задача, ок». Но автоматический cron в Drupal запускается по расписанию, которое может “плыть” при низком трафике, а в дефолтных настройках он может добавлять нагрузку к пользовательским запросам.

Переводческие задания тяжёлые. Это внешние API-вызовы, ретраи и иногда длинный текст. Поэтому надёжный паттерн такой: поставить работу в очередь, а затем дать cron обработать её контролируемыми порциями.

Вот управленческий перевод этого:

Редакторы не ждут перевода.
Сайт не получает всплеск задержек из‑за того, что кто-то опубликовал длинную страницу.
Пропускную способность можно настраивать, выделяя больше или меньше фонового времени.
Ошибки изолируются в маленьких единицах работы, вместо того чтобы валить весь прогон.

Если команда это не спланировала, вы получаете не автоматизацию. Вы получаете новый режим отказа.

ИИ‑часть: что вы получаете — и чего нет

Для ИИ‑переводчика мы используем TMGMT‑совместимый подход, чтобы перевод по‑прежнему управлялся через задания и workflow, а не одноразовыми скриптами.

С точки зрения проекта выбор провайдера важнее, чем кажется. Он даёт вам варианты на будущее:

Можно переключать модели, когда меняется стоимость.
Можно по‑другому маршрутизировать чувствительный контент, если того требует политика.
Можно настраивать стиль промпта по языкам, чтобы снизить дрейф тона.
Можно воспринимать настройки перевода как конфигурацию, а не как жёстко зашитую логику.

Но не переобещайте это внутри компании. ИИ‑перевод быстрый и бывает удивительно хорошим, но ему всё равно нужна управляемость. Review‑процессы существуют не просто так.

Главный операционный риск: длинные поля Body

Это та часть, о которой PM-ы обычно узнают только после первого инцидента.

Большие поля Body (документация, policy-страницы, страницы с большим количеством встроенной разметки) — это место, где наивный ИИ‑перевод ломается. Иногда — громко. Гораздо чаще — тихо: частичный результат, непоследовательное форматирование или битый HTML, который просачивается, пока кто-то не заметит это на продакшене.

Наше решение — не «лучше промптить». Это инженерия:

Переводить в фоне, а не в пути пользовательского запроса.
Делить большие значения Body на чанки, которые остаются в практичных пределах.
Собирать обратно в исходном порядке.
Делать ретраи на уровне чанка, чтобы один сбой не блокировал всю страницу.

Чанкинг добавляет компромисс: терминология может “плыть” между чанками. Это смягчается лёгким глоссарием или правилами стиля для каждого языка.

Что делает кастомный модуль (и зачем он вам)

TMGMT — это движок workflow, но всё равно кто-то должен решать, когда создавать переводческое задание. Эту роль и выполняет кастомный модуль:

Отслеживает изменения контента.
Определяет, какие языки требуются для данного типа контента.
Автоматически создаёт или обновляет переводческие задания.
Кладёт работу в очередь, чтобы cron обработал её позже.

Это даёт предсказуемый операционный ритм. И делает перевод частью гигиены публикации, а не отдельным проектным потоком.

В крупных программах нужны явные правила: какие типы контента переводятся автоматически, какие требуют ревью, и что происходит при мелких правках по сравнению с серьёзными переписываниями. Без правил автоматизация превращается в «сюрпризное» поведение.

Что измерять (чтобы понимать, что это работает)

Если вы не определите успех, команда определит его за вас — и вам может не понравиться их определение. Вот метрики, которые реально отражают результаты:

Задержка перевода: медианное время от публикации/обновления контента до момента, когда перевод доступен для ревью.
Размер бэклога: количество элементов в состояниях «нужен перевод» или «нужно ревью».
Доля доработок: как часто люди редактируют переводы после ИИ‑результата.
Частота сбоев: ретраи, зависшие задания или проблемы форматирования, требующие вмешательства.

Используйте трекинг заданий как поверхность для отчётности, вместо того чтобы изобретать параллельный дашборд.

Управление (governance): где проекты либо выстреливают, либо тихо позорят вас

Самый быстрый способ потерять доверие к автоматическому переводу — опубликовать что-то юридически рискованное или вредящее бренду. Автоматизация увеличивает радиус поражения.

Понадобятся решения на уровне политики, а не только модули:

Какие типы контента могут авто‑публиковать ИИ‑переводы?
Какие обязательно должны проходить ревью?
Кто владеет терминами глоссария: названия продуктов, юридические формулировки, регулируемый язык?
Какой у вас план отката, если обновление модели изменит тональность?

Гибридная модель часто выглядит здравым компромиссом: ИИ закрывает объём, люди закрывают риск.

План внедрения, который не «взорвёт» вашу редакцию

Если сделать всё сразу, редакторы почувствуют, что почва ушла из-под ног. Есть путь лучше.

Начните с одного типа контента с понятной структурой и меньшим риском. Новости, страницы событий, FAQ. Стабилизируйте пайплайн. Потом расширяйтесь на «грязное»: лонгриды, документацию, маркетинговые страницы с тяжёлым форматированием.

И ещё: заранее решите, как вы запускаете cron. Надёжность и throughput влияют на сроки поставки сильнее, чем команды обычно ожидают. Это не техническая сноска.

Вопрос, который я бы задал перед тем, как дать зелёный свет

Когда система работает, перевод становится фоновым шумом. В этом и цель.

Но вот неудобный вопрос: вы оптимизируете скорость или уверенность? Потому что ответ определяет, будете ли вы авто‑публиковать, насколько строгим будет ревью, с каких языков начнёте и сколько вложите в контроль терминологии.

Если вы скажете, какой у вас сайт (маркетинговый, документационный или смешанный) и сколько языков в рамках, я предложу подход к внедрению, который соответствует профилю риска, вместо того чтобы притворяться, что один workflow подходит всем.

Ищете лучшую Drupal‑компанию по разработке на рынке? Вы её только что нашли.
Мы — крупнейшее digital‑агентство, сфокусированное на Drupal, созданное для поставки быстрых, безопасных и масштабируемых платформ — без компромиссов. От новых разработок и редизайнов до миграций и долгосрочной поддержки — наши Drupal‑эксперты поставляют enterprise‑уровень с вниманием уровня boutique.
Запланируйте звонок уже сегодня — и превратим вашу Drupal‑дорожную карту в высокопроизводительную реальность.

Технические и архитектурные вопросы
Ivan Abramenko, Ведущий архитектор Drupal
ivan.abramenko@drupalbook.orgivan.abramenko@drupalbook.org

Проектные вопросы
projects@drupalbook.orgprojects@drupalbook.org

Дополнительные типы блоков (EBT) — новый опыт конструктора страниц❗

❗Дополнительные типы параграфов (EPT) — новый опыт работы с параграфами

GLightbox is a pure javascript lightbox (Colorbox alternative without jQuery)❗