Tencent выпустила HY-MT1.5: модели перевода на 1,8 и 7 млрд параметров - AI Founder

Tencent выпустила HY-MT1.5: модели перевода на 1,8 и 7 млрд параметров

Исследовательское подразделение Tencent Hunyuan выпустило HY-MT1.5 — семейство моделей машинного перевода, включающее компактную версию для устройств и мощную для облака.

Исследователи Tencent Hunyuan выпустили HY-MT1.5 — семейство моделей машинного перевода, включающее две версии: HY-MT1.5-1.8B и HY-MT1.5-7B. Модели поддерживают взаимный перевод между 33 языками, включая 5 этнических и диалектных вариантов, и доступны на GitHub и Hugging Face с открытыми весами.

HY-MT1.5-7B является улучшенной версией чемпионской системы WMT25 Hunyuan-MT-7B, оптимизированной для объяснительного перевода и сценариев со смешанными языками. HY-MT1.5-1.8B — компактный вариант с менее чем третью параметров, но сопоставимой производительностью. После квантования модель 1.8B может работать на периферийных устройствах с памятью около 1 ГБ и обеспечивать среднее время отклика около 0,18 секунды для китайских входных данных.

Модели обучены по специальному пятиэтапному конвейеру, включающему общее предварительное обучение, предварительное обучение для перевода, контролируемую тонкую настройку, дистилляцию с 7B на 1.8B и обучение с подкреплением. Этот подход отличается от обучения чат-ориентированных LLM, так как сочетает данные для перевода, дистилляцию в этой области и RL с детальными критериями оценки перевода.

На тестах Flores 200 модель HY-MT1.5-7B превзошла специализированные коммерческие системы перевода, такие как iFLYTEK Translator и Doubao Translator, и сравнялась или превысила показатели крупных общих моделей. На WMT25 её результат примерно на 0,065 выше, чем у Gemini 3.0 Pro.

Мария Соколова
Автор: Мария Соколова

Журналист и аналитик с фокусом на AI-инструменты для стартапов. Пишу о том, как основатели компаний внедряют ИИ для автоматизации и роста выручки.

Подпишись на наш Telegram-канал

чтобы не упустить главные AI-новости

Подписаться
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x