Исследователи Tencent Hunyuan выпустили HY-MT1.5 — семейство моделей машинного перевода, включающее две версии: HY-MT1.5-1.8B и HY-MT1.5-7B. Модели поддерживают взаимный перевод между 33 языками, включая 5 этнических и диалектных вариантов, и доступны на GitHub и Hugging Face с открытыми весами.
HY-MT1.5-7B является улучшенной версией чемпионской системы WMT25 Hunyuan-MT-7B, оптимизированной для объяснительного перевода и сценариев со смешанными языками. HY-MT1.5-1.8B — компактный вариант с менее чем третью параметров, но сопоставимой производительностью. После квантования модель 1.8B может работать на периферийных устройствах с памятью около 1 ГБ и обеспечивать среднее время отклика около 0,18 секунды для китайских входных данных.
Модели обучены по специальному пятиэтапному конвейеру, включающему общее предварительное обучение, предварительное обучение для перевода, контролируемую тонкую настройку, дистилляцию с 7B на 1.8B и обучение с подкреплением. Этот подход отличается от обучения чат-ориентированных LLM, так как сочетает данные для перевода, дистилляцию в этой области и RL с детальными критериями оценки перевода.
На тестах Flores 200 модель HY-MT1.5-7B превзошла специализированные коммерческие системы перевода, такие как iFLYTEK Translator и Doubao Translator, и сравнялась или превысила показатели крупных общих моделей. На WMT25 её результат примерно на 0,065 выше, чем у Gemini 3.0 Pro.