Чжун Жуйюй (Аспирант, ФГАОУ ВО «Национальный исследовательский университет «Московский институт электронной техники»)
|
Выбор основных признаков словаря влияет на производительность машинного перевода. Эта работа стремится выяснить, что такое хороший словарный запас и можно ли найти оптимальный словарный запас без пробного обучения. Чтобы ответить на эти вопросы, мы сначала обеспечиваем альтернативное понимание роли словарного запаса с точки зрения теории информации. Исходя из этих предпосылок мы будем искать словарь с наилучшими признаками подходящего размера – как оптимальный транспорт (ОТ). Мы предлагаем VNMT, простое и эффективное решение без пробного обучения. Эмпирический результаты показывают, что VNMT превосходит широко используемые словари в различных сценариях, включая WMT-14 английский-немецкий и TED многоязычный перевод. Например, VNMT достигает почти 70% сокращения размера словарного запаса и 0,5 BLEU усиления в англо-немецком переводе.
Ключевые слова:обработки естественного языка, машинный перевод, словарь, оптимальный транспорт, машинное обучение, многоязычный перевод.
|
|
|
Читать полный текст статьи …
|
Ссылка для цитирования: Чжун Ж. Обучение словарю с помощью оптимального транспорта для нейронного машинного перевода // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2022. -№04. -С. 159-165 DOI 10.37882/2223-2966.2022.04.39 |
|
|