Тяньцы Гао (аспирант,
Московский государственный технический университет имени Н.Э. Баумана
)
Бо Ян (Аспирант
Московский государственный технический университет имени Н.Э. Баумана
)
Шэнжэнь Жао (Аспирант
Московский государственный технический университет имени Н.Э. Баумана
)
|
В области обучения робототехнических систем классический подход на основе чистого Q-обучения (Q-Learning) требует больших объёмов проб и ошибок, что снижает эффективность и может быть небезопасно при работе с реальными роботами. В данной работе предлагается метод ADQN (Augmented Deep Q-Network), совмещающий Q-Learning, искусственную нейронную сеть (ANN) и данные демонстраций. На первом этапе Q-сеть обучается офлайн на экспертных траекториях, затем в ходе онлайн-фазы одновременно используются TD-обновления и Margin-супервизия по демонстрационным действиям. Такая схема ускоряет сходимость алгоритма и повышает итоговую успешность. Мы сравниваем ADQN с двумя базовыми методами: (1) чистым DQN (без демонстраций) и (2) чистой имитацией (ANN). Эксперименты в среде MATLAB/Simulink и на реальном роботе Kinova Gen3 показывают, что ADQN достигает более высоких показателей и быстрее выходит на целевые результаты. Дополнительно проанализировано влияние приоритетного реплея и различных модулей алгоритма. Результаты подтверждают, что рассматриваемый подход эффективно совмещает преимущества обучения с подкреплением и демонстраций.
Ключевые слова:обучение с подкреплением, Q-Learning, искусственные нейронные сети, обучение по демонстрациям, робот-манипулятор.
|
|
|
Читать полный текст статьи …
|
Ссылка для цитирования: Тяньцы Г. , Бо Я. , Шэнжэнь Ж. РОБОТИЗИРОВАННОЕ ОБУЧЕНИЕ НА ОСНОВЕ Q-LEARNING И ANN С ИСПОЛЬЗОВАНИЕМ ДЕМОНСТРАЦИЙ (ADQN) // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2025. -№04. -С. 48-54 DOI 10.37882/2223-2966.2025.04.06 |
|
|