Уланов Кирилл Анатольевич (аспирант, кафедра информационных систем
Московский государственный технологический университет «Станкин», РФ
)
|
Статья исследует, как синтетические потоковые данные, генерируемые современными генеративными моделями, влияют на работу аналитических сервисов реального времени и систем обнаружения отклонений. Предлагается формальная модель вмешивания с параметрами доля–интенсивность–разнообразие для стека обработки потоков данных. Эксперименты на реальных синтетических потоках данных показали, что уже 5% синтетических сообщений могут существенно ухудшить точность прогнозов и увеличить задержку обнаружения аномалий. Работа вносит вклад в теорию контроля качества данных и формулирует практические рекомендации по использованию синтетических потоков.
Ключевые слова:генеративные потоковые данные, синтетические данные, обнаружение отклонений, контроль качества данных, потоковая аналитика
|
|
|
Читать полный текст статьи …
|
Ссылка для цитирования: Уланов К. А. ВЛИЯНИЕ СИНТЕТИЧЕСКИХ ПОТОКОВЫХ ДАННЫХ, СОЗДАННЫХ ГЕНЕРАТИВНЫМИ МОДЕЛЯМИ МАШИННОГО ОБУЧЕНИЯ, НА АНАЛИТИКУ И МЕТОДЫ РАННЕГО ВЫЯВЛЕНИЯ ОТКЛОНЕНИЙ // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2025. -№06/2. -С. 221-223 DOI 10.37882/2223-2966.2025.06-2.41 |
|
|