Артамонов Алексей Анатольевич (к.т.н., Национальный исследовательский ядерный университет «МИФИ», Москва, Россия)
| |
Возрастающий объем неструктурированных научных данных требует разработки эффективных методик автоматизированного извлечения и структурирования информации. Актуальность исследования обусловлена необходимостью создания целостных моделей цифровых объектов для последующего многостороннего анализа в условиях гетерогенности источников данных. Проблема заключается в отсутствии количественно обоснованной методологии выбора оптимальных подходов к извлечению данных из различных типов документов при обеспечении требуемой достоверности результатов. Цель работы — разработать и верифицировать методику наполнения модели цифрового объекта из разнородных информационных ресурсов с количественной оценкой эффективности применяемых методов извлечения данных на примере научных публикаций.
Ключевые слова:извлечение данных, цифровой объект, научные публикации, NLP, оценка достоверности, NoSQL, документоориентированные базы данных.
|
|
| |
|
Читать полный текст статьи …
|
Ссылка для цитирования: Артамонов А. А. МЕТОДИКА НАПОЛНЕНИЯ МОДЕЛИ ЦИФРОВОГО ОБЪЕКТА ИЗ РАЗНОРОДНЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ НА ОСНОВЕ КОЛИЧЕСТВЕННОЙ ОЦЕНКИ ЭФФЕКТИВНОСТИ МЕТОДОВ ИЗВЛЕЧЕНИЯ ДАННЫХ // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2026. -№01. -С. 45-50 DOI 10.37882/2223-2966.2026.01.05 |
|
|