Пуртов  Даниил Владимирович   (МИРЭА - Российский технологический университет)
                
            
            
                Пуртов  Владимир Сергеевич   (арт-директор
ООО “Элотра”
)
                
            
            
                Шмитько  Кирилл Андреевич   (МИРЭА - Российский технологический университет)
                
            
            
                Русаков  Алексей Михайлович   (старший преподаватель, 
МИРЭА - Российский технологический университет
)
                
            
            
                Мельников  Алексей Олегович   (доцент,
МИРЭА - Российский технологический университет)
                
            
            
                Филатов  Вячеслав Валерьевич   (доцент,
МИРЭА - Российский технологический университет
)
                
            
            
    
        
            | 
                
                    
                        |  | В данной статье представлено исследование по разработке программного инструмента Web-PD-Scanner, предназначенного для анализа веб-страниц в формате HTML с целью обнаружения потенциальной утечки персональных данных. В статье представлен обзор современных программных средств для парсинга веб-ресурсов, а также обзор технологий парсинга HTML-страниц и их ограничений. Обосновывается актуальность предлагаемого исследования, определяются объект, предмет исследования, область применения и ограничения программного обеспечения. Сформулированы основные задачи, решаемые программным обеспечением, и определены различные математические методы, алгоритмы и программные средства, которые могут быть использованы для разработки программного обеспечения Web-PD-Scanner. В статье делается вывод о том, что гибридный подход, сочетающий алгоритмы на основе правил и машинное обучение, является наиболее эффективным решением для обнаружения утечек персональных данных на веб-сайтах. Следующий этап исследования предполагает определение модели хранения агрегированных персональных данных и выбор конкретных методов и алгоритмов разработки программного обеспечения Web-PD-Scanner. Это исследование предоставляет ценную информацию для исследователей и практиков, заинтересованных в разработке программных инструментов для анализа веб-страниц на предмет утечки личных данных. Ключевые слова:скраппинг веб-страниц, интеллектуальный анализ данных, синтаксический анализ HTML, защита персональных данных, разработка программного обеспечения |  | 
        
            |  | 
        
            | Читать полный текст статьи …  | 
        
            | 
 
 
                
                    
                        | Ссылка для цитирования: Пуртов  Д. В., Пуртов  В. С., Шмитько  К. А., Русаков  А. М., Мельников  А. О., Филатов  В. В. РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ АНАЛИЗА САЙТОВ НА ПРЕДМЕТ УТЕЧКИ ПЕРСОНАЛЬНЫХ ДАННЫХ // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2023. -№05. -С. 97-104 DOI 10.37882/2223-2966.2023.05.29
 |  |  |