Охлупина Ольга Валентиновна (К.ф.-м.н., доцент, Брянский государственный инженерно-технологический университет)
Мурашко Дмитрий Сергеевич (Брянский государственный инженерно-технологический университет)
|
Среди распространённых методов борьбы со спамом особое место занимает вероятностный алгоритм машинного обучения, в основе которого лежит широко известная теорема Байеса. Так называемый «наивный» байесовский классификатор устанавливает класс документа посредством определения апостериорного максимума. С развитием методов машинного обучения байесовский алгоритм не потерял своей актуальности и продолжает оставаться весьма востребованным для решения большого количества задач, среди которых находится и обнаружение спама. Основными преимуществами данного классификатора являются простота, быстрая обучаемость, достаточно высокая точность, надёжность. В работе рассмотрено решение задачи определения спам-сообщений с использованием вероятностного алгоритма машинного обучения. Приводится математическое обоснование и реализация байесовского алгоритма на конкретном примере с помощью программного кода на языке программирования Python.
Ключевые слова:спам, фильтрация, вероятностный алгоритм, апостериорная вероятность, машинное обучение, классификатор, обучение.
|
|
|
Читать полный текст статьи …
|
Ссылка для цитирования: Охлупина О. В., Мурашко Д. С. Применение вероятностного алгоритма к фильтрации спама // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2022. -№03/2. -С. 52-57 DOI 10.37882/2223-2966.2022.03-2.15 |
|
|