49-62

УДК 004.056, 004.852, 004.042
DOI: https://doi.org/10.25686/2306-2819.2021.3.49

ВЫБОР РАЗМЕРА КОДОВОЙ ТАБЛИЦЫ
В МОДЕЛИ ЭЛЕКТРОННЫХ ПИСЕМ

С. В. Корелов1, А. М. Петров1, И. Г. Сидоркина2, Л. Ю. Ротков3, А. А. Горбунов3
Национальный координационный центр по компьютерным инцидентам,
Российская Федерация, 107031, Москва, ул. Б. Лубянка, 1/3
E-mail: korelovsv@cert.gov.ru
Поволжский государственный технологический университет,
Российская Федерация, 424000, Йошкар-Ола, пл. Ленина, 3
E-mail: SidorkinaIG@volgatech.net
3Национальный исследовательский Нижегородский государственный университет им. Н.И. Лобачевского,
Российская Федерация, 603950, Нижний Новгород, пр-т Гагарина, 23
E-mail: rtv@rf.unn.ru

АННОТАЦИЯ

Функционирование практически любой организации в той или иной степени зависит от того, насколько надёжно защищены её информационные ресурсы от различных угроз безопасности информации, одной из которых является спам. Совершено множество попыток раз и навсегда решить проблему его обнаружения. В данной предметной области постоянно ведутся исследования. По их результатам предлагаются и реализуются на практике различные подходы. Ранее авторами предложена модель электронных писем, учитывающая их содержание, которое зачастую меняется в зависимости от выполняемых пользователями задач и меняющихся их информационных потребностей. В настоящей статье обсуждается вопрос выбора численного значения ключевого параметра модели электронных писем для обнаружения спама, полученной на основе генетического подхода к формированию математических моделей текстов, зарекомендовавшего себя для решения различных задач.

КЛЮЧЕВЫЕ СЛОВА  

информационная безопасность; спам; обнаружение; модель электронного письма; электронная почта; электронные почтовые сообщения; электронные письма

ПОЛНЫЙ ТЕКСТ (pdf)

ФИНАНСИРОВАНИЕ

СПИСОК ЛИТЕРАТУРЫ

1. Чернопрудова Е. Н., Соловьев Н. А. Формирование устойчивых словосочетаний в задаче контентной фильтрации электронных сообщений // Вестник Оренбургского государственного университета. 2013. № 11 (160). С. 84-90.
2. Shen H., Li Z. Leveraging Social Networks for Effective Spam Filtering // IEEE Transactions on Computers. 2014. Vol. 63. No. 11. Pp. 2743-2759. DOI:10.1109/TC.2013.152.
3. Предобработка текстов электронных писем в задаче обнаружения спама / С.В. Корелов, А.М. Петров, Л.Ю. Ротков и др. // Труды учебных заведений связи. 2020. Т. 6. № 4. С. 80-90. DOI:10.31854/1813-324X-2020-6-4-80-90.
4. Модель электронных писем в задаче обнаружения спама / С.В. Корелов, А.М. Петров, Л.Ю. Ротков и др. // Вестник Поволжского государственного технологического университета. Сер.: Радиотехнические и инфокоммуникационные системы. 2020. № 2 (46). С. 44-54. DOI: https://doi.org/10.25686/2306-2819.2020.2.44.
5. Кирьянов К.Г. Генетический код и тексты: динамические и информационные модели сложных систем /Ред. Л.Ю. Ротков, А.В. Якимов. Нижний Новгород: ТАЛАМ, 2002. 100 с.
6. Кирьянов К.Г. Выбор оптимальных базовых параметров источников экспериментальных данных при их идентификации // Идентификация систем и задачи управления SICPRO’04: Тр. III Междунар. конф. М.: Изд-во ИПУ РАН, 2004. С. 187–208.
7. К вопросу об определении численного значения параметра в модели электронных писем / С. В. Корелов, А. М. Петров, Л. Ю. Ротков и др. // Труды XXIV научной конференции по радиофизике, посвященной 75-летию радиофизического факультета (Нижний Новгород, 13-31 мая 2020 г.). Нижний Новгород: ННГУ, 2020. С. 471-474.
8. Определение длины выборки в модели электронных писем / С. В. Корелов, А. М. Петров, Л. Ю. Ротков и др. // Вестник Пермского национального исследовательского политехнического университета. Электротехника, информационные технологии, системы управления. 2020. № 4 (36). С. 31–47. DOI: 10.15593/2224-9397/2020.4.02.
9. Metsis V., Androutsopoulos I., Paliouras G. Spam Filtering with Naive Bayes – Which Naive Bayes? // Proceedings of the 3rd Conference on Email and Anti-Spam (CEAS 2006, Mountain View, USA, 27–28 July 2006). 2006. Pp. 28–69.
10. Sebastiani F. Machine Learning in Automated Text Categorization // ACM Computing Surveys. 2002. Vol. 34. No. 1. Pp. 1–47. DOI:10.1145/505282.505283.
11. Sebastiani F. Text Categorization // Zanasi A. (ed.). Text Mining and its Applications. Southampton: WIT Press, 2005. Pp. 109–129.
12. Aas K., Eikvil L. Text Categorisation: A Survey // Norwegian Computing Center. Tech. Report number: 941, 1999.
13. Manning C., Raghavan P., Shütze H. Introduction to Information Retrieval. Cambridge: Cambridge University Press, 2008. DOI: 10.1017/CBO9780511809071.
14. Sokolova M., Lapalme G. A Systematic Analysis of Performance Measures for Classification Tasks // Information Processing & Management. 2009. Vol. 45. Iss. 4. Pp. 427–437. DOI:10.1016/j.ipm.2009.03.002.
15.  Комбинирование значений параметра модели электронных писем / С.В. Корелов, А.М. Петров, Л.Ю. Ротков и др. // Сборник материалов XII Международной Интернет-конференции молодых ученых, аспирантов и студентов «Инновационные технологии: теория, инструменты, практика» (InnoTech-2020). (Пермь, 16 ноября - 31 декабря 2020 г.). Пермь: ПНИПУ, 2020. С. 1–7.
16.  Анализ результатов реализации подхода к выделению термов в модели электронных писем на случайность / С.В. Корелов, А.М. Петров, Л.Ю. Ротков и др. // Труды XXV научной конференции по радиофизике (Нижний Новгород, 11-22 мая 2020 г.). Нижний Новгород: ННГУ, 2021. С. 498–502.
 

Для цитирования: Корелов С. В., Петров А. М., Сидоркина И. Г., Ротков Л. Ю., Горбунов А. А. Выбор размера кодовой таблицы в модели электронных писем // Вестник Поволжского государственного технологического университета. Сер.: Радиотехнические и инфокоммуникационные системы. 2021. № 3 (51). С. 49-62. DOI: https://doi.org/10.25686/2306-2819.2021.3.49

 

© 2006-2025 Поволжский государственный технологический университет, ФГБОУ ВО «ПГТУ».
При использовании текстовой информации, фото- и видеоматериалов ссылка на сайт обязательна.

Разработано компанией «Цитрус»

Нашли ошибку?
Выделите текст с ошибкой и
нажмите Ctrl+Enter



Здесь тоже можно
прокручивать колесиком мыши