ВЫБОР РАЗМЕРА КОДОВОЙ ТАБЛИЦЫ
В МОДЕЛИ ЭЛЕКТРОННЫХ ПИСЕМ
С. В. Корелов1, А. М. Петров1, И. Г. Сидоркина2, Л. Ю. Ротков3, А. А. Горбунов3 1 Национальный координационный центр по компьютерным инцидентам,
Российская Федерация, 107031, Москва, ул. Б. Лубянка, 1/3
E-mail: korelovsv@cert.gov.ru 2 Поволжский государственный технологический университет,
Российская Федерация, 424000, Йошкар-Ола, пл. Ленина, 3
E-mail: SidorkinaIG@volgatech.net 3Национальный исследовательский Нижегородский государственный университет им. Н.И. Лобачевского,
Российская Федерация, 603950, Нижний Новгород, пр-т Гагарина, 23
E-mail: rtv@rf.unn.ru
АННОТАЦИЯ
Функционирование практически любой организации в той или иной степени зависит от того, насколько надёжно защищены её информационные ресурсы от различных угроз безопасности информации, одной из которых является спам. Совершено множество попыток раз и навсегда решить проблему его обнаружения. В данной предметной области постоянно ведутся исследования. По их результатам предлагаются и реализуются на практике различные подходы. Ранее авторами предложена модель электронных писем, учитывающая их содержание, которое зачастую меняется в зависимости от выполняемых пользователями задач и меняющихся их информационных потребностей. В настоящей статье обсуждается вопрос выбора численного значения ключевого параметра модели электронных писем для обнаружения спама, полученной на основе генетического подхода к формированию математических моделей текстов, зарекомендовавшего себя для решения различных задач.
КЛЮЧЕВЫЕ СЛОВА
информационная безопасность; спам; обнаружение; модель электронного письма; электронная почта; электронные почтовые сообщения; электронные письма
ПОЛНЫЙ ТЕКСТ (pdf)
ФИНАНСИРОВАНИЕ
СПИСОК ЛИТЕРАТУРЫ
1. Чернопрудова Е. Н., Соловьев Н. А. Формирование устойчивых словосочетаний в задаче контентной фильтрации электронных сообщений // Вестник Оренбургского государственного университета. 2013. № 11 (160). С. 84-90.
2. Shen H., Li Z. Leveraging Social Networks for Effective Spam Filtering // IEEE Transactions on Computers. 2014. Vol. 63. No. 11. Pp. 2743-2759. DOI:10.1109/TC.2013.152.
3. Предобработка текстов электронных писем в задаче обнаружения спама / С.В. Корелов, А.М. Петров, Л.Ю. Ротков и др. // Труды учебных заведений связи. 2020. Т. 6. № 4. С. 80-90. DOI:10.31854/1813-324X-2020-6-4-80-90.
4. Модель электронных писем в задаче обнаружения спама / С.В. Корелов, А.М. Петров, Л.Ю. Ротков и др. // Вестник Поволжского государственного технологического университета. Сер.: Радиотехнические и инфокоммуникационные системы. 2020. № 2 (46). С. 44-54. DOI: https://doi.org/10.25686/2306-2819.2020.2.44.
5. Кирьянов К.Г. Генетический код и тексты: динамические и информационные модели сложных систем /Ред. Л.Ю. Ротков, А.В. Якимов. Нижний Новгород: ТАЛАМ, 2002. 100 с.
6. Кирьянов К.Г. Выбор оптимальных базовых параметров источников экспериментальных данных при их идентификации // Идентификация систем и задачи управления SICPRO’04: Тр. III Междунар. конф. М.: Изд-во ИПУ РАН, 2004. С. 187–208.
7. К вопросу об определении численного значения параметра в модели электронных писем / С. В. Корелов, А. М. Петров, Л. Ю. Ротков и др. // Труды XXIV научной конференции по радиофизике, посвященной 75-летию радиофизического факультета (Нижний Новгород, 13-31 мая 2020 г.). Нижний Новгород: ННГУ, 2020. С. 471-474.
8. Определение длины выборки в модели электронных писем / С. В. Корелов, А. М. Петров, Л. Ю. Ротков и др. // Вестник Пермского национального исследовательского политехнического университета. Электротехника, информационные технологии, системы управления. 2020. № 4 (36). С. 31–47. DOI: 10.15593/2224-9397/2020.4.02.
9. Metsis V., Androutsopoulos I., Paliouras G. Spam Filtering with Naive Bayes – Which Naive Bayes? // Proceedings of the 3rd Conference on Email and Anti-Spam (CEAS 2006, Mountain View, USA, 27–28 July 2006). 2006. Pp. 28–69.
10. Sebastiani F. Machine Learning in Automated Text Categorization // ACM Computing Surveys. 2002. Vol. 34. No. 1. Pp. 1–47. DOI:10.1145/505282.505283.
11. Sebastiani F. Text Categorization // Zanasi A. (ed.). Text Mining and its Applications. Southampton: WIT Press, 2005. Pp. 109–129.
12. Aas K., Eikvil L. Text Categorisation: A Survey // Norwegian Computing Center. Tech. Report number: 941, 1999.
13. Manning C., Raghavan P., Shütze H. Introduction to Information Retrieval. Cambridge: Cambridge University Press, 2008. DOI: 10.1017/CBO9780511809071.
14. Sokolova M., Lapalme G. A Systematic Analysis of Performance Measures for Classification Tasks // Information Processing & Management. 2009. Vol. 45. Iss. 4. Pp. 427–437. DOI:10.1016/j.ipm.2009.03.002.
15. Комбинирование значений параметра модели электронных писем / С.В. Корелов, А.М. Петров, Л.Ю. Ротков и др. // Сборник материалов XII Международной Интернет-конференции молодых ученых, аспирантов и студентов «Инновационные технологии: теория, инструменты, практика» (InnoTech-2020). (Пермь, 16 ноября - 31 декабря 2020 г.). Пермь: ПНИПУ, 2020. С. 1–7.
16. Анализ результатов реализации подхода к выделению термов в модели электронных писем на случайность / С.В. Корелов, А.М. Петров, Л.Ю. Ротков и др. // Труды XXV научной конференции по радиофизике (Нижний Новгород, 11-22 мая 2020 г.). Нижний Новгород: ННГУ, 2021. С. 498–502.
Для цитирования: Корелов С. В., Петров А. М., Сидоркина И. Г., Ротков Л. Ю., Горбунов А. А. Выбор размера кодовой таблицы в модели электронных писем // Вестник Поволжского государственного технологического университета. Сер.: Радиотехнические и инфокоммуникационные системы. 2021. № 3 (51). С. 49-62. DOI: https://doi.org/10.25686/2306-2819.2021.3.49
Отдел научных программ, интеллектуальной собственности и НИРС
(8362) 68-60-13, аудитория 404 (I) – НИРС, гранты
(8362) 68-60-09, 68-60-62 аудитория 423(I) – ОИС, публикации