МОДЕЛЬ ЭЛЕКТРОННЫХ ПИСЕМ В ЗАДАЧЕ ОБНАРУЖЕНИЯ СПАМА
С. В. Корелов1, А. М. Петров1, Л. Ю. Ротков2, А. А. Горбунов2 1Национальный координационный центр по компьютерным инцидентам,
Российская Федерация, 107031, Москва, ул. Б. Лубянка, 1/3
E-mail: korelovsv@cert.gov.ru 2Национальный исследовательский Нижегородский государственный
университет им. Н.И. Лобачевского,
Российская Федерация, 603950, Нижний Новгород, пр-т Гагарина, 23
E-mail: rtv@rf.unn.ru
АННОТАЦИЯ
В статье предложена генетическая модель электронных писем, учитывающая их содержание, для обнаружения спама. В качестве базового подхода для формирования модели электронных писем был выбран генетический подход к формированию математических моделей текстов, зарекомендовавший себя для решения различных задач.
КЛЮЧЕВЫЕ СЛОВА
информационная безопасность; спам; обнаружение; модель электронного письма; генетический подход; генетическая модель; электронная почта; электронные почтовые сообщения; электронные письма
ПОЛНЫЙ ТЕКСТ (pdf)
СПИСОК ЛИТЕРАТУРЫ
1. Sahami M., Dumais S., Heckerman D., and Horvitz E. A bayesian approach to filtering junk E-mail. In Proc. of AAAI Workshop on Learning for Text Categorization. AAAI Technical Report WS-98-05, 1998. Pp. 55-62.
2. Robinson G. A statistical approach to the spam problem. Linux Journal Issue #107, 2003.
3. Junejo K., Yousaf M., and Karim A. A Two-Pass Statistical Approach for Automatic Personalized Spam Filtering. ECML-PKDD Discover Challenge Workshop, 2006. Pp. 16-27.
4. Junejo K. and Karim A. PSSF: A Novel Statistical Approach for Personalized Service-side Spam Filtering. IEEE/WIC/ACM International Conference on Web Intelligence, 2007. Pp. 228-234. DOI 10.1109/WI.2007.47.
5. Sakkis G., Androutsopoulos I., Paliouras G., Karkaletsis V., Spyropoulos C.D., and Stamatopoulos P. A memory-based approach to anti-spam filtering for mailing lists. Information Retrieval, Springer 6 (1), 2003. Pp. 49-73. DOI: 10.1023/A:1022948414856
6. Drucker H., Wu D., and Vapnik V.N. Support vector machine for spam categorization. IEEE Transactions on Neural Networks 10 (5). 1999. Pp. 1048–1054. DOI: 10.1109/72.788645
7. Cohen W.W. Learning rules that classify e-mail. In Proc. of 1996 AAAI Spring Symposium in Information Access, 1996. Pp. 18-25.
8. Delany S.J., Cunningham P., and Coyle L. An assessment of case-based reasoning for spam filtering. Artificial Intelligence Review. Springer 24 (3-4). 2005. Pp. 359-378. DOI: 10.1007/s10462-005-9006-6
9. Gee K. Using Latent Semantic Indexing to Filter Spam. In SAC ’03: Proceedings of the 2003 ACM symposium on Applied computing, 2003. Pp. 460–464. DOI: 10.1145/952532.952623
10. Sebastiani F. Machine Learning in Automated Text Categorization // ACM Computing Surveys. 2002. Vol. 34, No. 1. March 2002. Pp. 1-47. DOI: 10.1145/505282.505283
11. Ермаков А.Е. Эксплицирование элементов смысла текста средствами синтаксического анализа-синтеза // Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2003. М: Наука, 2003. Pp. 136-140.
12. Корелов С.В., Ротков Л.Ю. Метод генетических карт в задаче идентификации спама // Информационно-измерительные и управляющие системы. 2011. № 3, Т. 9. С. 72-75.
13. Кирьянов К.Г. Генетический код и тексты: динамические и информационные модели сложных систем /Ред. Л.Ю. Ротков, А.В. Якимов. Нижний Новгород: ТАЛАМ, 2002. 100 с.
14. Кирьянов К.Г. Выбор оптимальных базовых параметров источников экспериментальных данных при их идентификации // Труды III Междунар. конф. «Идентификация систем и задачи управления SICPRO’04». М.: ИПУ РАН, 2004. С. 187-208.
15. Корелов С.В., Ротков Л.Ю. Идентификация текстового спама методом генетических карт // Вестник Нижегородского университета им. Н.И. Лобачевского. 2012. № 4 (1). С. 101-104.
16. Metsis V., Androutsopoulos I. and Paliouras G. Spam Filtering with Naive Bayes - Which Naive Bayes? // Proceedings of the 3rd Conference on Email and Anti-Spam (CEAS 2006), Mountain View, CA, USA, 2006. Pp. 28-69.
Для цитирования: Корелов С. В., Петров А. М., Ротков Л. Ю., Горбунов А. А. Модель электронных писем в задаче обнаружения спама // Вестник Поволжского государственного технологического университета. Сер.: Радиотехнические и инфокоммуникационные системы. 2020. № 2 (46). С. 44-54. DOI: https://doi.org/10.25686/2306-2819.2020.2.44
Отдел научных программ, интеллектуальной собственности и НИРС
(8362) 68-60-13, аудитория 404 (I) – НИРС, гранты
(8362) 68-60-09, 68-60-62 аудитория 423(I) – ОИС, публикации