«Лаборатория Касперского» запатентовала в США новую передовую технологию, позволяющую обнаруживать спам в графических изображениях.
Для того, чтобы сделать определение спама более сложным, спамеры рассылают свои сообщения в виде графических файлов. Для того, чтобы определить, что это спам, нужно выделить его на изображении. Чтобы усложнить это, спамеры используют шум на заднем фоне изображения, деформированные буквы, и их размещение, а также разбивают изображение с помощью рамок и линий.
Для распознавания текста на изображении обычно используются системы оптического распознавания текста (OCR). Но они требуют больших ресурсов и не гарантируют нужной точности определения. Именно эти является отличительной чертой новой системы определения графического спама, которая гарантированно быстро определяет спам на изображении. Кроме того, она является устойчивой к зашумлению и деформации изображения, благодаря чему уровень определения спама повышается.
Основой для данной технологии служит вероятностно-статистический метод, суть которого состоит в том, что спам на изображении определяется путем анализа характера расположения вероятных графических образов слов и строк, а также определение содержания в них данных образов букв и слов. Автором данной технологии является руководитель группы развития антиспам-технологий «Лаборатории Касперского» Евгений Смирнов. Патентное бюро США 27 апреля 2010 г. выдало на технологию два патента №№ 7706613 и 7706614.
Также, 4 мая 2010 под номером № 7711192 был запатентован усовершенствованный вариант данной технологии. В этом варианте были значительно оптимизированы технологии обнаружения объектов на графическом изображении, что позволило сделать их более различимыми, кроме того, была увеличена эффективность фильтрации спама, который был обнаружен на изображениях.