Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Электронный журнал "Спамтест". Все о борьбе со спамом


Информационный Канал Subscribe.Ru

Ашманов и ПартнерыSubscribe.ru
Электронный журнал "Спамтест" No. 89

в этом номере:


Новости

Microsoft подала иск против израильского спамера

24.02.2005

Microsoft Israel подала в тель-авивский окружной суд иск на 2,5 миллиона шекелей против самого известного спамера Израиля. 30-летний Амир Ганс не намерен сдаваться без боя.

Microsoft Israel и MSN утверждают, что компания Ганса "New Approach" не только рассылала рекламные сообщения своим клиентам, но и вводила клиентов в заблуждение относительно источников рассылки. В некоторых случаях сообщения были замаскированы таким образом, будто они пришли с Hotmail Israel.

Microsoft требует, чтобы суд принудил Ганса передать детали, касающиеся количества сообщений, которые "New Approach" разослала подписчикам Hotmail, и выплатить почтовой службе компенсацию за урон ее репутации и несанкционированное использование ее инфраструктуры по 5 долларов за каждое сообщение. По оценкам Microsoft Israel, Ганс разослал 10 миллионов спамовых сообщений. Однако исковое заявление требует выплаты не 50 миллионов долларов, а 2,5 миллионов шекелей. Мотивируется сумма иска реальной возможностью получения суммы от ответчика.

Считается, что Ганс рассылает больше половины израильского спама. При этом он отнюдь не скрывает свои подвиги и даже хвастает ими. Ганс - человек известный. Он принимает участие в академических конференциях, посвященных проблеме спама или безопасности в Интернете, а один из депутатов Кнессета даже приглашал его присутствовать на совещаниях комиссии Кнессета по вопросам Интернета.

В июле прошлого года израильский интернет-провайдер "Кавей Захав" подал против Ганса иск на 250 тысяч шекелей, а два месяца назад против Ганса и его клиента в тель-авивский окружной суд поступил дополнительный иск. Ганс обвиняется в том, что его компания "New Approach" провела "массовую атаку через e-mail" с использованием серверов "Кавей Захав" и отправила 510 тысяч сообщений за 18 часов. В результате, серверы "Кавей Захав" были занесены в черный антиспамерский список, почтовые адреса легитимных подписчиков "Кавей Захав" оказались заблокированными, скорость серверов упала, а репутации провайдера был нанесен урон.

Иск, поданный Microsoft, - первый иск, который Microsoft подала против спамера в Израиле. По словам адвоката Microsoft Israel, решение подать иск именно против Ганса было преднамеренным, поскольку Ганс известен. "Мы хотим этим заставить задуматься остальных. Пока это лишь первый из шагов, которые мы собираемся предпринять. Мы продолжим преследовать и других рассыльщиков спама. Иск против Ганса - лишь часть глобальной борьбы Microsoft с явлением спама", сказал адвокат.

Судя по информации JEWISH.RU, Ганс не намерен сдаваться без боя и уже начал активную кампанию в прессе.

Источник: JEWISH.RU

Спам будет стоить мировому бизнесу 50 миллиардов долларов

25.02.2005

В 50 миллиардов долларов оценила ущерб от спама для мировой экономики в 2005 году американская компания Ferris Research.

Цифра получена с учетом потерь рабочего времени на фильтрацию спама, последствий потерь легитимной деловой корреспонденции при удалении спама и затрат компаний на средства защиты от спама.

Экономике развитых стран, таких как США, Канада, Япония и Германия, спам наносит серьезный ущерб. В США, например, в расчете на один почтовый ящик спам обходится бизнесу в $170 в год. В Германии эта цифра достигает $217 благодаря меньшему числу рабочих дней в году и высокого уровня затрат на медицинское обслуживание и пенсионное обеспечение работников.

В странах, где уровень спама относительно низок, а зарплаты работников не высоки, ущерб от спама в расчете на одного сотрудника в три раза ниже, чем в США. В качестве примера таких стран в отчете приводятся Индия и Китай.

Ожидается, что в США ущерб от спама в 2005 году достигнет 17 миллиардов долларов, что составляет 0,17% национального дохода страны. Хотя объем спама в США с 2003 года вырос в 5 раз, потери от спама увеличились менее чем в 2 раза (в 2003 году американской экономике спам обошелся в 10 миллиардов долларов). Пропорционального роста ущерба удалось избежать благодаря внедрению многими компаниями антиспамовых средств защиты.

По мнению одного из авторов отчета, Ричи Дженнингса (Richi Jennings), не все методы фильтрации эквивалентны с экономической точки зрения. Дженнингс считает, что для компаний серверные антиспамовые решения обходятся значительно дешевле персональных: если первые, как правило, в год стоят $132 в расчете на пользователя, то персональные средства фильтрации обходятся в $217. Даже для небольших организаций и компаний, где большая часть спама попадает в ящики нескольких сотрудников, вероятно, выгоднее и эффективнее фильтровать спам с помощью антиспамового сервиса третьей стороны.

Но дороже всего обходится отсутствие средств фильтрации, поскольку удаление спама вручную значительно повышает его стоимость, которая может достигать "ужасающих" $718 в год на одного пользователя.

Источник: TechWeb (Yahoo!)

К 2008 году доходы антиспамовой индустрии достигнут 1,7 миллиардов долларов

26.02.2005

Согласно прогнозам IDC, к 2008 году суммарные доходы антиспамовых компаний мира составят 1,7 миллиардов долларов.

По мнению аналитиков IDC, утверждение Билла Гейтса о грядущей скорой победе над спамом явно является преждевременным. В IDC считают, что спам будет представлять серьезную угрозу, по крайней мере, до 2008 года. Поэтому в ближайшие три года спрос на антиспамовые решения будет неуклонно возрастать.

Соответственно, будут расти доходы антиспамовых компаний, предлагающих антиспамовое ПО и услуги онлайн-сервисов фильтрации спама. По расчетам IDC, к 2008 году во всем мире они достигнут 1,7 миллиардов долларов. Для сравнения: в 2003 году эта цифра составляла $300 миллионов.

Согласно прогнозам IDC, в период с 2005 по 2008 год доходы всей IT-индустрии вырастут приблизительно вдвое, тогда как доходы антиспам-сектора будут ежегодно возрастать на 42%.

Прогнозы IDC были обнародованы сразу после публикации результатов исследования Ferris Research, согласно которым в 2005 году ущерб от спама для мировой экономики составит 50 миллиадов доларов.

По словам представителя IDC Брайана Берка (Brian Burke), возможность снижения ущерба от спама в ближайшие годы будет зависеть от способности антиспамовых средств защиты быстро и эффективно реагировать на новации спамеров.

Источник: TechWeb (Yahoo!)

38 стран Европы и Азии объединяются в борьбе со спамом

25.02.2005

25 стран-членов Евросоюза и 13 азиатских государств ASEAN, включая Китай, Южную Корею и Японию, заключили соглашение о совместных действиях в борьбе со спамом.

Соглашение, подписанное представителями правительств 38 стран на конференции в Лондоне, предусматривает обмен информацией между странами, регулярное обсуждение путей решения проблемы, совместные действия для достижения эффективности юридических способов борьбы со спамерами, а также поиск технологических решений и сотрудничество между интернет-сообществом и правительствами стран-участников договора.

Представитель Еврокомиссии Вивьен Рейдинг (Viviane Reding) заявила, что спам не признает границ, и только европейские страны не в силах с ним справиться. Важно, чтобы решением проблемы всерьез занялись во всем мире, и особенно в тех странах, которые являются источниками спама.

Знаменательно, что Китай и Южная Корея также присоединились к соглашению. По информации Sophos, из этих стран рассылается более 20% спама.

Участники совместной европейско-азиатской инициативы призвали правительства и индустрию обеспечить создание в каждой стране эффективной антиспамовой структуры, что предполагает, в том числе, принятие антиспамовых законов в тех странах, где они еще не приняты.

Источник: InfoWorld

90% мошеннических писем рассылается из США

28.02.2005

В результате международной кампании против интернет-мошенников выяснилось, что США являются источником 90% скама.

32 страны принимали участие в совместной операции, целью которой было выяснить, в каких странах хостятся мошеннические сайты, и проследить источники скама - мошеннических спамовых писем.

Согласно полученным результатам, подавляющее число таких писем рассылается из США. В качестве второго "рассадника" интернет-мошенничества представители Британии называют Россию.

Участники кампании намерены встретиться и обсудить дальнейшие совместные действия против мошенников.

Источник: ZDNet UK

Антиспамовые технологии помогут в создании вакцины против СПИДа?

01.03.2005

Достижения антиспамовых технологий могут быть использованы для создания вакцины против СПИДа. По крайней мере, на это надеются американские и австралийские ученые.

Как известно, для обхода спам-фильтров спамеры, в частности, используют так называемые "мутирующие" письма, изменяя основной текст письма или добавляя к нему "мусорные" последовательности - как правило, цитаты из классики или бессмысленные наборы знаков. Со своей стороны, антиспамеры разработали технологии идентификации таких писем, несмотря на внесенные в них изменения.

Разработки Microsoft Research планируют использовать медики для создания вакцины против вируса иммунодефицита человека (ВИЧ).

Дело в том, что ВИЧ постоянно мутирует. Это является источником серьезных проблем при создании вакцины против СПИДа: вакцина, разработанная против одного штамма ВИЧ, бессильна против другого. При этом существуют миллионы вариаций-мутантов смертоносного вируса.

Однако, как и в случае со спамом, где содержание письма, несмотря на "мусор", должно сохраняться, мутации вируса не могут затрагивать основные последовательности нуклеотидов, которые обеспечивают жизнеспособность вируса.

Выявить характерные последовательности ВИЧ медики пытаются, используя компьютерную технологию "machine learning" Microsoft Research. Ученые надеются, что также, как спам-фильтр "учится" распознавать вариации одного и того же письма, выявляя его основную составляющую, удастся "научить" программу идентифицировать фундаментальные последовательности ВИЧ, сохраняющиеся неизменными при мутациях. Таким образом, будет сужен спектр последовательностей-мишеней для создания вакцины.

"Machine learning" - не единственная технология, которую намерены использовать медики. Технология "data mining" (применяется для сжатия видео- и аудио- информации) должна помочь выявить наименьшую последовательность, определяющую природу ВИЧ. В идеале эта последовательность будет использоваться при создании вакцины, эффективной против различных штаммов ВИЧ.

Тестирование экспериментальных вакцин на образцах клеток крови, взятой у ВИЧ-инфицированных людей, уже началось.

Если сотрудничество медиков и программистов будет успешным, новый подход может быть использован при создании вакцины против вируса гепатита С и других мутирующих вирусов.

Источник: MSNBC

Защита от спама абонентов "Би Лайн", пользующихся услугой GPRS-Internet, основана на технологии "Спамтест"

01.03.2005

Компания AMS объявила о предоставлении "ВымпелКому" (торговая марка "Би Лайн GSM") нового комплексного решения для защиты подписчиков услуги GPRS-Internet от спама, вирусов и хакеров. Для реализации проекта были использованы технологии компаний "Ашманов и Партнеры" и "Лаборатория Касперского".

Новый программно-аппаратный комплекс предназначен для обработки исходящих сообщений пользователей услуг передачи данных GPRS, а также для блокировки спама и компьютерных вирусов. По словам менеджера проекта Николая Савченко, AMS готова использовать для поставленных задач решения и возможности лидеров в той или иной области. В разработанном комплексном решении фильтрация спама основана на технологии "Спамтест", а защита от вирусов на Kaspersky Anti-Virus for Unix Mail Server.

В качестве аппаратной платформы был выбран кластер на основе двух серверов hp Proliant 380 под управлением операционной системы Linux. Специалисты компании AMS разработали дополнительное программное обеспечение, позволяющее расширить набор функций почтовой службы, и адаптировали все использованные программные продукты друг к другу. Программно-аппаратный комплекс, предложенный компанией AMS, предназначен для работы в круглосуточном режиме и интегрирован в общую систему мониторинга hp Open View.

Источник: AMS


Спам - статистика за период
21 - 27 февраля 2005 г.

Ашманов и Партнеры

Объем спама и тематические особенности

Объем спама удерживается на уровне 75-80%, на "открытых" (например, бесплатных) почтовых серверах эта цифра достигает 83-85%.

Растет доля предложений тематики "Разные товары и услуги". В основном, этот рост поддерживается предложениями подарков к 8-му марта. Также выросла доля предложений юридических услуг, особенно - в сфере недвижимости. Возможно, это связано с вступлением в силу с 1-го марта нового Жилищного кодекса.

Объемы спама тематики "Для взрослых", наоборот, сокращаются. На это явление обращают внимание многие разработчики антиспамерского ПО, и пока нет уверенности, с чем мы имеем дело: с новой тенденцией или с кратковременным понижением доли спама этой тематики.

Популярные тематики

No Тематика Описание %% от общего объема Изменение за неделю
1 Разные товары и услуги Предложения других товаров и услуг 24% Без изменений
2 Остальной спам   23% +16,5%
3 "Здоровый образ жизни" и "Медикаменты" Предложения сбросить лишний вес, улучшить состояние кожи, волос; приобрести правильную осанку, купить биологические добавки и т.п. Предложения приобрести лекарства в online 11% -3%
4 Мошенничество Фишинг, "нигерийские" письма, поддельные извещения о выигрыше в лотерею и пр. попытки мошенничества 10% -1%
5 Образование Реклама семинаров, тренингов, курсов 9% -3,5%
6 Личные финансы Предложения по страхованию, уменьшению кредитной задолженности, выгодным условиям займов и т.п. В подавляющем большинстве англоязычные письма. 7% +3%
7 Услуги по электронной рекламе Предложения организовать спамерскую рассылку, программы для рассылок, базы электронных адресов и т.п. 6% +3%
8 Для взрослых Средства для повышения потенции (виагра и пр.), а также для улучшения физических возможностей при занятих сексом 5% -10%
9 Компьютеры и Интернет Предложения приобрести ПО, компьютерную технику, расходные материалы; также предложения для владельцев сайтов (хостинг, обмен баннерами и т.п.) 4% -4%
10 Отдых и путешествия Предложения туристических поездок, а также организации и проведения различных развлекательных мероприятий. 3% +1%

Самый массовый спам недели

Чего хотят мужчины? Чего хотят женщины? Что нам нужно для взаимности и счастья друг с другом?
Предложение получить ответы на животрепещущие по весне вопросы "о взаимоотношениях между мужчиной и женщиной, обрести практические навыки, познать свою истинную природу - мужскую или женскую" за несколько дней семинара. Особенно это актуально, по мнению составителей письма, в начале весны, "когда женщине хочется быть необыкновенно женственной, а мужчине особенно мужественным, и две половинки стремятся соединиться вместе в гармонии и счастье".

Это письмо, а также оригинальное предложение "снова подоить интернет-казино" Вы найдете на сайте Спамтест.


Некоторые автоматические методы детектирования спама, доступные большим почтовым системам. Часть 1

Илья Сегалович
Яндекс

Введение

В современных антиспамовых системах, установленных на крупных почтовых серверах и использующих широкий набор признаков спама и разнообразные техники по их выявлению [1, 2], центральным вопросом является вопрос создания автоматических механизмов фильтрации, способных работать с актуальным почтовым потоком.

Антиспамовые техники, опирающиеся только на тестовые выборки, крайне затруднительно использовать как из-за чрезвычайной трудоемкости построения выборок достаточного размера, так и из-за сложности поддержания этих выборок в рабочем состоянии.

Другой подход, подход постоянного ручного анализа и мониторинга всего почтового потока, в котором существуют "ночные лингвисты, которые вынуждены постоянно подстраиваться под спамеров" [3], а сигнатуры спама составляются вручную, представляется нам не менее дорогостоящим.

Вместе с тем, опираясь на массовую статистику большого почтового потока, можно попытаться построить механизмы, выполняющие, по крайней мере, частично, заявленную задачу.

Данная работа в популярной форме описывает несколько таких механизмов, уже использующихся или проходящих тестирование в Яндексе (http://mail.yandex.ru, http://so.yandex.ru), дает представление о текущем состоянии алгоритмов в этой области, выводит некоторые аналитические оценки эффективности их применения. В конце работы приведен сравнительный анализ работы нескольких антиспамовых систем, в том числе систем Яндекса, в которых применяются описываемые в статье методы.

Устойчивые сигнатуры

Одним из краеугольных камней, лежащих в основании механизмов, опирающихся на массовость, является алгоритм вычисления сигнатур, устойчивых к "небольшим" изменениям письма.

Небольшими изменениями назовем такие изменения, которые не нарушают основного содержания письма.

Опишем вкратце несколько современных методов расчета таких сигнатур. Как отмечалось в [1], можно выделить 'синтаксические' (то есть оперирующие с цепочками слов) и 'лексические' (то есть оперирующие со словарем) методы расчета сигнатур.

Современные 'синтаксические' методы, основанные на шинглах [4, 5], используют идею вычисления контрольных сумм для всех подцепочек текста ('шинглов') и последующего построения случайной выборки из полученного набора.

Рисунок 1. "Шинглы" первых строк известного русского стихотворения

Нетрудно показать [5], что по шинглам можно с высокой вероятностью судить о сходстве текстов, их вложенности, плагиате и т.д. Однако для практических задач, в том числе для обнаружения массовых рассылок, требуется слишком большое количество шинглов, что предъявляет непреодолимо высокие требования к ресурсам для проведения процедуры кластеризации. Эти ограничения преодолеваются при помощи техники супершинглирования (DSC-SS), состоящей в расчете небольшого количества (1-6) контрольных сумм ('супершинглов') над подмножествами полного массива шинглов для данного текста. Так в работе [6] были предложены следующие параметры: 84 шингла, 6 супершинглов над 14 шинглами каждый; тексты считаются гипотетически совпавшими при совпадении хотя бы двух супершинглов из 6.

Класс методов, основанных на лексиконе, также развивался в последнее время. В частности, к методу опорных слов [7] (Ильинский, 2002) и его аналогу, методу I-Match [8] (Chowhudri, 2002), смысл которых состоит в тщательном выборе глобального лексикона (на основе статистики слов в коллекции) и в проецировании словаря текста на выбранный лексикон, добавились новые особенности. Во-первых, подвергаются ревизии процедуры выбора лексикона [10] (по некоторым причинам я не могу описать здесь алгоритм выбора лексикона в методе Ильинского), во-вторых, также как и в случае с супершинглированием, полная сигнатура заменяется небольшим количеством (до 10) сигнатур [9], построенных на случайных подмножествах исходного лексикона (т.н. метод Lexicon Randomization). Пример применения лексических сигнатур к задаче обнаружения спама приведен здесь [10].

И в синтаксических, и в лексических методах наблюдается тенденция, направленная на повышение полноты обнаружения слабоизмененных документов, на основе рандомизированных подмножеств из исходных 'более полных' сигнатур.

Оценка полноты детектирования по сигнатурам1

Важной характеристикой метода вычисления сигнатур является его полнота. Будем понимать здесь под полнотой долю потока писем одной и той же рассылки, то есть одинаковых по содержанию, детектированных данным методом как массовые, то есть "склеенных" при помощи сигнатуры в кластеры размером больше некоторого порога.

Дано множество  очень похожих писем (некая конкретная рассылка спама), собранных нашим методом вычисления сигнатур в i кластеров. Пусть  - размер i-го кластера;  - размер данной рассылки спама.

Мы считаем письмо 'детектированным' (опознаем как 'массовое' или 'спам') если размер кластера, в который оно попало, больше или равно порога k. Оценим полноту ('recall') нашего метода, то есть долю 'детектированных' писем в рассылке:

 , где s - общее число 'детектированных' ('спам') писем

Примем вероятность 'склеивания' (попадания в один кластер) любых двух писем из рассылки равной p. Очевидно, соблюдается соотношение:

 , где в числителе число всех 'склеенных' пар, а в знаменателе число всех возможных пар писем из данной рассылки. Проведя элементарные преобразования выражения для p:

Отсюда:

 

Представим сумму квадратов размеров всех кластеров в виде сумм квадратов размеров 'больших' (больше или равно порога) и 'маленьких' кластеров:  и попытаемся оценить ее сверху.

Сумму квадратов размеров 'больших' кластеров заменим квадратом общего числа детектированных писем (квадратом суммы):

 (1)

Для 'маленьких' кластеров имеем . Суммируя по i, получаем:

  (2)

Отсюда:

 

Разделим на N2, введем переменную для относительного порога  и перенесем влево неизвестные:

 

Пренебрегая , так как N>>1, получаем

  (3)

Упростим еще дальше. В ситуации большого потока писем, а также разумно выбранного (то есть малого) порогового размера кластера, N>>k, то есть можно считать c близким к нулю.

Таким образом, полнота детектирования рассылок для данного метода не меньше корня из вероятности 'склеивания' данным методом произвольной пары писем из одной рассылки:

  (4)

Это выражение служит формальным подтверждением вывода, сделанного в [1], о высокой эффективности сигнатурного метода на Яндекс.Почте в 2002-2003 гг.

Из формулы (4) следует, что даже при относительно невысокой вероятности склеивания, например, 0.1, в 'большие' кластеры попадает не меньше 33% писем массовой рассылки.

1 Автор благодарит С. Ильинского за помощь в выводе формулы>>

Применение сигнатур

Если антиспамовая система в состоянии детектировать письмо как массовое, а кроме того, в состоянии опознать в нем конкретную рассылку, то информация про данную рассылку может накапливаться по всем письмам данной рассылки. Следовательно, у системы появляется возможность использовать детектор массовости в построении различных антиспамовых эвристик. Перечислим некоторые примеры таких эвристик:

  1. Идентичные письма, посланные (с точностью до пересылок через trusted zone) с одного и того же (или малого количества) IP, содержащие при этом характерные признаки 'честных' почтовых рассылок (например, SPF запись, явно разрешающая отправку писем с конкретного адреса, специфические заголовки и др.), как правило, являются 'честной' почтовой рассылкой
  2. И, наоборот, идентичные письма, приходящие со слишком большого количества адресов (с точностью до пересылок через trusted zone), особенно при условии дополнительных признаков (содержание письма, жалобы, ловушки, 'плохой' SPF), могут быть с высокой вероятностью отнесены к спаму.
  3. IP-адреса, высокий процент трафика с которых (с точностью до пересылок через trusted zone) задействован в массовой рассылке, идентифицированной как спам (см. п.2), могут заноситься в специальную подозрительную зону. Письма из этой зоны могут трактоваться особо тщательным образом.

Белые списки

Еще одним удобным механизмом, доступным в большой почтовой системе, может служить механизм автоматически вычисляемых "белых" списков. Вычисление белых списков в идейном плане основано на анализе социальной сети. Перечислим здесь несколько простых эвристик автоматического построения и использования белых списков.
  1. Письма от типичных адресатов пользователя (при условии минимальной верификации корректности адреса отправителя: например, SPF или подсеть домена, указанного во from) могут трактоваться как НЕ-СПАМ. Сам список адресатов составляет основу автоматически построенного индивидуального белого списка
  2. В той же или меньшей степени это утверждение относится к адресатам адресатов
  3. Домены (и их IP-адреса) в которые направляется большой поток исходящей корреспонденции крупной почтовой системы, при некоторых дополнительных условиях могут вноситься в 'trusted zone'

Литература

  1. Принципы и технические методы работы с незапрашиваемой корреспонденцией // И. Сегалович, Д. Тейблюм, А. Дилевский // Яндекс // http://company.yandex.ru/articles/spamooborona.html
  2. Технология Спамтест. Описание технологии // Ашманов и Партнеры // http://www.spamtest.ru/products.html?chapter=9149
  3. Яндекс: решение различных проблем безопасности // Дискуссия к статье // http://hostinfo.ru/htmltree/internet/vip/yandex/security
  4. Finding similar files in a large file system // U. Manber // USENIX Conference 1994 // http://citeseer.ist.psu.edu/manber94finding.html
  5. On the resemblance and containment of documents // A. Broder // digital Systems Research Center // http://ftp.digital.com/pub/Digital/SRC/publications/broder/positano-final-wpnums.pdf
  6. A large-scale study of the evolution of web pages // D. Fetterly, M. Manasse, M. Najork, J. Wiener // WWW Conference 2003 // http://www2003.org/cdrom/papers/refereed/p097/P97%20sources/p97-fetterly.html
  7. An efficient method to detect duplicates of Web documents with the use of inverted index // S. Ilyinsky, M. Kuzmin, A. Melkov, I. Segalovich // WWW Conference 2002 // http://www2002.org/CDROM/poster/187/
  8. Collection statistics for fast duplicate document detection // A. Chowdhury, O. Frieder, D. Grossman, M. McCabe // ACM Transactions on Information Systems (TOIS), Vol. 20, Issue 2 (April 2002) // http://portal.acm.org/citation.cfm?id=506311
  9. Improved Robustness of Signature-Based Near-Replica Detection via Lexicon Randomization // A. Kołcz, A. Chowdhury, J. Alspector // KDD 2004 // http://ir.iit.edu/~abdur/publications/470-kolcz.pdf
  10. The Impact of Feature Selection on Signature-Driven Spam Detection // A. Kołcz, A. Chowdhury, J. Alspector // CEAS 2004, The First Conference on Email and Anti-Spam // http://www.ceas.cc/papers-2004/147.pdf
  11. Sieve. A Mail Filtering Language // http://www.cyrusoft.com/sieve

 




Написать письмо

Прислать статью редактору

Мнение редакции не всегда совпадает с мнением авторов материалов.
Редакция оставляет за собой право не публиковать присланную статью без объяснения причин.
Присланные статьи не рецензируются.

(C) ЗАО "Ашманов и Партнеры", 2003-2004


http://subscribe.ru/
http://subscribe.ru/feedback/
Подписан адрес:
Код этой рассылки: inet.safety.spamtest
Отписаться

В избранное