Анти-спам (теоретическая часть)
|
|
+8↑ Голосов: 8 |
Как бороться со спамом – это одна из вечных проблем любой соц. сети. В данной записи постараюсь поделиться своими взглядами и опытом по данной проблеме. Статья носит упрощенный (обзорный) характер, на деле все естественно сложнее.
Рассылка спама бывает 2-ух типов: автоматическая, ручная.
Про ручную отправку. Люди в беднейших странах «руками» отправляют сообщения (комментарии, письма и т.д.) и получают по местным меркам хорошие деньги. Если кому-то интересно могу рассказать подробнее. Аналогично, кстати, работает и anticaptcha.
Итак, Борьба со спамом подразделяется на 2 части:
1) Выявление спаммера
2) Противодействие спаммеру
1-ая проблема в разы сложнее, поэтому начнем со второй.
Противодействие спаммеру
Итак, допустим у нас есть подозрение (некая степень уверенность), что пользователь рассылает спам в личных сообщения (ЛС), комментах и т.д.. Есть 2 вопроса:
1. Что делать с уже отправлены ЛС?
А) Ничего не делать! :)
Б) Ограничить доставку (отправлять в буфер, до разбирательства модератором). Если все ОК доставить с запозданием, если Нет, то удалить.
В) Сразу удалить.
Как правило, большинство выбирают путь А), т.к. Б) технически более сложен, а В) слишком радикален.
2. Какие меры можно предпринять по отношение к спаммеру?
А) Ничего не делать! :)
Б1) Полное ограничение для пользователя на отправку ЛС, комменто вдо разбирательства модератором.
«-» пользователь может зарегать новый аккаунт и снова начать спамить.
Б2) Полное ограничение для IP адреса на отправку ЛС, комментов до разбирательства модератором.
«-» в случае если пользователь сидит через локальную сеть, то соотв. функция отправки ЛС будет недоступна и множеству «невинных пользователей». Также бесполезно, если у пользователя динамический IP.
Б3) Комбинация методов Б1) и Б2).
В) Ввести captcha на отправку всего до разбирательства модератором.
«+» гнев пользователя минимален, в случае ошибки. Эффективность «хорошая».
«-» против anticaptcha и ручной рассылки бесполезна.
Выбор метода напрямую зависит от объема соц. сети, работы модераторов, и степени лояльности участников к СПАМу.
На мой взгляд, оптимальным является комбинация методов В) и Б1).
Также есть один из самых простых способов: Ограничить кол-во сообщений на единицу времени всем пользователям. Для ЛС способ действенный, для кооментов нет!
Как выявить спаммера?
Способы выявления делятся на «дорогие» и «дешевые».
К «дорогим» относятся
А) написания спец. алгоритмов, как правило, самообучающихся, которые фильтруют все ЛС, комменты и т.п. на предмет похожести, ссылок (псевдо ссылок), частоты отправки и т.д. и т.п.
Б) Частично рунная модерация комментов.
«-» ДОРОГО
К «дешевым» методам:
А) Жалобы юзеров. Каждый пользователь может пожаловаться на другого, с помощью спец. кнопки. Когда жалоб накапливается определенно кол-во, мы считаем юзера спамером.
«-» Если спаммер рассылает по офлайну, то когда Вы его зафиксируете, вся сеть уже будет заспамлена. Тогда очень актуален пункт Б) из вопроса «Что делать с уже отправлены ЛС?»
Также есть вероятность ошибка. Скажем «спаммер» написал кому-то, что тот какашка, а тот в ответ нажал, что он спаммер.
Б) Фильтр частоты отправки. При слишком частой активности юзера, считаем, что он спаммер.
«-» Непонятно, как определять «частоту».
В) Априори считаем всех спаммера, пока не доказано обратное (политика мира маил.ру, например)
«-» Активность пользователей резко снижается, т.к. зае****ат вводить captcha.
Ясно, что для малых соц. сетей придется выбирать из «дешевых». Все эти методы просты в программировании, поэтому хочется выжить из них максимум. И оптимальным будет некая их комбинация.
В следующей части я предложу практическое описание одного из методов на «высоком» уровне (без привязки к интстнту).
А дальше постараюсь это запрограммировать уже с привязкой к интстнту, надеюсь это кого-то заинтересует, и кто-то захочет мне помочь! :)
Рассылка спама бывает 2-ух типов: автоматическая, ручная.
Про ручную отправку. Люди в беднейших странах «руками» отправляют сообщения (комментарии, письма и т.д.) и получают по местным меркам хорошие деньги. Если кому-то интересно могу рассказать подробнее. Аналогично, кстати, работает и anticaptcha.
Итак, Борьба со спамом подразделяется на 2 части:
1) Выявление спаммера
2) Противодействие спаммеру
1-ая проблема в разы сложнее, поэтому начнем со второй.
Противодействие спаммеру
Итак, допустим у нас есть подозрение (некая степень уверенность), что пользователь рассылает спам в личных сообщения (ЛС), комментах и т.д.. Есть 2 вопроса:
1. Что делать с уже отправлены ЛС?
А) Ничего не делать! :)
Б) Ограничить доставку (отправлять в буфер, до разбирательства модератором). Если все ОК доставить с запозданием, если Нет, то удалить.
В) Сразу удалить.
Как правило, большинство выбирают путь А), т.к. Б) технически более сложен, а В) слишком радикален.
2. Какие меры можно предпринять по отношение к спаммеру?
А) Ничего не делать! :)
Б1) Полное ограничение для пользователя на отправку ЛС, комменто вдо разбирательства модератором.
«-» пользователь может зарегать новый аккаунт и снова начать спамить.
Б2) Полное ограничение для IP адреса на отправку ЛС, комментов до разбирательства модератором.
«-» в случае если пользователь сидит через локальную сеть, то соотв. функция отправки ЛС будет недоступна и множеству «невинных пользователей». Также бесполезно, если у пользователя динамический IP.
Б3) Комбинация методов Б1) и Б2).
В) Ввести captcha на отправку всего до разбирательства модератором.
«+» гнев пользователя минимален, в случае ошибки. Эффективность «хорошая».
«-» против anticaptcha и ручной рассылки бесполезна.
Выбор метода напрямую зависит от объема соц. сети, работы модераторов, и степени лояльности участников к СПАМу.
На мой взгляд, оптимальным является комбинация методов В) и Б1).
Также есть один из самых простых способов: Ограничить кол-во сообщений на единицу времени всем пользователям. Для ЛС способ действенный, для кооментов нет!
Как выявить спаммера?
Способы выявления делятся на «дорогие» и «дешевые».
К «дорогим» относятся
А) написания спец. алгоритмов, как правило, самообучающихся, которые фильтруют все ЛС, комменты и т.п. на предмет похожести, ссылок (псевдо ссылок), частоты отправки и т.д. и т.п.
Б) Частично рунная модерация комментов.
«-» ДОРОГО
К «дешевым» методам:
А) Жалобы юзеров. Каждый пользователь может пожаловаться на другого, с помощью спец. кнопки. Когда жалоб накапливается определенно кол-во, мы считаем юзера спамером.
«-» Если спаммер рассылает по офлайну, то когда Вы его зафиксируете, вся сеть уже будет заспамлена. Тогда очень актуален пункт Б) из вопроса «Что делать с уже отправлены ЛС?»
Также есть вероятность ошибка. Скажем «спаммер» написал кому-то, что тот какашка, а тот в ответ нажал, что он спаммер.
Б) Фильтр частоты отправки. При слишком частой активности юзера, считаем, что он спаммер.
«-» Непонятно, как определять «частоту».
В) Априори считаем всех спаммера, пока не доказано обратное (политика мира маил.ру, например)
«-» Активность пользователей резко снижается, т.к. зае****ат вводить captcha.
Ясно, что для малых соц. сетей придется выбирать из «дешевых». Все эти методы просты в программировании, поэтому хочется выжить из них максимум. И оптимальным будет некая их комбинация.
В следующей части я предложу практическое описание одного из методов на «высоком» уровне (без привязки к интстнту).
А дальше постараюсь это запрограммировать уже с привязкой к интстнту, надеюсь это кого-то заинтересует, и кто-то захочет мне помочь! :)