Вордфильтр: различия между версиями

Материал из Noobtype — единственного источника Истины во Вселенной
Перейти к навигации Перейти к поиску
м (→‎Принцип работы: ссылки на википедию ставятся вот так.)
 
(не показаны 2 промежуточные версии 1 участника)
Строка 3: Строка 3:


== Принцип работы ==
== Принцип работы ==
Главная цель вордфильтра — перехват слов, выражений или веб-адресов (спамфильтр) с целью воспрепятствовать их появлению на имиджборде. Существуют как минимум три метода, по которым фильтр может добиваться выполнения этой задачи:
Главная цель вордфильтра — перехват слов, выражений или веб-адресов (спамфильтр) с целью воспрепятствовать их появлению на имиджборде. Чаще всего для перехвата используются [[:wikipedia:ru:Регулярные_выражения|регулярные выражения]], от сложности и проработанности которых зависит его правильное срабатывание. Существуют как минимум три метода, по которым фильтр может добиваться выполнения этой задачи:
* '''Автозамена'''. Самый гуманный способ работы вордфильтра, при котором «неугодное» выражение при публикации сообщения автоматически превращается в нечто иное. Среди отечественных примеров можно назвать [[2-ch.ru]], где неприемлемое с точки зрения администратора прозвище чана «Тиреч» заменялось на «Двач».
* '''Автозамена'''. Самый гуманный способ работы вордфильтра, при котором «неугодное» выражение при публикации сообщения автоматически превращается в нечто иное. Среди отечественных примеров можно назвать [[2-ch.ru]], где неприемлемое с точки зрения администратора прозвище чана «Тиреч» заменялось на «Двач».
* '''Строка отклонена''' ({{lang-en|string refused}}). Сообщение с запрещёнными выражениями нельзя будет опубликовать вплоть до того, как пользователь уберёт или отредактирует отклоняемые слова. На неудачные попытки будет выдаваться сообщение с ошибкой «Строка отклонена». Активно используется на [[IIchan.ru]].
* '''Строка отклонена''' ({{lang-en|string refused}}). Сообщение с запрещёнными выражениями нельзя будет опубликовать вплоть до того, как пользователь уберёт или отредактирует отклоняемые слова. На неудачные попытки будет выдаваться сообщение с ошибкой «Строка отклонена». Активно используется на [[IIchan.ru]].
Строка 11: Строка 11:
В качестве методов обхода фильтров пользователи обычно используют либо разметку вида «откл''о''няемое с'''л'''ово», либо замену букв на похожие символы из других письменностей (омоглифы), либо невидимые символы Юникода. [[Вакаба]] позволяет обходить вордфильтр с помощью HTML-кодов символов.
В качестве методов обхода фильтров пользователи обычно используют либо разметку вида «откл''о''няемое с'''л'''ово», либо замену букв на похожие символы из других письменностей (омоглифы), либо невидимые символы Юникода. [[Вакаба]] позволяет обходить вордфильтр с помощью HTML-кодов символов.


Администраторы могут закрывать эти уязвимости с помощью регулярных выражений и иных средств.
Администраторы могут закрывать эти уязвимости с помощью улучшения работы алгоритмов регулярных выражений и иных средств.
[[Категория:Функции и компоненты движков]]
[[Категория:Функции и компоненты движков]]

Текущая версия от 15:38, 17 июля 2011

Список запрещённых слов на IIchan.ru см. на странице Архив:Вордфильтр

Вордфильтр (англ.: wordfilter, рус.: словофильтр) — одна из функций движков для имиджбордов. Иногда может быть совмещён со спамфильтром (англ.: spamfilter), имеющим сходное назначение.

Принцип работы

Главная цель вордфильтра — перехват слов, выражений или веб-адресов (спамфильтр) с целью воспрепятствовать их появлению на имиджборде. Чаще всего для перехвата используются регулярные выражения, от сложности и проработанности которых зависит его правильное срабатывание. Существуют как минимум три метода, по которым фильтр может добиваться выполнения этой задачи:

  • Автозамена. Самый гуманный способ работы вордфильтра, при котором «неугодное» выражение при публикации сообщения автоматически превращается в нечто иное. Среди отечественных примеров можно назвать 2-ch.ru, где неприемлемое с точки зрения администратора прозвище чана «Тиреч» заменялось на «Двач».
  • Строка отклонена (англ.: string refused). Сообщение с запрещёнными выражениями нельзя будет опубликовать вплоть до того, как пользователь уберёт или отредактирует отклоняемые слова. На неудачные попытки будет выдаваться сообщение с ошибкой «Строка отклонена». Активно используется на IIchan.ru.
  • Автоматический бан. Сообщения с запрещёнными словами не проходят, а их авторы получают бан, срок которого зависит от настроек. Применялся на Нульчане.

Методы преодоления

В качестве методов обхода фильтров пользователи обычно используют либо разметку вида «отклоняемое слово», либо замену букв на похожие символы из других письменностей (омоглифы), либо невидимые символы Юникода. Вакаба позволяет обходить вордфильтр с помощью HTML-кодов символов.

Администраторы могут закрывать эти уязвимости с помощью улучшения работы алгоритмов регулярных выражений и иных средств.