Bogofilter Logo  v1.2.4 SourceForge Logo

Bogofilter Въпроси

Bogofilter Въпроси

Официален версии: в английски или Franais или италиански злато български
Отговорник: Дейвид Relson <relson@osagesoftware.com>
Преводач: Фабрис Prigent <Fabrice.Prigent@univ-tlse1.fr>

Този документ е предназначен да ни отговори на въпросите за frquemment bogofilter пози.


Какво е bogofilter?

Bogofilter Bayesian филтър е бързо надолу за работата на
Пол Греъм
в статията си план срещу спам. Bogofilter използва алгоритъм на средната gomtrique
Gary Robinson с промени mthode Фишър (chi2)
за класифициране на спам и бутове (NDT: липсата на спам поща).

Уеб страницата на bogofilter в SourceForge е фокусна точка за всички ресурси на bogofilter.

Bogofilter т кр от Eric S. Raymond на 19 AOT 2002 година. Тя придоби популярност, тъй като септември 2002 г., както и много програмисти са започнали да участват.

Файлът НОВИНИ Описва историята на версии на bogofilter.


Bogo-какво?

Bogofilter е един вид bogomtre
(bogometer)
или филтър бъг
(bogon-филтър) е, че тя се опитва да се идентифицират фалшиви имейли
(фалшиви)

чрез измерване на техните Bogos
(Bogosity).


Как bogofilter?

Обърнете внимание на първата част
ТЕОРИЯ НА РАБОТА на ръководството за въвеждане. Основният източник за разбиране е статията на Gary Robinson в Linux Journal
“статистически подход към Спам проблем”

(A статистически подход към проблема на спам).

APRS четете това, вероятно имате някакви въпроси. ПЪРВИТЕ може да бъде “bogofilter той наистина е Bayesian филтър за спам?” Bogofilter е ниско на Thorma Бейс и го използва в част първа на изчисление, както и други статистики mthodes след това. Следователно можем да кажем, че това е спам филтър на Бейс статистика с един аромат.

Други въпроси, които могат да се отнасят към hypothses нападение вас или prrequis на Тората Бейс. В rponses са прости: “Не, те не са изпълнени” и “На кого му пука, докато тя работи.” По-rponse labore споменава, че основната предпоставка, която казва “имейл случаен образ е сбор от думи, напълно indpendants всеки друг” е изнасилване. Има няколко места, където тази практика се свободи с Тора. Някои от тях са през цялото време Изпратено други dpendent на Manir използвате bogofilter:

  • Думи в едно електронна поща по никакъв начин не indpendants. Във всички езици е предимство, дори обратното.
  • Думите не са utiliss произволно изображение, дори и ако някои спамърите използват произволни думи изображението.
  • Пълният текст на обучение, или чрез случайна извадка изображение, следвайки принципите на Бейс. Изберете съобщения за практика нарушава предположение, че съобщенията utiliss за обучение са представителна извадка на случаен Reus изображение съобщения. Този принцип е нарушено от автоматично обновяване bogofilter (Аргументът с thresh_update), обучение по грешка, или някакъв подобен подход.
  • Същото важи, ако използвате едно и също послание повече от веднъж.
  • От друга проблеми могат да бъдат повдигнати от факта на промяната в базата данни чрез премахване на символи (с помощта на bogoutil с-а или-C).
  • Със сигурност има други.

Когато мъжът страница обяснява, bogofilter се опитва да се справи с влиянието на тези ngative hypothses не се спазват. Някои казват, че “картата Ralite gnral работят в наша полза” (член на Гари). Други казват, че дори в този случай, ние не трябва да стане твърде картера hypothses база. В действителност, о не знае наистина. Просто имайте предвид, че ако “зареди муле”, проблемът ще възникнат. Подходът на CL bogofilter е: това, което най-важното е, че той работи в света REL.

Сега, когато имате тон prvenus, да се забавляват и използването bogofilter на най-добрите от вас.


Пощенски списъци

Понастоящем съществуват четири пощенски списъци за bogofilter (на английски):

Адрес списъци Връзки Описание
bogofilter-announce@bogofilter.org [Абонамент]
[архиви: пощальон, Gmane]
O списък на реклами са новите версии.
bogofilter@bogofilter.org [Абонамент]
[архиви: пощальон, Gmane]
А gnraliste пощенския списък на bogofilter.
bogofilter-dev@bogofilter.org [Абонамент]
[архиви: пощальон, Gmane]
Борса за списък на петна, на dveloppement и технически дискусии.
bogofilter-cvs@lists.sourceforge.net [Абонамент]
[Архив]
В списъка, за да обяви промени в кода на CVS архив.

Начинаещи обучение как bogofilter?

За да се класифицират съобщения като шунка или спам, bogofilter трябва да научи вашата поща. За начало, най-добре е да има тяло (възможно най-широка) на вашия съобщения SR на държавата, шунка или спам. (Грешки тук ще доведе до проблем по-късно, така че бъдете внимателни;-)). Бъдете внимателни, използвайте само вашата електронна поща. Използването на друг орган (като орган по интернет), може да доведе до bogofilter да изготви погрешни заключения В крайна сметка, целта ви е да го накара да разбере вашето мнение.

След като сте си корпус на спам и шунка, имате четири възможности за избор. Във всички случаи това работи най-добре, ако си за обучение, (корпуса по-горе) е consquente. Плюс един корпус е малък, толкова по-голям броят на грешките, ще bogofilter в производството. Да предположим, че тялото ви е в два файла mbox: ham.mbox и spam.mbox.

  • Mthode 1) Full Обучение: Entran bogofilter с всичките си съобщения. В нашия пример:

        bogofilter -s < spam.mbox
    	bogofilter -n < ham.mbox

Забележка: директорията допринесоха bogofilter съдържа две скриптове, които и двете използват техника за обучение по грешка. Тази техника добавя стойност и всяко съобщение до базата данни, че посланията, които са били на стойност лош тон (съобщения маркирани като несигурни, шунка е струвало като спам или обратното). Целта е да се CRER база данни от думи наистина
ncessaires правилно да класифицира съобщения. Rsultante до базата данни е по-малка от пълната обучение.

  • Mthode 2) Използвайте скрипта bogominitrain.pl (в допринесоха директория). Той мнения същия обхват като стойност вашата пощенска кутия файлове. Вие трябва да използвате опцията-F ще инструктира работа rpter скрипт, докато, че всички съобщения са правилно classs. (Ако ncessaire, дори можете да регулирате нивото на сигурност). Тъй като скрипт гарантира, че сраснали база даде “всичко” обучението си колекция (с точност по ваш избор), тя работи добре TRS. Можете да използвате-oЗа да създадете линия на сигурността около “SPAM_CUTOFF” spam_cutoff = 0,6 може да искате да се оцени всеки шунка в колекцията си под 0,3 и всички спам дел 0.9. В нашия пример е:

        bogominitrain.pl -fnv ~/.bogofilter ham.mbox spam.mbox '-o 0.9,0.3'
  • Mthode 3) Използвайте скрипта randomtrain (в допринесоха директория). Сценарият gnre списък на всички съобщения в пощенската кутия, разбъркват в списъка и стойността на всяко съобщение, с обучение, както ncessaire. В нашия пример:

        randomtrain -s spam.mbox -n ham.mbox

    Що се отнася до mthode 4, тя работи по-добре, ако се започне с обучение корпус от няколко хиляди съобщения. Това ще ви даде една база данни на по-complte и значително по-големи.

  • Mthode 4) Ако имате достатъчно спам и шунка в тялото си, “Резервиран” 10000 спамове и 10 000 бутове във файлове рангоута mbox, след това използвайте корпус за Entran. След това използвайте bogofilter за класифициране на останалите спама и шунки. Вземете всяко съобщение или като неправилно спечели несигурно положение, и ги използват за нови знания. Това дава на най-добрите mthode mthode евентуална дискриминация. Ето две малки скриптове, които могат да бъдат използвани за класифициране на съобщения utiliss “лоши lves”.

        #! /bin/sh
    	  #  class3 -- classe un message en mauvais, bon ou incertain
    	  cat >msg.$$
    	  bogofilter $* <msg.$$
    	  res=$?
    	  if [$res = 0]; then
    	      cat msg.$$ >>corpus.bad
    	  elif [$res = 1]; then
    	      cat msg.$$ >>corpus.good
    	  elif [$res = 2]; then
    	      cat msg.$$ >>corpus.unsure
    	  fi
    	  rm msg.$$
        #! /bin/sh
    	  # classify -- Place tous les messages dans un fichier mbox  l'aide de class3
    	  src=$1;
    	  shift
    	  formail -s class3 $* <$src

    В нашия пример (APRS първоначалното обучение):

        classify spam.mbox [bogofilter options]
    	  bogofilter -s < corpus.good
    	  rm -f corpus.*
    	  classify ham.mbox [bogofilter options]
    	  bogofilter -n < corpus.bad
    	  rm -f corpus.*

Сравнение на тези mthodes

Важно е да се разбере consquences на методите, които са dcrire. За пълно обучение, както и в 1 и 4, произведени mthodes база данни за повече, отколкото би една тренировка с mthodes 2 или 3. Ако вашата база данни трябва да се дават малки (например, защото на квоти), използвайте mthodes 2 или 3.

Обучението с mthode 1 е най-бързо. Обучение по грешка (както в mthodes Описва 2,3 и 4) е ефективна, но обучението е plutt бавно.


Как да започнем обучение с mbox и maildir?

Първоначално обучение с формат mbox:

    bogofilter -M -s -I ~/mail/Spam
	bogofilter -M -n -I ~/mail/NonSpam

Първоначално обучение с maildir формат:

    bogofilter -s -B ~/Maildir/.Spam
	bogofilter -n -B ~/Maildir/.NonSpam

Обучение по грешка с формат mbox:

    bogofilter -M -Ns -I ~/mail/Missed_Spam
	bogofilter -M -Sn -I ~/mail/False_Spam

Обучение по грешка с формат maildir:

    bogofilter -s -B ~/Maildir/.Missed_Spam
	bogofilter -n -B ~/Maildir/.False_Spam

Как мога да се поддържа добра острота?

Bogofilter ще правят грешки от време на време. Ето защо обучението е важно rgulier. Има два основни mthodes да го направят. Premire, можете да Entran с всяко ново съобщение (с помощта на U-опция). Deuximement, можете да направите на грешки Entran.

В допълнение, Вие може да изгради база данни пъти, като при голяма нова функционалност се добавя bogofilter. След това може да бъде полезна за деня корпус rgulirement обучение.

Bogofilter винаги си върши най-добре с наличната информация. Въпреки това, той ще прави грешки, като класифициране на шунка като спам (фалшиво положителни) или спам като шунка (фалшиво ngatifs). Rduire за вероятността от rapparition на грешка, тя ще ncessaire да се обучават bogofilter с погрешно послание. Ако съобщението е неправилно класифицирани като спам, използвайте-nще се интегрират като шунка. Използвайте-s ще интегрира като спам.

Bogofilter има опция -u, което автоматично поставя списък от думи, дни след всяка оценка на съобщенията. Като bogofilter понякога прави грешки, това е mthode inconvnient на DGRAD обучение с грешни входа. Ще трябва да разгледаме и правилно frquemment. Корекцията може да се използва-Sn за промяна на класификацията на спам съобщение като шунка и -Ns за промяна на шунка като спам.

Коригира misclassified съобщение може да повлияе на класирането на другите съобщения. Освен това базата данни ще предоставя на малките, толкова по-голяма вероятността за грешка обучение неправилна класификация.

Използването на mthode 2 или 3 (по-горе) може да компенсира този ефект. Repti обучение с пълен корпус (включително съобщения добавени след предишния живот). Това ще добави съобщения до базата данни с цел постигане на ново равновесие, вероятно преодоляване на ефекта на “свръхкомпенсация”.

А алтернатива stratgie, въз основа на mthode 4 от предишния раздел е: Периодично се блокове на съобщения и използването на скриптове на mthode 4, да ги класифицира. Ръчно сканиране спам, шунка и несигурно, коригиране на грешки, и несигурната бутове Sparer и спам. Докато не са спам 10000 и 10000 шунка в обучението,, Entran с бутове, спам, и грешки и накрая несигурност. По-късно само с несигурни и, игнорирайки посланията, които bogofilter правилно клас.

Имайте предвид, че rgulirement изпълнете:

    bogoutil -d wordlist.db | bogoutil -l wordlist.db.new
	mv wordlist.db wordlist.db.prv
	mv wordlist.db.new wordlist.db

или за файлове и spamlist.db goodlist.db (ако използвате bogofilter с рангоута дума списъци). Това ще компресирате Данни за заемане само минимален ncessaire дисково пространство.


Какво bogofilter файлов формат го разбира?

Bogofilter включва традиционни mbox, Maildir и МЗ. Bogofilter не поддържа поддиректории, трябва изрично да им списък, ако имате директории Maildir++ или МЗ – само да спомена, пълния път към поддиректориите.

За неподдържани формати, трябва да конвертирате файла в един формат bogofilter разбира. Mbox често е удобен, защото тя може да бъде директно enovy bogofilter.

Например, за да го превърне в mbox формат mbx UW-IMAP/PINE:

    mailtool copy /full/path/to/mail.mbox '#driver.unix//full/path/to/mbox'

или:

    for MSG in /full/path/to/maildir/* ; do
	    formail -I Status: < "$MSG" >> /full/path/to/mbox
	done

Какво е значението на производството на многословно bogofilter?

Можем да кажем, bogofilter за показване на информация за оценката на едно съобщение от техническата работна група, като се обадите на потребителски настройки с “-V”, “ВВ-”, “ВВВ-” или “-R”.

  • Използване на “-V”, gnre bogofilter заглавния ред “X-Bogosity”, например
      X-Bogosity: Ham, tests=bogofilter, spamicity=0.500000
  • С помощта на “ВВ-” bogofilter gnre хистограма, например
        X-Bogosity: Ham, tests=bogofilter, spamicity=0.500000
          int  cnt    prob   spamicity  histogram
         0.00   29  0.000209  0.000052  #############################
         0.10    2  0.179065  0.003425  ##
         0.20    2  0.276880  0.008870  ##
         0.30   18  0.363295  0.069245  ##################
         0.40    0  0.000000  0.069245
         0.50    0  0.000000  0.069245
         0.60   37  0.667823  0.257307  #####################################
         0.70    5  0.767436  0.278892  #####
         0.80   13  0.836789  0.334980  #############
         0.90   32  0.984903  0.499835  ################################

    Изпратено всеки ред интервал, броят на символите (lment NDT минимално лечение, gnralement дума) с оценка в този диапазон, средната вероятност за спам за тези символи, оценката на “spamicit” на съобщението (за символи на този интервал или предишните) и бар за броя на символите.

    В хистограма по-горе, има много символи ниска оценка и висок рейтинг. Те s’quilibrent да се даде “spamicit” на 0.500000

  • С помощта на “ВВВ-” произвежда списък на всички

    на символите в съобщението, с информация за всеки един. Например:

      X-Bogosity: Ham, tests=bogofilter, spamicity=0.500000
                            n    pgood     pbad      fw     U
      "which"              10  0.208333  0.000000  0.000041+
      "own"                 7  0.145833  0.000000  0.000059+
      "having"              6  0.125000  0.000000  0.000069+
     ...
      "unsubscribe.asp"     2  0.000000  0.095238  0.999708+
      "million"             4  0.000000  0.190476  0.999854+
      "copy"                5  0.000000  0.238095  0.999883+
      N_P_Q_S_s_x_md      138  0.00e+00  0.00e+00  5.00e-01
                               1.00e-03  4.15e-01  0.100

    Колоните даде следните плакати:

    “…”
    на токен в
    N
    Броят на пъти по-символичен тон се сблъска по време на обучение
    pgood
    Дял на добри съобщения (шунка), съдържащ знак
    pbad
    Дял на лошите съобщения (спам), съдържащи този знак
    FW
    Индексът на хвърляне на хайвера Робинсън, който съчетава pgood pbad и да се даде стойност да бъде близо до нула, ако едно съобщение, съдържащо знак е вероятно да бъде шунка, и в близост до един, ако има вероятност за спам.
    U
    + “Ако този знак допринася за крайния резултат,” - “друго. Символ е изключено, когато резултатът е по-малко от “min_dev” 0.5. min_dev е параметър.

    Последният ред показва:

    • Общите суми на колони rsultats
    • Стойностите на paramtres Робинсън е и
      X и на min_dev
  • Използвайте “-R” произвежда на изхода на “ВВВ-”, описва по-горе още две supplmentaires колони:
    invfwlog
    логаритъм на FW
    fwlog
    логаритъм на (1-FW)

    Продукцията на “-R” е да се използва Добавен с езика R за статистически изчисления. Повече информация е на разположение на проекта R за статистически компютърни http://www.r-project.org/.


Какво е режим Несигурни?

По подразбиране на bogofilter класифицира съобщение като спам или не спам. Аргументът SPAM_CUTOFF се използва за това. Съобщения с по-висок резултат или момиче в SPAM_CUTOFF classs са спам. Останалите шунка.

Налице е също така един параметър HAM_CUTOFF. Когато се използва, съобщенията трябва да имат оценка по-долу или classs Гал HAM_CUTOFF да бъде шунка. Съобщения с резултат между HAM_CUTOFF и билети за SPAM_CUTOFF са “сигурни”. Ако се вгледате в bogofilter.cf, ще видите следните редове:

    #### CUTOFF Values
    #
    #    both ham_cutoff and spam_cutoff are allowed.
    #    setting ham_cutoff to a non-zero value will
    #    enable tri-state results (Spam/Ham/Unsure).
    #
    #ham_cutoff  = 0.45
    #spam_cutoff = 0.99
    #
    #    for two-state classification:
    #
    ## ham_cutoff = 0.00
    ## spam_cutoff= 0.99

За да може класификация Да / Не / сигурни, премахнете да кажа на последните два реда.

Освен това, ако използвате етикети prfrez Да / Не / Не сте сигурни, вместо за Спам / Хем / сигурни, премахване на предната линия кажа:

    ## spamicity_tags = Yes, No, Unsure

След това се прави, можете да включите следните правила за филтъра, за да си поща:

    if header contains "X-Bogosity: Spam", put in Spam folder
    if header contains "X-Bogosity: Unsure", put in Unsure folder

В допълнение, bogofilter.cf possde насоки за промяна на темата: напр.

    #### SPAM_SUBJECT_TAG
    #
    #	tag added to "Subject: " line for identifying spam or unsure
    #    default is to add nothing.
    #
    ##spam_subject_tag=***SPAM***
    ##unsure_subject_tag=??UNSURE??

С такива маркери, правилата за филтър ще изглежда така:

    if subject contains "***SPAM***", put in Spam folder
    if subject contains "??UNSURE??", put in Unsure folder

Какво е “обучение по грешка” и “обучение на изтощение”?

“Обучение на грешка” включва анализ на корпус на съобщения, чийто статут е известен спам или шунка. Само тези, които са зле classs, или чиято класификация е несигурна, ще Intgr в до базата данни на обучение. Тя не показва, че изберете само съобщения “лошо lves” тихи ефективно средство за обучение. Ако тренирате bogofilter всички съобщения, че ще науча със спама и бутове празна.

Това може да бъде mthode amliore с помощта на “маржа на сигурност.” Чрез увеличаване на стойността “изключване спам” и от намаляване на стойността “шунка изключване” съобщенията, които са близо до прага ще utiliss за обучение. Използването на този марж сигурност показа ефективността си в rsultats amliorer обучението по грешка. В gnral, по-широки граници са supplmentaire помощ (въпреки факта, че границите са твърде големи, не са оптимално). За една държава три режим, можете да използвате средата на сигурни държава с интервал от+ / – 0.3 за обучение

Rpter обучение на грешка на един и същи орган на съобщението може да amliorer точност. В IDE е, че съобщенията, които имат classs тона и може да ПЪРВИ ПЪТ, след обучение, било погрешно classs. Трябва да бъде компенсирано от rptition.

“Обучение на изтощение” е rptition на обучението по грешка, със същия корпус съобщение, че няма грешки, докато остане. Това може да се mthode amliore благодарение на маржовете на сигурността. Вижте защо

статия Гари Робинсън
за повече информация.

Забележка: bogominitrain.pl possde опция -fcouraging, която позволява на “обучение до изтощение”. Ако решите да го използвате, да са наясно с възможните странични ефекти. Използването на-fn бързо rpter обучение за всяко съобщение.


Какво означава “-U” (AutoUpdate)?

В “-U” (AutoUpdate) се използва за автоматично complter списък дума. Когато тази опция се използва и bogofilter класифицира съобщение като спам или Хам, съобщение символи се добавят към списъка на думи с маркер за спам или шунка (според случая).

Вземете случая с пристигането на ново съобщение “рефинансира сега – най-добрите лихви по ипотечните кредити”. Той съдържа думи, които bogofilter ADJ видели и вероятно ново. Използването на “-U” тези нови думи са добавени към списъка с думи, така че по-добре да bogofilter reconnatre следните съобщения като него.

Ако използвате “-U”, трябва да се вгледате внимателно неправилна класификация и rentrainer bogofilter с това съобщение, е погрешно идентифициран. А посланието, че е неправилно класифицирани и самоук _peut_ усилват бъдеще недоброто класифициране на bogofilter. Това е същия проблем като теб, системен администратор, запишете лошо послание шунка като спам или обратно.


Как мога да използвам SpamAssassin да се обучават bogofilter?

Ако имате актив SpamAssassin (или ако искате CRER), можете да използвате на неговото връщане, кодове за влак bogofilter. Най-лесният начин е да CRER скрипт за MDA, която работи SpamAssassin, тестове за състоянието на спам кода на връщане / шунка, и тичам bogofilter за валидиране на съобщението. Сценарият procmail по-долу е един от начините да го направите:

    BOGOFILTER     = "/usr/bin/bogofilter"
    BOGOFILTER_DIR = "training"
    SPAMASSASSIN  = "/usr/bin/spamassassin"

   :0 HBc
    *? $SPAMASSASSIN -e
    #spam yields non-zero
    #non-spam yields zero
    | $BOGOFILTER -n -d $BOGOFILTER_DIR
    #else (E)
   :0Ec
    | $BOGOFILTER -s -d $BOGOFILTER_DIR

   :0fw
    | $BOGOFILTER -p -e

   :0:
    * ^X-Bogosity:.Spam
    spam

   :0:
    * ^X-Bogosity:.Ham
    non-spam

Какво ще кажете за азиатски спам?

Много хора reoivent на нежелана поща, като използват азиатски символи. Тъй като те не практикуват езика и познават лицето надолу, те предполагат, че е спам.

Добрата новина е, че bogofilter DTECT на Manir plutt ефективни. Лошата новина е, че тя може да бъде coteux. Можете основно са три възможности:

  • Можете просто да bogofilter решетка на проблема. Entran с азиатски съобщения, определени като спам. Bogofilter анализ на съобщения като най-той може и ще добави жетони списък на спам думи. Списъкът на думи ще съдържа много символи, които не правят смисъл за вас (в зависимост от масата на символи, които не могат да бъдат показвани), но bogofilter може да работи с тях и правилно да идентифицира спам Азия.

  • Mthode втори вариант е да използвате конфигурационния файл “replace_nonascii_characters”. Това ще замени ASCII символи “нагоре” (тези, които между 0×80 и 0xFF) с въпросителен знак “?”. Това поддържа малка база. За съжаление това не противоречи на европейските езици с много гласни и съгласни увеличение ASCII “висока”.
  • Ако никога не си SR получите lgitime съобщение на тези езици, можете директно да dtruire. Това ще намали базата на едни и същи. Можете да направите това с един скрипт MDA.
  • Това е скрипт, който ще изтрие съобщенията Crits с маси на азиатските символи
  • ## Efface silencieusement tous les mails en langue asiatique
        UNREADABLE='[^?"]*big5|iso-2022-jp|ISO-2022-KR|euc-kr|gb2312|ks_c_5601-1987'
       :0:
        * 1^0 $ ^Subject:.*=\?($UNREADABLE)
        * 1^0 $ ^Content-Type:.*charset="?($UNREADABLE)
        spam-unreadable
    
       :0:
        * ^Content-Type:.*multipart
        * B? $ ^Content-Type:.*^?.*charset="?($UNREADABLE)
        spam-unreadable

    С такава програма, bogofilter ще видите никога
    съобщението.


Как да компактен базата данни?

Периодично Можете да компактен базата данни, за да заемат най-малко дисково пространство. Ако приемем, че си е списък от думи в директорията ~ / Bogofilter, за bogofilter 0.93.0 (или последния брой) тип.:

    bf_compact ~/.bogofilter wordlist.db

За antrieur bogofilter 0.93.0, използвайте:

    cd ~/.bogofilter
    bogoutil -d wordlist.db | bogoutil -l wordlist.db.new
    mv wordlist.db wordlist.db.prv
    mv wordlist.db.new wordlist.db

Този скрипт е необходимо за дублиране на вашата среда база данни (за подкрепа на BerkeleyDB обработка на транзакции). Оригиналните ви директория ще бъде преименуван на ~ /. Bogofilter.old и ~ /. Bogofilter ще съдържа новата среда.

За по-старите версии на bogofilter не, използващи принципа на сделките на база данни е обикновен файл (wordlist.db) и не ncessite за използване на скрипт. Горните crent команди даде нова основа за по-компактен и преименуване на оригиналния файл wordlist.db.prv

Забележка: Това е напълно валиден за използване на скрипт с по-стари версии на bogofilter.


Как да си направим една молба, основана на ръководството?

За да намерите броя на спам и шунка за знак (дума), използвайте bogoutil на “-w”. Например, “-w ​​$ bogoutil BOGOFILTER_DIR / wordlist.db example.com” дава броя на шунка и спам за “example.com”.

Ако искате да изкарате повече spamicit броят на спам и шунка за знак, използвайте bogoutil на “-р”. Например, “-P $ bogoutil BOGOFILTER_DIR / wordlist.db example.com” осигурява повече номера шунка и спам, оценка на думата.

За да разберете колко съобщения са в списъка си с думи, е отправила искане за псевдо-символичен “. MSG_COUNT” (точка на БР). За пример, стартирайте командата “-w $ bogoutil BOGOFILTER_DIR / wordlist.db. MSG_COUNT”.

За колко жетони са подадени в думата си списък, изпратете на изхода на командата да се отърват bogoutil командата “тоалетна”. Например, използвайте “г-$ bogoutil BOGOFILTER_DIR / wordlist.db / wordlist.db | WC-л”, за да показва броя на случаи на символите (Ако използвате spamlist.db goodlist.db и стартирайте командата за всеки един от тях).


Мога ли да използвам няколко wordlists?

Да. Bogofilter може да работи с няколко списъка на думи. Например, ако сте списъкutilisateur и
systemeBogofilter да vrifier ако думата е в списъка с потребители, и ако думата не е там, vrifier система списък. Bogofilter може да смесва информация и от двете листи.

Тук са възможностите за конфигурационния файл и някои примери:

Списък на думи possde няколко качества, particulirement тип, име, името на файла и prcdence.

  • Тип “R” и “Аз” (за редовни и Игнорирай). Настоящите списъци са от типа “R”. Тип “аз” означава “не n’value знак, ако се открие в списък с пренебрегнати.”
  • Име: кратко идентификатор, който ще се използва за показване на съобщения за грешка. Например “глобално”, “потребител” и “игнорирай”. Но всеки идентификатор е валиден.
  • Име: името на файла на думите. Когато отворите база данни, ако пътят е compltement квалифицирани (с ‘/’ в горната част, или “~”) име се използва, в противен случай добавите съдържание променливи път bogofilter по реда следното: $ BOGOFILTER_DIR, BOGODIR $, $ HOME.
  • Prcdence: това е цяло число, като 1, 2, 3,… Изглежда за токен в списъците на думи в посока нагоре на prcdence. Ако знак се намира, дори prcdence списъци се използват за сумата на сметките. Списъци с prcdence suprieure не се проверява.

Пример 1 – микс на потребителя и списъци система:

    wordlist R,utilisateur,~/wordlist.db,1
    wordlist R,systeme,/var/spool/bogofilter/wordlist.db,1

Пример 2 – Преди потребителя списък:

    wordlist R,utilisateur,~/wordlist.db,2
    wordlist R,systeme,/var/spool/bogofilter/wordlist.db,3

Пример 3 – Преди списък система:

    wordlist R,utilisateur,~/wordlist.db,5
    wordlist R,systeme,/var/spool/bogofilter/wordlist.db,4

Бележка 1: Опции enregristrement bogofilter (“-ите”, “-н”, “-U”, “-S”, “-N”) ще се прилага само списъци на най-ниските в PR cdence.

Бележка 2: разполагат със списъци от типа “R” и “аз” на една и съща prcdence не е позволено, защото видовете са противоречиви.


Мога ли да кажа bogofilter да игнорират определени символи?

Чрез използването на списъци от типа “игнорирай”, bogofilter не ще вземе предвид списъците жетони за оценка на съобщението.

Пример:

    wordlist I,ignore,~/ignorelist.db,7
    wordlist R,systeme,/var/spool/bogofilter/wordlist.db,8

Като ignorelist.db има индекс infrieur (7), че на
wordlist.db (8), bogofilter няма да изглежда на жетони, които ще бъдат в ignorelist.db.

Забележка: Технически bogofilter дава оценка на ROBX на символи, както и очаква, че min_dev Аргументът прави “Cancel”.

Има два основни mthodes за изграждане / поддържане на списък на “игнорирай”.

Първо, текстов файл може да бъде кр и поддържа от издателя. Bogoutil може да конвертирате текстов файл в база данни, например “bogoutil ignorelist.db-л <ignorelist.txt”.

Secondo, echo... | bogoutil... може да се използва за добавяне на един символ, например “ignorez.moi”

  echo ignorez.moi | bogoutil -l ~/ignorelist.db

Как мога да направя, за да превърне базата на думи SPAR в Комбинираната формат?

Стартирайте bogoupgrade скрипт. За повече информация писта “bogoupgrade-H” за да видите помощта съобщение, или “човекът bogoupgrade” страница и прочетете ръководството.


Какво става, ако думите ми е повреден?

Ако смятате, че думата си списъци DGRAD нужно, можете да гледате какво се казва, че от стартирането BerkeleyDB:

    db_verify wordlist.db

Ако има проблем, можете да rcuprer или всички от символите и броя със следната команда:

    bogoutil -d wordlist.db | bogoutil -l wordlist.new.db

или – списъкът не може да бъде rcupre командата Предишна – с:

    db_dump -r wordlist.db > wordlist.txt
    db_load wordlist.new.db < wordlist.txt

Как мога да конвертирате моя списък от думи от / до уникод?

В основата на думи могат да бъдат превърнати от суров формат Unicode помощта на следните команди:

    bogoutil -d wordlist.db > wordlist.raw.txt
    iconv -f iso-8859-1 -t utf-8 < wordlist.raw.txt > wordlist.utf8.txt
    bogoutil -l wordlist.db.new < wordlist.utf8.txt

или:

    bogoutil --unicode=yes -m wordlist.db

В основата на думи могат да бъдат превърнати от Unicode формат до суровини, като напишете следното:

    bogoutil -d wordlist.db > wordlist.utf8.txt
    iconv -f utf-8  -t iso-8859-1 < wordlist.utf8.txt > wordlist.raw.txt
    bogoutil -l wordlist.db.new < wordlist.raw.txt

или:

    bogoutil --unicode=no -m wordlist.db

Как да преминете от не-транзакция по транзакция режим?

Процедурата е compltement документи по преписката документ / README.db раздел 2.2.1. Моля, прочетете suggrons параграф compltement.

В резюме, използвайте тези команди:

    cd ~/.bogofilter
    bogoutil -d wordlist.db > wordlist.txt
    mv wordlist.db wordlist.db.old
    bogoutil --db-transaction=yes -l wordlist.db < wordlist.txt

Ако всичко върви добре, можете да премахнете архивиране на файлове:

    rm wordlist.db.old wordlist.txt

Как да преминете от не-транзакционни транзакции режим?

Процедурата е compltement документи по преписката документ / README.db раздел 2.2.1. Моля, прочетете suggrons параграф compltement.

В резюме, можете да използвате bogoutil да копирате и презареждане на базата данни от думи, като например:

    cd ~/.bogofilter
    bogoutil -d wordlist.db > wordlist.txt
    mv wordlist.db wordlist.db.old
    rm -f log.????? __db.??
    bogoutil --db-transaction=no -l wordlist.db < wordlist.txt

Защо bogofilter умре като APRS дисплея “Lock маса е от наличните заключва” или “Lock маса е от налични записи обект”

На сделката и едновременно видове BerkeleyDB ncessitent ключалка таблица, която съответства на база данни размер. Прочетете файлаREADME.db Търговец на дребно за обяснение и решение.

Размерът на заключване на таблица могат да бъдат в paramtre bogofilter.cf или DB_CONFIG. Bogofilter.cf използва db_lk_max_locks и db_lk_max_objects директиви, докато DB_CONFIG използва set_lk_max_objects и set_lk_max_locks директиви.

APRs са тези ценности в DB_CONFIG Чанг, стартирайте

  bogoutil --db-recover /votre/repertoire/bogofilter

за възстановяване на таблицата за заключване.


Как е, че получавате съобщения DB_PAGE_NOTFOUND?

Вие със сигурност имате проблем с базата си на даване BerkeleyDB. Има две възможни причини: или сте достигнали лимита, или на базата данни е повреден.

Някои пощенски сървъри, като Postfix, да налагат ограничения на размера на файла. Когато bogofilter до базата данни достига тази граница, проблемът изглежда писмена форма.

За да видите размера на използвания от до базата данни:

    ls -lh $BOGOFILTER_DIR/wordlist.db

За да видите максималния размер с Postfix:

    postconf | grep mailbox_size_limit

За да зададете максималния размер на 73MB (или каквото и размер е приложимо):

    postconf -e mailbox_size_limit=73000000

Ако смятате, че вашата база данни е повреден даде, прочетете точка
Какво става, ако в моя списък на думи е corroumpue?
често задавани въпроси.


Защо получавам “Berkeley DB библиотеката конфигуриран да подкрепят само DB_PRIVATE среда” или “Berkeley DB библиотеката конфигуриран да поддържа само частен среда”?

Някои дистрибуции (например Fedora) предлага BerkeleyDB с поддръжка на теми POSIX и POSIX mutexes consquent, когато системата ви не поддържа тези mutexes. (Това dpend си версия на ядрото и точният вид на процесор).

За да се справите с проблема

  1. Tlcharger, компилирате и инсталирате Berkeley DB ръчно да конфигурирате bogofilter:
    1. CD build_unix
    2. .. / Dist / конфигурирате - позволи-cxx
    3. да
    4. да инсталирате
  2. компилирате и инсталирате bogofilter:
    1. . / Конфигуриране - с-libdb-префикс = / usr/local/BerkeleyDB.4.3
      (замени номера на версията на Berkeley DB)
    2. и да и направят проверка
    3. да инсталирате (ако понятието за пространство е важно, използвайте да инсталирате-лента)

Bogofilter могат да работят в среда с много потребители?

Да, може. Има много stratgies да го направят. двете крайности са:

  • Като bogofilter администратор, който поддържа обширна база данни, че всеки използва.
  • Всеки потребител поддържа собствена база данни.

Настоящият компромис: bogofilter администратор поддържа глобална wordlists и всеки потребител има право да използват глобалната списък или списък частни. А MDA като procmail, могат да бъдат програмирани за изпълнение на първия изчерпателен списък (със строг лимит TRS спам) и, когато е необходимо, да се прилага списък на думи отрича.


Мога ли да споделям една дума NFS списък?

Ако току-що прочетох, няма проблем. Ако сте ги сложили дни, трябва да предоставите правото възможности за заключване се избегне повреда на данни. Когато се съставят bogofilter, ще трябва vrifier, че конфигурирате скрипт е разположен “# определи HAVE_FCNTL 1″ в config.h вашия файл. Операционната система UNIX всички поддържат този стандарт. Ако използвате версия particulirement екзотични или стар, се уверете, че подкрепя fcntl (). Ако “# определи HAVE_FCNTL 1″ се определя, като се посочва, че вашата система, за да сраснали fcntl (), след това dcommentez “# определи HAVE_FLOCK 1″, така че системата използва заключване fcntl () вместо на стадото () за заключване. Ако системата ви не поддържа fcntl, така че можете да споделяте wordlists през NFS, без да рискуват повреда на данни.

След това се уверете, че NFS е конфигуриран правилно с “lockd” работи. Rfrez си NFS документация за стартиране на “lockd” или “rpc.lockd”. Повечето от активното Systmes с NFS по подразбиране.


Защо bogofilter осигурява възвръщаемост кодове като 0 и 256, когато стартирате програма на закрито?

Вероятно кодове връщане са тона rcrits от waitpid (2). С използването WEXITSTATUS (статус) в макро-системи / wait.h, или съпоставими, за да получите правилната стойност. Perl употреба “система (” bogofilter $ вход “)>> 8. Ако искате повече информация, стартирайте
"man waitpid".


Защо са ми скриптове chouent дни, откакто сложих?

Що се отнася, bogofilter е натрупал голям брой опции. Някои от тях са изчезнали или променени. Виж файла
НОВИНИ за повече информация.


Защо, тъй като съм модернизирани bogofilter работят по-малко и там?

В lexer, частта, която извлича знаците на съобщения, се развива. Това води до промяна в gnration списъка на символи, които на свой ред ще направи старите символи inutiliss.

Ако се сблъскате с този проблем, призова ви възстановяване на базата данни. Ако това не е възможно, можете да използвате версия
0.15.13
и прочетете документацията, която върви с него, за да видите как да мигрират.


Комбинира се с един списък от думи, как мога да dtruire всички символи спам (или не-спам)?

Bogoutil ви позволява да се изброят (дъмп) един списък от думи и натоварване на символите в нов списък от думи. С помощта на инструменти като awk и Впиши, номерата могат да бъдат пуснати zros и символите, чиито сметки ще бъдат за нула-спам и бутове може да бъде dtruits.

По-долу ще dtruire жетони от спам съобщения:

    bogoutil -d wordlist.db | \
    awk '{print $1 " " $2 " 0"}' | grep -v " 0 0" | \
    bogoutil -l wordlist.new.db

По-долу ще dtruire жетони от спам съобщения.

    bogoutil -d wordlist.db | \
    awk '{print $1 " 0 " $3}' | grep -v " 0 0" | \
    bogoutil -l wordlist.new.db

Как bogofilter работи върху Solaris, BSD и др.?

Ако не сте DJ версия 3.0 или по-висока от
BerkeleyDB, а след това
актуализациите файлове за изтегляне (под една от 4.2.x), на dcompactez, и изпълнете следните команди в директорията “DIST”:

    $ cd build_unix
    $ sh../dist/configure
    $ make
    # make install

След Tlcharger на преносима версия на bogofilter.

На Solaris

Dcompactez и след това да направите:

    $./configure --with-libdb-prefix=/usr/local/BerkeleyDB-4.2
    $ make
    # make install-strip

След това можете да направите или символично libdb.so връзка в / ЮЕсАр / ИЪ, или използването на модифицирана версия на променливата на средата LD_LIBRARY_PATH, преди да пуснете bogofilter.

    $ LD_LIBRARY_PATH=/usr/lib:/usr/local/lib:/usr/local/BerkeleyDB-4.2
        $ export LD_LIBRARY_PATH

Имайте предвид, че някои версии на книги направи с по-стара версия Solaris почивка, когато се опитваме да изградим bogofilter извън нейната директория източник. Или ще съставя регистъра източник (като suggr по-горе) или да използвате GNU марка (gmake).

На FreeBSD

Пакетите са на разположение с версии на trsrcentes bogofilter. Този подход се използва пакети TRS се препоръчва portupgrade и portsnap. За да инсталирате тези две прекрасни инструменти (което трябва да направите това само веднъж):

    # pkg_add -r portupgrade cvsup

За да инсталирате или актуализирате bogofilter, само няколко дни до
дървото преобразуване (пристанища дърво) с CVSup
след това въведете

    # portupgrade -N bogofilter

Забележка:. Това предполага, че са корен В противен случай, прочетете mmento на този раздел FreeBSD и да видим как да се
съставят, ако не разполагат с привилегии изисква..

В зависимост от вашата система, може да зададете някои системни променливи, да се контролира ./configure. Пример:

    # env CPPFLAGS=-I/usr/local/include/db3 LIBS=-ldb3 LDFLAGS=-L/usr/local/lib./configure

Dpendent пътеки на вашата система и версии на бази от данни, които сте инсталирали. Уверете се, и промяна в consquence.

HP-UX

Виж файла
DOC / програмист / README.hp-UX
в източник на разпространение.


Мога ли да използвам командата правят ми Systm?

Bogofilter успешно съставен от няколко Systmes с помощта на GNU и да направи родния команди. Въпреки това, Makefile bogofilter не работи с някои команди направи.

GNU да се препоръчва за изграждане bogofilter, защото ние знаем, че работи. Ние не може да поддържа поръчки правят по-малко ефективни. Ако не-GNU да работи, страхотно!. Ако се сблъскате с някакъв проблем, нещо, което да направите е да инсталирате GNU направи. Ако не-GNU да могат да съставят bogofilter, ние сме Съжалявам, но това е ваш проблем. Ако това не ncessite собствен малък участък да стане съвместим, ние ще интегрира възможно.


Как да съставя bogofilter за без корен потребител или с префикс на нестандартни инсталация?

Bogofilter да се инсталира в директория нестандартни (като без корен не са разрешения за директории нормално), ще трябва prciser префикса, когато инсталирате стартира
./configure.

APRS dcompacter изтеглите и са
изходния код
, стартирайте./configure --prefix=PATH. о PATH е инсталацията префикс за gnrs файлове (изпълними файлове, човек страници и т.н.) След това стартирайте обичайните команди -

make && make check && make install.


Как да създам bogofilter с лепенки?

Ако сте ncessaire прилагат петна, rcuprez
изходния код
и използването на dcompacteztar -xzf или gunzip
| tar -xf -
. Промяна на източника директория и да стартирате./configure --prefix=PATH

о PATH е инсталацията префикс за gnrs файлове (изпълними файлове, човек страници и т.н.) След това APRS са приложили петна, изпълнете обичайните команди. -
make && make install.


Как да си направим изпълними по-малки?

Намалява Когато пространство, можете да използвате make
install-strip
вместо make install. Това позволява SAVE дисково пространство, но не позволява отстраняването на грешки в катастрофата, освен ако повече информация за възпроизвеждане на грешки се предоставя dveloppeurs.


datastore_db.c не се компилира!

Ако зададете пътя до базата данни, например, – с-libdb-префикс или чрез CPPFLAGS и LIBS, не забравяйте да осигури
абсолютния път (с наклонена черта в начинаещи), един относителния път няма да работи. Пример: използване
- с-libdb-префикс = / usr/local/BerkeleyDB.4.2, но
не - с-libdb-префикс =.. / BerkeleyDB.4.2


Кои програми се bogofilter работите?

Bogofilter rput е да се работи с KMail, Mozilla поща, куче, алпийски, Sylpheed-нокти. А за търсене на Google ще ви помогне да получите повече информация за използване bogofilter с редовни пощата си програма.


Как да използвате bogofilter с пес?

Използвайте поща филтър (procmail, maildrop и др.) Да филтрират електронна поща в папки РАЗЛИЧНИ след връщането код на bogofilter, както и бутони за връзка влак bogofilter на грешки:

    macro index S "|bogofilter -s\ns=junkmail"  "Apprendre comme spam et sauvegarder dans junk"
    macro pager S "|bogofilter -s\ns=junkmail"  "Apprendre comme spam et sauvegarder dans junk"
    macro index H "|bogofilter -n\ns="          "Apprendre comme spam et sauvegarder"
    macro pager H "|bogofilter -n\ns="          "Apprendre comme spam et sauvegarder"

Това ще изпращат съобщения, за да изберете bogofilter, преподаване фалшиви шунка в спам и обратно, а след това предложи да запишете в папка по-различно.


Как да използвате bogofilter с Sylpheed Claws?

ПРАВИЛА добавите филтър, за да тече bogofilter за входящи съобщения и извършване на действия, ако това е спам.

    condition:
    * test "bogofilter < %F"
    action:
    * move "#mh/VOTRE_BOITE_A_SPAM"

Забележка: Това предполага, че bogofilter е по пътя си!

Създаване на две Claws действия – един за маркиране на съобщения като спам и един за маркиране на съобщения като шунка. Използвайте действие “Маркирай като Спам” съобщения за неправилно classs като шунка и използване “Маркирай като Хем” classs за съобщения неправилно като спам.

    Mark as ham / spam:
    * bogofilter -n -v -B "%f" (mark ham)
    * bogofilter -s -v -B "%f" (mark spam)

Друг подход е да се запишете на съобщения в папка неправилно classs (или повече) и да стартирате скрипт, като например:

    #!/bin/sh
    CONFIGDIR=~/.bogofilter
    SPAMDIRS="$CONFIGDIR/spamdirs"
    MARKFILE="$CONFIGDIR/lastbogorun"
    for D in `cat "$SPAMDIRS"`; do
        find "$D" -type f -newer "$MARKFILE" -not -name ".sylpheed*"
    done|bogofilter -bNsv
    touch "$MARKFILE"

Този сценарий може да се използва като действие или трансформират като бутон. Това ще спести като спам, съобщения в $ {} са SPAMDIRS последния брой MARKFILE като $ {}.

Повече информация е на разположение в
уики Sylpheed-Claws.


Друг подход е да стартирате bogofilter от procmail, maildrop и др. и да Claws vrifier от заглавието X-Bogosity и филтър съобщения в Спам и несигурна папки. Например:

    Condition:
        header "X-Bogosity" matchcase "Spam"
    Action:
        move "#mh/Mailbox/Spam"
    Condition:
        header "X-Bogosity" matchcase "Unsure"
    Action:
        move "#mh/Mailbox/Unsure"

Всички съобщения в Несигурни папка трябва да се научи, тъй като всички съобщения неправилно класифицирани като шунка или спам. Следните действия greront такива случаи:

    Register Spam:
        bogofilter -s < "%f"

    Register Ham:
        bogofilter -n < "%f"

    Unregister Spam:
        bogofilter -S < "%f"

    Unregister Ham:
        bogofilter -N < "%f"

За да проверите bogofilter mcanisme вкарване, след поставяне на диагнозата е от полза:

    BogoTest -vv:
        bogofilter -vv < "%f"

    BogoTest -vvv:
        bogofilter -vvv < "%f"

Допълнителна информация за този подход са достъпни тук.


Как да използвате bogofilter с VM (едно Mail Emacs инструмент)?

Трябва да включите файла VM-bogofilter.el (както можете да се обърнете към търговеца е bogofilter или Tlcharger http://www.cis.upenn.edu/ ~ bjornk / bogofilter / VM-bogofilter.el) в път библиотека на Emacs.

Тя остава само за вас, които поставят в конфигурационния файл ~ / VM.:

;; Lutte contre les pourriels (via bogofilter)
;;
(require 'vm-bogofilter)

;; Raccourcis-clavier pour bogofilter
;; C (shift-c): pourriel
;; K (shift-k): message correct
(define-key vm-mode-map "K" 'vm-bogofilter-is-spam)
(define-key vm-mode-map "C" 'vm-bogofilter-is-clean)

Всички съобщения се филтрират от bogofilter когато Проверете вашите нови съобщения. При промяна на състоянието на съобщение, заглавията на съобщението са променени (заглавието X-Bogosity:).

Има едно ограничение: не можете да промените състоянието на изберете набор от съобщения: вие трябва да направите, APRS съобщение съобщение…


Как да използвате bogofilter с MH-E (интерфейса Emacs да изпратите по пощата Systm МЗ)?

Paramtrage опцията по подразбиране “MH-боклуци програма” е “Автоматично откриване”, което означава, че MH-E автоматично ще избере между SpamAssassin, bogofilter, или SpamProbe, в този ред. Ако, например, да инсталирате SpamAssassin и bogofilter, а вие искате да използвате bogofilter, трябва да промените това “bogofilter”.

“PG” Командата (“MH-боклуци черен списък”) влакове на спам в ход програма с изберете съдържанието и след това третира (и) съобщение (я), както Задава опцията ” MH-боклуци разпореждане “. По подразбиране тази опция е настроена на “Delete Спам” Но можете да spcifier името на директорията, която ще бъде полезно за изграждането на корпуса на спам за обучение.

Вместо това, командата “w J” (“MH-боклуци-белия списък”) прекласифицира съобщения Изберете Хем, тъй като те неправилно taient classs като спам. След това тя dplace мнения в “+ кутия”.

За повече информация прочетете на страницата MH-E




SourceForge Logo

Site designed by
www.nkstudios.net