8 Beiträge / 0 neu
Letzter Beitrag
Bild des Benutzers hrk
hrk
Offline
Registriert seit: 19.11.2007 - 17:33
SPAM-Filter in Hochform

Hurra, der SPAM-Filter greift wieder! Smile

Und wie er greift, er scheint richtig in Hochform zu sein!

So sieht inzwischen meine Statistik (seit 05.06.05 abends) aus. Die Werte links sind die vom 06.06., die rechts sind die bis jetzt kummulierten:

Bisherige Ausbeute (richtig erkannt/falsch erkannt):
*SPAM ERKANNT* 10+ . . . . 2/0 . . . . 37/0 Smile
*****SPAM***** 10+ . . . . 0/0 . . .. . 0/0
*SPAMVERDACHT* 05+ . . . . 2/0 . . . . 23/0 Smile
*****SPAM***** 05+ . . . . 1/0 . . . . 19/0
*****SPAM***** 04 . . .. . 6/0 . . . . 11/0
*****SPAM***** 03 . . .. . 1/0 . . .. . 7/2
Thunderbird-Junk . . .. . 15/0 . . . . 66/0
unerkannt . . . . . . . . . 0 . . .. . . 4
*VIRUSVERDACHT* . . .. . . 0/0 . . .. . 0/0

Besonders wichtig sind dabei die 1. und die 3. Zeile, die sich auf den "neuen" Spamassassin beziehen. diese sind in den letzten beiden Tagen deutlich hochgeschnellt.

Ich werde meine Sammlung jetzt nochmal auf "0" setzen, dann kann man in den nächsten Tagen (hoffentlich) sehen, wie effizient der Spam-Filter jetzt arbeitet.

Bild des Benutzers hrk
hrk
Offline
Registriert seit: 19.11.2007 - 17:33
Hochform bestätigt sich

Heute vor einer Woche habe ich meine Sammlung zurückgesetzt. Und es hat sich bestätigt: Der "neue" Spamassassin (v 3.0.3) läuft, seit er ein paar Trainingsdaten hat (und vermutlich auch von Florian ein wenig "flott" gemacht worden ist, besser als je zuvor. Die nachgeschaltete "alte" Version 2.63 liefert inzwischen weniger als 10% der Trefferquote der "neuen" Version. Damit braucht man der Version kaum noch eine Träne nachweinen, wenn Florian sie dann irgendwann killen wird.

Allerdings hat sich die Quote der SPAMs, die beide Filter passieren noch nicht drastisch verbessert. Sie liegt mit über 23% immer noch sehr hoch.

Die dritte Spalte der Tabelle gibt die "Ausbeute" der letzten Woche wider.

> Bisherige Ausbeute (richtig erkannt/falsch erkannt):
> *SPAM ERKANNT* 10+ . . . . 2/0 . . . . 37/0 . . . . 135/0
> *****SPAM***** 10+ . . . . 0/0 . . .. . 0/0 . . . . . 0/0
> *SPAMVERDACHT* 05+ . . . . 2/0 . . . . 23/0 . .. . . 20/0
> *****SPAM***** 05+ . . . . 1/0 . . . . 19/0 . . . . . 5/0
> *****SPAM***** 04 . . .. . 6/0 . . . . 11/0 . . . . . 5/0
> *****SPAM***** 03 . . .. . 1/0 . . .. . 7/2 . . . . . 3/0
> Thunderbird-Junk . . .. . 15/0 . . . . 66/0 . . .. . 39/0
> unerkannt . . . . . . . . . 0 . . .. . . 4 . . . . . . 1
> *VIRUSVERDACHT* . . .. . . 0/0 . . .. . 0/0 . . . . . 0/2
>
Ich werde meine Sammlung jetzt wieder auf "0" setzen und die Sache weiter beobachten.

Bild des Benutzers Senior
Senior
Offline
Registriert seit: 19.11.2007 - 17:33
Re: Hochform bestätigt sich

ja das ist erfreulich, auch ich bin mit dem AUGE Account wieder
versöhnt. Der Schrott hält sich in Grenzen.
Dir Heinz für die Statistik, den anderen beteiligen fürs werkeln im Sumpf sagt
Grufti
Herzlichen Dank

Bild des Benutzers hrk
hrk
Offline
Registriert seit: 19.11.2007 - 17:33
Zu früh gefreut

Letzte Woche habe ich noch geschrieben:

> ... Spamassassin (v 3.0.3) ... Die nachgeschaltete "alte" Version 2.63
> liefert inzwischen weniger als 10% der Trefferquote der "neuen"
> Version. ...

Dieser Trend hat sich in den letzten 8 Tagen leider nicht fortgesetzt. Sad
Aktuell liegt der Wert bei über 14%
Und der Anteil, der dem Junkfilter des Thunderbird bleibt, liegt bei fast 27%
Das macht ca. 41%, was dem "neuen" Spamassassin durchgeht.
Letztes Mal waren es nur wenig mehr als 25%
Immer noch recht viel. Hoffen wir mal, daß das noch besser wird.

Erfreulich immerhin, daß die überhaupt nicht erkannten SPAMs nachhaltig gegen 0 tendieren. Auch die Anzahl der "false positive" ist erfreulich gering.

Einzig der *VIRUSVERDACHT* fällt auf, daß er fast ausschließlich f.p. produziert. Ich kann mich an keinen einzigen Fall erinnern, wo eine entsprechende Klassifizierung richtig gewesen wäre. Und wo wir jetzt einen "richtigen" Virenscanner im Einsatz haben, sollten wir darüber nachdenken, diese Funktion einfach abzuschalten, wenn das problemlos geht.

Die letzte Spalte der Tabelle spiegelt die aktuelle "Ausbeute" wider.
Nach der Einführung des Virenscanners gibt es eine neue Zeile "Virus gelöscht".
>
>
> > Bisherige Ausbeute (richtig erkannt/falsch erkannt):
- - Virus gelöscht . . . . . . . . . . . . . . . . . . . . 4/0
> > *SPAM ERKANNT* 10+ . . 2/0 . . 37/0 . . 135/0 . . . . 87/0
> > *****SPAM***** 10+ . . 0/0 .. . 0/0 . . . 0/0 . . .. . 1/0
> > *SPAMVERDACHT* 05+ . . 2/0 . . 23/0 .. . 20/0 . . . . 46/0
> > *****SPAM***** 05+ . . 1/0 . . 19/0 . . . 5/0 . . . . 11/0
> > *****SPAM***** 04 .. . 6/0 . . 11/0 . . . 5/0 . . . . 13/1
> > *****SPAM***** 03 .. . 1/0 .. . 7/2 . . . 3/0 . . .. . 8/0
> > Thunderbird-Junk .. . 15/0 . . 66/0 .. . 39/0 . . . . 62/0
> > unerkannt . . . . . . . 0 . .. . 4 . . . . 1 . . .. . . 0
> > *VIRUSVERDACHT* . .. . 0/0 .. . 0/0 . . . 0/2 . .. . . 0/1
> >
> Ich werde meine Sammlung jetzt wieder auf "0" setzen und die
> Sache weiter beobachten.
>

Bild des Benutzers hrk
hrk
Offline
Registriert seit: 19.11.2007 - 17:33
Situation unerfreulich

Schade, es geht nicht so richtig voran. An manchen Tagen hat man das Gefühl, der Spam-Filter sei abgeschaltet, an anderen erwischt er fast alles. Summa summarum ist Bild aber leider nicht so erfreulich.

Der Übersicht halber habe ich die alten Ergebnisse aus der Tabelle herausgelöscht, nur die Werte der Vorwoche habe ich beibehalten.

Es fällt auf, daßder Anteil *SPAM ERKANNT* drastisch eingebrochen ist, während sich die Anzahl der bis zum Junk-Filter durchgelassenen Spamsdeutlich erhöht hat. Aber auch alle anderen Kategorien haben zugelegt. Sad

Dieser Trend gefällt überhaupt nicht. Hoffentlich können wir das sehr bald ändern. Beee
> >
> >
> > > Bisherige Ausbeute (richtig erkannt/falsch erkannt):
> - - Virus gelöscht . . . . . 4/0 . . . . 3/0
> > > *SPAM ERKANNT* 10+ . .. 87/0 . .. . 33/0
> > > *****SPAM***** 10+ . . . 1/0 . . . . 0/0
> > > *SPAMVERDACHT* 05+ . .. 46/0 . .. . 56/0
> > > *****SPAM***** 05+ . .. 11/0 . .. . 19/0
> > > *****SPAM***** 04 . . . 13/1 . .. . 15/0
> > > *****SPAM***** 03 . .. . 8/0 . .. . 10/1
> > > Thunderbird-Junk . .. . 62/0 . .. . 93/0
> > > unerkannt . . . . . . . . 0 . . . . . 3
> > > *VIRUSVERDACHT* . .. . . 0/1 . . . . 0/1
> > >
> > Ich werde meine Sammlung jetzt wieder auf "0" setzen und die
> > Sache weiter beobachten.
> >
>

Bild des Benutzers Senior
Senior
Offline
Registriert seit: 19.11.2007 - 17:33
Note mangelhaft

auch in meiner Post ist das Verhältnis erheblich schlechter geworden etwa 60 % Schrott wird erkannt und 40 % Schrott landen noch immer im Posteingang, wobei bei den erkannten Schrott auch mal eine offizielle Auftragsbestätigung ist. Deshalb die Note mangelhaft.
Grüsse Gruft

Bild des Benutzers hrk
hrk
Offline
Registriert seit: 19.11.2007 - 17:33
Note mangelhaft - für den Absender

Hallo Grufti,

Grufti (M2961) schrieb:

> ... bei den erkannten Schrott auch mal
> eine offizielle Auftragsbestätigung ist. ...
Die Note "mangelhaft" steht an dieser Stelle aber eindeutig dem Absender dieser Auftragsbestätigung zu. Blum 3

Mit dem Spamassassin 3.0.x hatte ich bisher KEINE EINZIGE fälschlich erkannte Spam-Mail.

Lediglich die nachgeschaltete ältere Version 2.63 (die außer mir kaum jemand nutzt) produziert ein paar wenige "false positive". Aber selbst das liegt daran, daß mancher Absender meint,
a) sich nicht an allgemein übliche Regeln halten zu müssen.
b) bunte Bildchen mit viel Tam-Tam verschicken zu müssen.
c) aus Faulheit auf den Betreff verzichten zu können.

Eine sauber geschriebene Textmail mit normalem Text, normaler Betreff-Zeile und ggf. ein paar Links wird kaum je Gefahr laufen, als Spam mißinterpretiert zu werden.

Ich beschwere mich meist beim Absender, wenn eine Mail fälschlcih im Spam-Filter landet. Denn so schlecht ist unser SPAM-Filter nicht.

Gleichwohl träume ich nach wie vor davon, daß der Spamassassin 3.0.x irgendwann einmal 90% und mehr erkennt, die alte Version 2.63 nur noch vereinzelte zusätzliche Treffer landet und dann für den Junk-Filter des Thunderbird kaum noch etwas übrig bleibt.

Gast (nicht überprüft)
Ende der Debatte

Dazu vielleicht ein paar Kommentare vom Postmaster:

1. Eine Statistik dieser Art ist stets eine Momentaufnahme. Der Mix an SPAM ist jeden Tag anders. Bei den vergleichsweise geringen Mengen ist das nicht aussagekräftig, sondern eher ein Zufallsergebnis.

2. Die Hinweise auf die nacheinandergeschalteten SPAM-Filter sind nicht hilfreich, da dies nur einige Testuser betrifft, bei denen der alte SPAM-Filter (noch) nicht abgeschaltet wurde und daher noch parallel mitläuft. Das führt nur zu Verwirrung.

3. Ganz wesentlichen Einfluss auf die Trefferquote bei der SPAM-Erkennung hat der Bayes-Filter. Dieser Filter ist sozusagen "selbstlernend", bietet damit aber auch einen Angriffspunkt - wenn es dumm läuft, kann man über den Bayes-Filter sogar mehr SPAM abbekommen, als ohne.

Die Diskussion über den SPAM-Filter ist also nicht so trivial, wie es vielleicht scheint. Auf jeden Fall gehört sie nicht hierher in unser öffentliches Forum, sondern ausschliesslich in unser internes Forum. Dort können wir dann über die sinnvollen Einstellungen diskutieren. Das Sammeln von irgendwelchen Statistikdaten durch einzelne User ist ziemlich zweckfrei, die Veröffentlichung hier an dieser Stelle sogar kontraproduktiv.