Spamlearning

Last modified by Thomas Walter Erbesdobler on 2023/07/05 17:55

Die RBG betreibt auf den Maileingangsservern in der DMZ ein auf Spamassassin basierendes Spamklassifizierungs- und -filtersystem.

Sie finden hier Informationen über die Funktionsweise und Benutzung dieses Systems.

Allgemeine Informationen

Spamsortierung

Standardmäßig werden von Spamassassin mit hoher Wahrscheinlichkeit als Spam klassifizierte E-Mails (Spam-Score >= 7) markiert und in den IMAP-Ordner "INBOX.spam" (Mathematik: "spam") abgelegt.

Dieses System ist sehr konservativ eingestellt und kann nicht für alle Benutzer optimal sein. Verschiedene Benutzer bekommen in der Regel auch Spam-Mails von verschiedenen Quellen, und auch die echten Mail (Ham) weisen eine zwischen den Benutzern stark varrierende Streuung der automatisch ermittelten Spam-Scores auf.

Im RBG User Central Web-Interface (https://ucentral.in.tum.de / https://ucentral.ma.tum.de) kann dieses Verhalten darum so angepasst werden, dass E-Mails nach Spam-Score in benutzerdefinierte Ordner abgelegt werden:

  • In ucentral im "Mail delivery settings"-Menü unter "Spam folders" die Checkbox "Use custom spam filter settings" anwählen
  • Mit den Checkboxen Ordner aktivieren und mit dem Slider Spam-Score einstellen
  • Mit dem "Save"-Button speichern
  • Sie können auch weitere IMAP-Ordner anlegen, die "spam" oder "junk" als Namensbestandteil enthalten. Danach kann in den Spameinstellungen eingestellt werden, dass "starker" Spam (z.B. ab 7 Sterne) in einen anderen Ordner kommt als "unsicherer" Spam (z.B. ab 2 Sternen)
    Das selbe kann natürlich auch mit einem selbstgeschriebenen Sieve-Script erreicht werden.

Spam-Header

Spamassassin fügt folgende Header in geprüfte E-Mails ein:

  • X-Spam-Level: Spam-Score der E-Mail in Sternen (X-Spam-Level: * bedeutet: Spam-Level 3)
  • X-Spam-Flag: Ist dieser Header vorhanden, hat die E-Mail ein Spam-Level von 7 oder höher
  • X-Spam-Status: Spam-Status Yes/No und gematchte Regeln

Wenn man mehr Informationen über das Spam-System haben will, empfiehlt es sich, den X-Spam-Status-Header bei allen E-Mails anzeigen zu lassen.

Manuelle Spam-Markierung

Die automatische Spam-Klassifizierung benutzt in den E-Mails enthaltene Merkmale wie Absender, Adresse des Mailservers oder in der E-Mail enthaltene Signaturen um eine Spam-Score zu ermitteln.

Um diese Klassifizierung zu verbessern, kann "nachgearbeitet" werden, indem vom System falsch klassifizierte E-Mails explizit als Spam oder Ham (Nicht-Spam) markiert und in das System eingelernt werden.

Diese manuelle Spam-Markierung ist aktuell nur für den Webmail-Client implementiert. Auch wenn Sie über Thunderbird/Apple Mail etc. eine Spam-Mail entdeckt haben und sie uns melden möchten, können Sie einfach auf unser Webmail-Portal gehen, die Mail dort suchen, und als Spam markieren.

Achtung: Die E-Mails werden maschinell verarbeitet, aber da die Qualität der Markierung überprüft werden muss, behält sich die RBG vor, diese E-Mails ohne Ankündigung oder Nachfrage zu lesen.
 Bitte beachten Sie dies falls Sie den "diese Mail ist kein Spam" Button bzw. den Ham-Learning-Ordner bei persönlichen E-Mails verwenden. Selbstverständlich werden die E-Mails absolut vertraulich behandelt und ausschließlich für die Spam-Klassifizierung verwendet.

Die Einverständniserklärung in dieses Verfahren passiert bei der ersten Benutzung über einen Bestätigungsdialog im Webmail. Alle paar Monate wird erneut nachgefragt, damit Sie nicht vergessen, dass die Funktion nicht unbedingt für die privatesten Mails gedacht ist.

Spam-Markierung über Webmail

In der Webmail-Anwendung der RBG (https://webmail.in.tum.de / https://webmail.ma.tum.de) können einfach die Spam/Nicht-Spam-Buttons benutzt werden. Die Anleitung für Webmail-Benutzer finden Sie hier.