Regexp in Kmail-filter

Hallo zusammen,

ich bekomme säckeweise Spam, der sich an einem einfachen Merkmal erkennen lässt: In der ersten Zeile des Nachrichtentextes steht irgendwas, in der zweiten Zeile direkt darunter dann eine URL auf irgend eine Webseite, danach kommt eine oder mehrere leere Zeilen.

Da dacht ich mir, ich filter das über eine RegExp raus. Allerdings meckert der regexp-editor immer, ich könne nach einem Zeilenende nichts mehr stehen haben.

Ich dachte an folgende RegExp:

Zeilenanfang, dann irgendwas aus Buchstaben, Punkt, Komme oder Leerzeichen, dann Zeilenende dann Zeilenanfang dann URL dann Zeilenende dann einfach nur Zeilenende mindestens ein mal.

Umsetzung:

^[a-zA-Z0-9.,]+$^http://[a-zA-Z0-9.]+$$+ 

Klappt nicht. Kann mir jemand eine RegExp basteln, die das macht, oder geht das in Kmail einfach nicht?

Gruß

Fritze

Hallo,

ich bekomme säckeweise Spam, der sich an einem einfachen
Merkmal erkennen lässt: In der ersten Zeile des
Nachrichtentextes steht irgendwas, in der zweiten Zeile direkt
darunter dann eine URL auf irgend eine Webseite, danach kommt
eine oder mehrere leere Zeilen.

Ich finde es etwas umständlich zu probieren, einen Spamfilter mit regex zu schreiben, aber wenn du es so willst…

Umsetzung:

^[a-zA-Z0-9.,]+$^http://[a-zA-Z0-9.]+$$+

Klappt nicht. Kann mir jemand eine RegExp basteln, die das
macht, oder geht das in Kmail einfach nicht?

Vermutlich gibst du das Zeilenende nicht richtig an. Vielleicht hilft sowas weiter:

^[a-zA-Z0-9.,]+\nhttp://[a-zA-Z0-9.?&/]+\n\n

Aber ich kenne die regex von kmail nicht…

Grüße,
Morit (der zu einem vernünftigen Spamfilter rät)

Hallo,

Vermutlich gibst du das Zeilenende nicht richtig an.
Vielleicht hilft sowas weiter:

^[a-zA-Z0-9.,]+\nhttp://[a-zA-Z0-9.?&/]+\n\n

Aber ich kenne die regex von kmail nicht…

Nein nein. Zeilenende ist schon ‚$‘. Aber er will eben maximal eine Zeile, es darf nichts nach dem ‚$‘ stehen. Das finde ich (gelinde gesagt) unbefriedigend.

Noch was zum Spamfilter. Wie genau bringt man denn einem Spamfilter bei, was Spam ist, und was nicht? Ob ich die RegExp nun in KMail oder im Spamfilter eintrage ist doch einerlei. Übrigens sind meine Mails vom Provider bereits spamgefiltert, die Mails mithin bereits einmal durchgerutscht.

Gruß

Fritze

Hallo,

Nein nein. Zeilenende ist schon ‚$‘. Aber er will eben maximal
eine Zeile, es darf nichts nach dem ‚$‘ stehen. Das finde ich
(gelinde gesagt) unbefriedigend.

Dann liegt es doch nicht an der regex, sondern an den kmail-Einstellungen oder an der Implementierung. Hast du dir mal FAQs zu kmail durchgeschaut? wenn das da nirgendwo auftaucht könntest du den Entwicklern ne Mail schreiben und darum bitten, regexes zu implementieren, die potentiell den ganzen Body-Text matchen und nicht nur einzelne Zeilen.

Noch was zum Spamfilter. Wie genau bringt man denn einem
Spamfilter bei, was Spam ist, und was nicht?

naja, dazu gibt es viele Möglichkeiten

  1. White- und Blacklists, ev. real-time
  2. füttern mit Testdaten, von denen bekannt ist, ob sie ham oder spam sind. Dazu müßen die Filter natürlich lernfähig sein, das sind aber die modernen Bayes-Filter alle.
  3. beibringen einzelner Merkmale, wie z.B. über regexes

Ob ich die RegExp
nun in KMail oder im Spamfilter eintrage ist doch einerlei.

Nein. Falls du mal dein Mailprogramm wechselst möchtest du diese Regeln ja immer noch haben.
Ich bin für den modularen Ansatz, der Unix (u.a.) so erfolgreich gemacht hat: ein tool für jede Aufgabe. In dem Fall soll der spamfilter spam filtern und das Mailprogramm Mails anzeigen/senden.

Grüße,
Moritz