Informatiker des indischen Sinhgad Institute of Technology Lonavala haben eine neue Technik zur automatischen Erkennung von Spam-E-Mails entwickelt. Sie könnte dazu beitragen, die Sicherheit der Benutzer zu verbessern, denn Spam wird nicht nur zu Werbezwecken verschickt. Oft enthalten sie Schad-Software und wird zum Abgreifen von Daten (Phishing) genutzt.
Neue Deep-Learning-Technik
Das von Vikas Samarthrao Kadam und seinen Kollegen entwickelte Verfahren basiert auf einer multi-objektiven Merkmalsauswahl und auf einem „adaptive capsule network“, einer neuen und vielversprechenden Deep-Learning-Technik. Im Gegensatz zu anderen zuvor entwickelten Methoden wurde das Modell sowohl mit Bild- als auch mit Textdatensätzen trainiert. Bei ersten Tests haben Kadam und seine Kollegen herausgefunden, dass das Verfahren Spam-E-Mails mit größerer Genauigkeit erkennt als andere bestehende Methoden.
„Die Spam-Erkennung ist unerlässlich, da sie das Vertrauen des Käufers in die Online-Shops aufrechterhalten kann“,
so Vikas Samarthrao Kadam.
In den vergangenen Jahren haben Informatiker immer fortschrittlichere Rechenmodelle entwickelt, um Spam-E-Mails automatisch zu erkennen. Um eine gute Leistung zu erbringen, müssen die meisten dieser Modelle jedoch mit einer Vielzahl von E-Mail-Datensätzen trainiert werden, die von Menschen als „Spam“ gekennzeichnet sein müssen. Das sorgt für lange Übungszeiten.
Höhere Effizienz der Klassifizierung
„Unser Modell reduziert die Trainingszeiten und führt zu einer höheren Effizienz der Klassifizierung“,
verspricht Vikas Samarthrao Kadam.
Das Verfahren sei mit einer Vielzahl von Diensten kompatibel, darunter Gmail, Yahoo Mail und Outlook, muss allerdings noch weiterentwickelt werden, heißt es. Die Falsch-Positiv-Rate sei noch zu hoch. Es werden also noch zu viele „gute“ E-Mails als Spam qualifiziert und dem Empfänger vorenthalten.
Es geht zulasten der Kommunikationssicherheit, wenn wichtige E-Mails irrtümlich dem Empfänger vorenthalten werden. Es empfiehlt sich also, hin und wieder einen Blick in den Spam-Ordner zu werfen und sich nicht allein auf die Technik zu verlassen.