B8 ist die Grundlage des Spamblock-Bayes-Filters, hat aber eine Grundannahme, die in Blogs nicht zutrifft: In alle Felder werde manchmal mehr oder weniger das gleiche eingefüllt. So etwas kann bei uns jedoch ausgeschlossen werden, wenn eine gültig erscheinende Email gefordert wird (wovon die Bots ausgehen).
Zu unterscheiden zwischen den Eingaben im Kommentartext, der Namenseingabe und allen anderen Feldern sollte also grundsätzlich etwas besser abschneiden als die Bewertung des zusammengenommen Kommentars ohne Unterscheidung. Es wird keine Wunder bewirken, weil diese Eingaben auch vorher schon im bewerteten Text landeten. Aber es könnte helfen, Ham eher als Ham zu erkennen.
Was derzeit aber noch komplett ignoriert wird ist die IP-Adresse. Die dürfen wir in Deutschland vielleicht nicht unbedingt speichern, in anderen Ländern aber schon, deshalb sollte das Plugin dies können. Ich könnte mir vorstellen, dass wenn man die zusätzlich in die Bewertung einfließen lässt, ohne daraus eine IP-Sperre zu machen, die Bewertung dadurch nochmal genauer wird.
Leider wird das alles nicht dazu beitragen, das Plugin schneller zu machen - Lernen und Bewerten wird aufwändiger. Wenn aber die Ergebnisse genauso besser werden, wird es das wert sein.