Spamblock-Bayes 0.4.4: Troja
Sonntag, 8. Januar 2012
Zu den xmlrp hooks habe ich Dir vorhin ne Antwort geschrieben.
Ansonsten wäre genau Dein Changelog meine nächste Frage gewesen: Hatte gestern im Papierkorb 3 Spams markiert und dann löschen betätigt, danach waren alle weg, was etwas übel war, da ich die anderen noch gar nicht angesehen hatte. Mit der Version ist das nicht mehr so? Habe bei mir prod. noch die von mir gepatchte Version am Start..
Ansonsten läuft Bayes bei mir schon seit Tagen sehr zuverlässig. Habe ihm am Anfang ca.20 Spam Kommentare zum Lernen gegeben (und die restlichen guten im Blog). Seit dem verschiebt es 3-5 Mal / Stunde Spam in den Papierkorb. Bisher kein False und nur einen musste Akismet abfangen. Ziemlich gut!
Ich sehe im Code zwar Stellen für Troja, aber kann das nirgends konfigurieren? War das so gewollt? :)
So, ich habe bei mir produktiv nun auch mal die aktuelle Version von Dir drin. Ich kann berichten: Das obige Problem ist tatsächlich gefixt. Prima!
Ich kann nun einzelne SPAMs im Papierkorb markieren, dann werden nur diese gelöscht. Allerdings habe ich auch "Als SPAM lernen" angeschaltet. Zumindest der Name des gelöschten SPAM Eintrags wurde nicht gelernt, er erscheint nicht nebenan im Reiter "Datenbank".
Außerdem wird da im Datenbank- und Papierkorb-Fenster wohl jeweils ein Javascript ausgeführt. Da bei mir in beiden Fenstern recht viele Einträge sind, blockiert durch dieses JS der Browser, im Falle des Papierkorbs wurde ich sogar schon gefragt, ob ich das blockierende Skript abbrechen möchte. Was tun die Skripte da und kann man die evtl auch optional machen? Evtl wäre in den beiden Fenstern auch ein Paging oder Sucheingaben sinnvoll, um den Output überschaubarer zu halten.
Eben sehe ich auch, dass Troja offenbar nicht in der Konfiguration sondern im Import zu finden ist. Wenn ich mein Blog bei Troja anmelde, bekomme ich die Meldung "Could not register this blog (already registered?)". Ich habe zu, ersten Mal auf diese Option geklickt. Bei Import bekomme ich als Meldung "Got no target to import from".
Kommando zurück: Es wird gelernt!
Es ist nur nicht im DB Fenster zu sehen, die Einträge sind aber in der Datenbank! Offenbar limitierst Du (oder irgendetwas) die Anzahl der dargestellten Tokens.
Scheint also alles zu funktionieren. Würde mich freuen, wenn wir noch die xml-rpc Konfigurationen einschalten könnten und der Zugriff auf "Troja" dann noch funktionieren würde. :)
Nebenbei: Tolles Plugin! Findet bei mir sehr gut* den SPAM! :)
>Eben sehe ich auch, dass Troja offenbar nicht in der Konfiguration sondern im Import zu finden ist. Wenn ich mein Blog bei Troja anmelde, bekomme ich die Meldung "Could not register this blog (already registered?)". Ich habe zu, ersten Mal auf diese Option geklickt. Bei Import bekomme ich als Meldung "Got no target to import from".
Bei mir geht es auch nicht. Wahrscheinlich ist der Server gerade down.
> Was tun die Skripte da und kann man die evtl auch optional machen?
In der Datenbank die Farbkodierung, beim Papierkorb das Kürzen.
> Evtl wäre in den beiden Fenstern auch ein Paging oder Sucheingaben sinnvoll, um den Output überschaubarer zu halten.
Ja, Pagination wäre auf jeden Fall sinnvoll. Dann bräuchte man sie auch nicht optional zu machen.
> Nebenbei: Tolles Plugin! Findet bei mir sehr gut den SPAM! :)
Das freut mich :)
Wegen den xmlrpc-Optionen: Ich finde es immer noch unintuitiv, solche Optionen im Bayes-Plugin zu haben. Ich denke, dass das nur sehr wenige Menschen brauchen werden und dafür die Konfiguration unproportional größer wird. Was anderes wäre es, wenn wir bei den Konfigurationen mehr Ordnungsmöglichkeiten hätten (im Zweifel Tabs). So tendiere ich immer noch dazu, mit approved->ham und spam->spam zu arbeiten und das so festzuschreiben.
Vielen Dank für deine Rückmeldungen.
Eine andere Möglichkeit zum xmlrpc:
Mache es so, wie Du es beschrieben hast. Also nur auf approved = HAM und spam = SPAM reagieren.
Ich lasse dann im xmlrpc Plugin definieren, wann diese beiden Events gefeuert werden. Da passt diese Konfiguration wirklich besser hin.
Deal? :)
Nein, moment.. Damit das Sinn macht, muss es einen SPAM und einen HAM Event geben. Also nicht auf approved reagieren.
Ich schicke dann HAM, wenn bei mir Approved wird (oder eben nicht, wenn der User das nicht einstellen möchte)
Events, die ich somit also verschicken werde, sind:
xmlrpc_comment_spam
xmlrpc_comment_ham
Auf beide reagieren. Ich verschicke sie nur unter en Bedingungen, die der Anwender im xmlrpc eingestellt hat. Die anderen beiden Events werde ich nicht mehr verschicken (approved und pending). Ich denke, so ist das dann rund. :)
Ich würde bei SPAM übrigens so darauf reagieren, wie es bei Dir eingestellt ist. Wenn der User also eingestellt hat, dass das in den Papierkorb soll, dann würde ich bei Dir verschieben.
Da Du meinen Commit Comment nicht beantwortet hast, habe ich mal den Fix zum Analyse Fenster eingespielt und den auskommentierten xml-rpc code angepasst (weiterhin auskommentiert, aber schon mit Code, wie ich denke, dass er richtig sein müsste).
Kleine Code Änderungen (2 relevante Zeilen), da es aber ein Bug war, habe ich das jetzt mal gefixt.
Ok. Das mit den xmlrpc-Events klingt nach "so soll es sein" :)
Das mti dem Analyse-Fenster hat meiner Ansicht nach nicht geeilt, ist aber ok so.
xmlrpc: Jap, denke auch. Mache ich dann mal bei mir fertig für meine Betas.
github: Habe auch noch nicht die Version angehoben, das bleibt dann Dir überlassen. :)
Ich hab's jetzt (ebenfalls erst nach mehreren Anläufen) anscheinend geschafft, yellowled.de einzutragen – beim Import sagt mir das Plugin jedoch: „Imported from http://localhost/“. Soll das so sein?
Insgesamt finde ich, die Troja-Anbindung gehört in die Plugin-Optionen und dürfte dort gern etwas ausgiebiger dokumentiert sowie generell gesprächiger sein, gerade für unbedarfte Benutzer.
Ansonsten: Cool, cool, cool. Saubere Arbeit! :)
>...beim Import sagt mir das Plugin jedoch: „Imported from http://localhost/“. Soll das so sein?
Nein, natürlich nicht. Das muss ich wohl aus der datenbank rausschmeißen und vll blacklisten. Vielleicht ist das durch meinen lokalen Testblog reingekommen.
Das mot den Optionen: wirklich? Kommt mir da so fehl am Platz vor, weil man ja nichts einstellt, sondern eine Aktion durchführt.
>Ansonsten: Cool, cool, cool. Saubere Arbeit! :)
:-)
Ich hab's zunächst in den Optionen gesucht. Ob ich ein typischer Nutzer bin oder nicht, ist eine andere Frage. ;-)
Ging mir genauso.. Wunderte mich auch erst, warum da nichts in den Optionen ist, kam erst deutlich später darauf, dass das evtl. in dem separaten Bayes Tab untergebracht ist.



Das Serendipity Bayes Plugin, das Kommentar- und Trackback Spam aus dem Blog entfernen kann, ist schon etwas älter. Schon 2009 berichteten Dirk, Robert und Matthias darüber. Bayessches Filter – WikipediaDas (auch: der) bayessche Filter (auch al
Aufgenommen: Jan 11, 13:53
So da meine Seite nun wieder in den Suchmaschinen gelistet ist, davor hatte ich noindex in der index.html geschaltet, da ich eigentlich vor hatte die Seite entgültig zu schließen. Steigt natürlich auch das Spam aufkommen, da mir aber Captchas zu wieder
Aufgenommen: Jul 01, 21:08