Dirk Deimeke am :
Ja, das halte ich für eine gute Idee.
Wenn Du es jetzt noch schaffst, den Zugriff auf das Plugin in die Kommentarbenachrichtigung zu packen, bist Du der Held! ;-)
Ja, das halte ich für eine gute Idee.
Wenn Du es jetzt noch schaffst, den Zugriff auf das Plugin in die Kommentarbenachrichtigung zu packen, bist Du der Held! ;-)
Gut, dann werd ich mich daran mal probieren.
Das gefällt mir schon sehr gut. Ich überlege gerade daran, ob es sinnvoll wäre, den Faktor mit 10 oder gar mit 100 zu multiplizieren, weil viele Leute Probleme mit "Kommazahlen" haben. Bei einer Multiplikation mit 100 könntest Du noch % dahinter schreiben ;-)
Wärs. Es verfälscht zwar ein bisschen das Prinzip, aber es spart die ganz Erklärung - eine Prozentangabe sollte intuitiv verstanden werden, wenn da "Spamfaktor" dransteht.
Ich kämpf noch ein bisschen mit der Performance. Bisher soll das alle Werte neu abfragen, wenn man einen einzelnen Kommentar bewertet. Das ist bei sehr vielen Kommentaren auf der Seite schon aufwändig. Bei 10 oder 20 ist es dagegen kein Problem.
So, die Anzeige des Spamfaktors ist fertig und die Emailbenachtigung steht. Nur musste ich den Kern anfassen, mal schauen, ob ich das Event in den Kern kriege.
Schon drin. Dann sollte das in den nächsten Tagen veröffentlicht werden können, vielleicht auch heute. Wenn kein 1.6 installiert ist, werden die Links einfach nicht angezeigt.
Ich kämpfe nur immer noch mit der Performance der Spamfaktoranzeige. Im Testblog nun auch mit 100 kein Problem, hier im Blog bei ~1000 bekomm ich Fehler - scheinbar keine Timeouts, sondern eine Einordnung läuft schief. Das stimmt also noch nicht ganz.
Lässt sich irgendetwas intelligent cachen?
Es lässt sich intelligenter abfragen, nicht jede id einzeln. Dann noch in Blöcke unterteilt, damit PHP keine Probleme bekommt. Die Timeouts waren in Wirklichkeit Fehler, die das Einordnen bestimmter Kommentare verursacht hat, der Fehler ist gefixt.
Übers Cachen habe ich heut morgen auch nachgedacht: Es ließe sich der Spamfaktor der Kommentare über die id zuordnen und dann cachen, anstatt den Kommentar zu holen und den Spamfaktor zu berechnen. Nur: Den Cache müsste man ja bei jedem Lernvorgang löschen. Ich weiß nicht, ob sich das lohnt.
Ich frage mich gerade, ob es überhaupt nötig ist, alles neu zu berechnen. Natürlich sieht es besser aus, den "Spamfaktor" mit der aktuellen Datenlage zu beurteilen, aber es gibt nicht die Datenlage bei Erstellung des Kommentars wieder.
Die Frage ist, was man möchte und wenn ich mich als potentiellen Kunden anschaue, dann beurteile ich die Kommentare in der Reihenfolge, in der sie bei mir in der Mailbox aufschlagen. Alte Kommentare sind "ham" sonst wären sie bereits gelöscht.
Alte Kommentare sind nicht unbedingt ham. Es kann ja sein, dass es eine neue Art von Spam ist, die falsch eingeordnet wurde vom Plugin, was dem Plugin abgewöhnt werden soll. Ich will ja zeigen, welchen Effekt das Lernen hatte.
Ich hab mir das nochmal angeschaut. Das Neuberechnen scheint nicht das Problem zu sein. Wenn erstmal alle Anzeigen da sind und man einen Kommentar aktualisiert, also alle Spamfaktoren neuberechnet, geht das sehr schnell. Es scheint das Hinzufügen zu sein, was die Probleme verursacht - und da hab ich keinen besseren Ansatz gefunden, aber schon gesucht.
Naja, ich werde das erstmal so veröffentlichen und mich später nochmal dransetzen.
PS: Auch ohne das Plugin verursacht das Holen der tausend Kommentare Wartezeit - und wohl Serverlast. Und dann kommen noch die zusätzlichen Anfragen hinzu. Das spielt da ja auch noch rein.
Das ist Kinderkram für eine Datenbank. Kannst Du mir bitte einmal die sql-Statements schicken, die Du benutzt.