Hace unos días generé una tabla teniendo en cuenta las reversiones realizadas por AVBOT durante 63 días entre el 20 de febrero y 3 de mayo de 2010 (algunos de los cuales estuvo inactivo por mantenimiento).
En este periodo, AVBOT intervino 29157 veces. Las 560 expresiones regulares que aparecen se dispararon al menos una vez en ese intervalo, y en total se activaron 39435 veces.
La más frecuente es p+[^a-z0-9]{,3}u+[^a-z0-9]{,3}t+[^a-z0-9]{,3}[ao]+[^a-z0-9]{,3}s* (puta y derivados) con un 8,2%. El 50% de los vandalismos revertidos por AVBOT queda cubierto con las 19 primeras expresiones regulares. El 75% con las 56 primeras. El 90% con las 149 primeras. El 95% con las 224 primeras. Y el 99% con las 375 primeras.
Como podeis comprobar, los vándalos no se caracterizan por tener una gran creatividad, de ahí que se dediquen a destruir en vez de a mejorar lo existente.
sábado, 8 de mayo de 2010
sábado, 3 de abril de 2010
Optimización y expansión a otros proyectos
Durante las últimas semanas he estado haciendo algunas optimizaciones en el código de AVBOT que han permitido que se reduzca el tiempo que tarda en reparar los vandalismos. Antes tardaba una media de cinco segundos, habiéndose reducido a tres en la versión actual (cálculos grosso modo, ya haré una gráfica). Ha sido posible, de nuevo, al empleo de hilos.
Además, AVBOT está siendo probado en la versión inglesa de Wikipedia, y hay un usuario interesado en llevarlo a Wikipedia en portugués. Por todo ello, estoy haciendo algunos avances en cuanto a la versatilidad del código. Pero aun no está internacionalizado, ¡eso será más adelante!
Más información sobre todo esto en sucesivas entradas.
Además, AVBOT está siendo probado en la versión inglesa de Wikipedia, y hay un usuario interesado en llevarlo a Wikipedia en portugués. Por todo ello, estoy haciendo algunos avances en cuanto a la versatilidad del código. Pero aun no está internacionalizado, ¡eso será más adelante!
Más información sobre todo esto en sucesivas entradas.
jueves, 11 de marzo de 2010
AVBOT in English
For a detailed description in English, see AVBOT: Detecting and fixing Vandalism in Wikipedia. CEPIS UPGRADE Vol. XII, No. 3, July 2011, pp. 67-70 (PDF link)
AVBOT is an anti-vandalism bot for Wikipedia projects (although it would be useful for all MediaWiki sites).
Its main developer is emijrp, a veteran user of Spanish Wikipedia. This project is in an advanced status, and it is used in Spanish Wikipedia under the nickname AVBOT with great results. You can see it running 24/7 or some of its clones. It has reverted more than 250,000 vandalisms.
You can download the source code from Google Code, it is published under GPL v3 license. It uses the pywikipediabot and python-irclib libraries.
domingo, 14 de febrero de 2010
AVBOT ha alcanzado las 500.000 ediciones
Hace pocos días AVBOT alcanzó las 500.000 ediciones. Como siempre, la mitad han sido reversiones de vandalismos y la otra mitad avisos a usuarios. Ha pasado casi un año desde el concurso, y AVBOT sigue trabajando sin descanso las 24 horas del día.
Me gustaría incorporarle algunas mejoras, pero eso será cuando disponga de algo más de tiempo.
Actualización: Para ser justos, diré que ayer calculé el número exacto de intervenciones de AVBOT (reversiones de vandalismos, blanqueos y ediciones de prueba) y salió 197.000. Así que no llega a los 250.000 como dije, pero va de camino ;).
Actualización 2: Hoy, 18 de marzo de 2010, AVBOT ha superado a CEM-bot (ver diff), el bot de correcciones ortográficas, colocándose en el segundo puesto, sólo por detrás de "Muro Bot".
Me gustaría incorporarle algunas mejoras, pero eso será cuando disponga de algo más de tiempo.
Actualización: Para ser justos, diré que ayer calculé el número exacto de intervenciones de AVBOT (reversiones de vandalismos, blanqueos y ediciones de prueba) y salió 197.000. Así que no llega a los 250.000 como dije, pero va de camino ;).
Actualización 2: Hoy, 18 de marzo de 2010, AVBOT ha superado a CEM-bot (ver diff), el bot de correcciones ortográficas, colocándose en el segundo puesto, sólo por detrás de "Muro Bot".
Suscribirse a:
Entradas (Atom)