2004-09-26
 
DEN HAAG - Troosteloos, druilerig, grijs. Goede dag om zelfmoord te plegen ofzo. Maar voor vandaag heb ik gepland om mijn kamer te reinigen, m'n kleren te wassen en nog wat software te schrijven.

En om hard te lopen natuurlijk! Ik heb al een week niet meer gerend; het slechte weer en de vroegere duisternis zijn de voornaamste redenen. Maar vandaag heb ik heerlijk gerend, ongeveer drie kwartier. Niet te warm, niet te koud, muziekje erbij. Ik voel me erg energiek!

Dinsdag vieren meer dan een miljard Chinezen het z.g. Maanfestival (zhong-qiu-jue); de oorsprong van het feest is niet helemaal duidelijk, maar de Chinezen zoeken hun familie op en eten zg. mooncakes. Hiernaast een foto van zulke mooncakes die een van mijn Chinese correspondenten mij stuurde.

De Aziatische voorliefde voor kitsch is ook duidelijk zichtbaar in het plaatje.

hellebaard

Ik beluisterde Nederlandstalige black metal van Hellebaard. Wel een tikje moeilijk verstaanbaar natuurlijk - alsof je in een zaagfabriek iemand wilt verstaan die met een sok in z'n mond praat. Maar met de teksten erbij gaat het nog net:
Vreemde volkeren, bedreigen onze grenzen
Plunderen en moorden, onze mensen
Bedreigen onze eer en trots
Wraak zal hun deel zijn, dezen plicht is ons
Laten wij onze strijdkracht gelden
Bloed zal vloeien, over de velden
(uit: Strijdkracht)
De teksten zijn vaderlandslievend met verwijzigingen naar het verleden, maar is niet politiek geinspireerd, zo stelt men. En tja, black metal...
The black metal scene gained some unasked-for mass media attention in 1990 when Mayhem's frontman Dead committed suicide by a shotgun blast to his head. His note simply read "Excuse all the blood". His body was discovered by Aarseth who, instead of calling the police, ran to a nearby convenience store and bought a disposable camera which he used to photograph the corpse for a future Mayhem album cover.

spam

Het lijkt erop alsof ik alleen maar *meer* spam ontvang... Zonder automatische filtering is mijn email totaal onbruikbaar geworden (50 spamberichten per dag). Gelukkig zijn er programma's die mij kunnen helpen. Er zijn veel verschillende technieken bedacht om spam als zodanig te herkennen. Voor een mens is het (bijna altijd) direct duidelijk dat een bericht een spambericht is, maar voor een computer is dat niet altijd direct duidelijk. Nog vervelender is het, wanneer een valide email ten onrechte als spam wordt aangemerkt.

spamassassin

Ik gebruikte altijd Spamassassin; het programma bekijkt of een mailbericht een aantal standaard kenmerken van spam bezit, en geeft punten voor elk kenmerk. Als een bericht dan boven een bepaald aantal punten komt, wordt het geclassificeerd als spam. Een spambericht krijgt bijvoorbeeld de volgende score:
 pts rule name              description
---- ---------------------- --------------------------------------------------
 0.0 FROM_WEBMAIL_END_NUMS6 Van adres is webmail, maar eindigt met een nummer
 1.8 SUBJECT_DRUG_GAP_VIA   Subject contains a gappy version of 'viagra'
 0.2 NO_REAL_NAME           Van: bevat geen echte naam
 0.5 FROM_ENDS_IN_NUMS      Van: eindigt in nummers
 0.3 FROM_NUM_AT_WEBMAIL    Van adres is webmail, maar begint met een nummer
 0.7 ADDR_NUMS_AT_BIGSITE   Gebruikt een adres met veel nummer bij een grote internet provider
 1.5 FROM_STARTS_WITH_NUMS  Van: begint met nummers
 1.7 MSGID_FROM_MTA_ID      Message-Id for external message added locally
 1.5 RCVD_NUMERIC_HELO      Received: bevat een numerieke HELO
 1.1 FORGED_HOTMAIL_RCVD2   hotmail.com 'Van' adres, maar geen 'Received:'
 1.8 MORE_SEX               BODY: Talks about a bigger drive for sex
 0.8 IMPOTENCE              BODY: Medicijn voor impotentie
 0.1 HTML_30_40             BODY: Bericht is 30% tot 40% HTML
 0.0 HTML_MESSAGE           BODY: HTML opgenomen in het bericht
 0.2 HTML_FONT_BIG          BODY: HTML heeft een groot lettertype
 1.2 MIME_HTML_ONLY         BODY: Bericht bestaat enkel uit text/html MIME delen
 0.1 HTML_FONT_INVISIBLE    BODY: HTML tekstkleur is gelijk aan de achtergrondkleur
(...)
Ruim voldoende om als spam aangemerkt te worden! De spammers weten dat natuurlijk ook, en naarmate meer mensen spamfilters gebruiken, wordt het voor hen noodzakelijk om slimmer te zijn, en hun berichten er "echter" uit te laten. Deze manier van het bestrijden van spam werd daarom minder effectief...

crm114

Maar uiteindelijk willen spammers natuurlijk iets verkopen; op de een of andere manier moeten bepaalde woorden in het mailtje voorkomen om mij duidelijk te maken wat ik kan kopen, en waar.

Natuurlijk is het mogelijk dat iemand mij een echt mailtje stuur met woorden als mortgage, enlargement etc., en dat bericht moet dan natuurlijk niet als spam worden aangemerkt. In het artikel A plan for Spam beschrijft Paul Graham hoe dat kan. Als er bijv. viagra in een mailtje staat is er een behoorlijke kans dat het spam is, maar als er ook mijn voornaam in staat toch niet. Het programma leert de verschillende woorden die wel / niet in e-mail mogen voorkomen. De gebruiker corrigeert het programma voor foutief geclassificeerde berichen - en het programma wordt steeds slimmer, en maakt steeds minder fouten. Programma's die dit doen (op wat subtiel verschillende manieren) zijn bijvoorbeeld crm114 (dat ik gebruik) en bogofilter, en dit werkte geruime tijd behoorlijk goed.

Maar spammers zitten natuurlijk ook niet stil; ze voegen reeksen willekeurige woorden ("onzichtbaar") in de email om het mechanisme te omzeilen; wat ik eerder al dadaïstische poezie noemde:

biota inverse baneberry apologetic hemlock benthic ranier heresy lollipop
blockage pale homework mesopotamia airway megabyte piety chug workmanlike
treat he'll acquitting cinder audacious cohere northeast vanity than
impugn pot continua aural desultory attic tremulous editorial blake
caution quote
En zo lukt het alsnog spamberichten door alle filters te krijgen. *zucht*

spamassassin 3

Maar nu is er spamassassin versie 3, en die doet standaard een extra stap: er wordt gekeken of iemand anders het bericht misschien al als spam gekenschetst heeft. Er is een aantal servers op internet die bijhouden wie spam versturen. En aangezien er in spamberichten meestal een URL staat waar je die viagrapillen, penisverlengingen, PhD's, hypotheken etc. etc. kunt bestellen, kan dat adres ook gebruikt worden:
 pts rule name              description
---- ---------------------- --------------------------------------------------
(...)
 0.4 DNS_FROM_RFC_ABUSE     RBL: Envelope sender in abuse.rfc-ignorant.org 
 1.0 RCVD_IN_NJABL_PROXY    RBL: NJABL: verzender is een open proxy
                            [202.131.132.195 listed in combined.njabl.org]
 2.5 RCVD_IN_XBL            RBL: Ontvangen via een relay die gevonden is in Spamhaus XBL
                            [202.131.132.195 listed in sbl-xbl.spamhaus.org]
 2.8 RCVD_IN_DSBL           RBL: Ontvangen via een relay die gevonden is in list.dsbl.org
                            []
 1.8 RCVD_IN_BL_SPAMCOP_NET RBL: Ontvangen via een relay die gevonden is in bl.spamcop.net
             [Blocked - see ]
 0.6 URIBL_SBL              Contains an URL listed in the SBL blocklist
                            [URIs: downloadfour.com]
 2.0 URIBL_AB_SURBL         Contains an URL listed in the AB SURBL blocklist
                            [URIs: downloadfour.com]
 0.5 URIBL_WS_SURBL         Contains an URL listed in the WS SURBL blocklist
                            [URIs: downloadfour.com]
 3.9 URIBL_SC_SURBL         Contains an URL listed in the SC SURBL blocklist
                            [URIs: downloadfour.com]
 4.1 RCVD_DOUBLE_IP_SPAM    Bulk email vingerafdruk (dubbel IP) gevonden
De laatste dagen is er geen spambericht meer doorgekomen en geen non-spambericht tegengehouden - ook belangrijk! Hoelang zal het duren tot de spammers een nieuwe ronde starten in de wapenwedloop? Of misschien besluiten ze wel dat als ik zoveel moeite doe om die berichten niet te ontvangen, ik misschien niet geinteresseerd ben?!

misc

mangosauce

Ik linkte al eerder aan deze site, maar dit is echt hilarisch: Pervert stalks Thai girls on Bangkokchat (tip: MartinH). Veel herkenbaars op die site... you take care me - i wait you...

</bush>

Volgens een opinieonderzoek in opdracht van NOVA zou de helft van de Nederlanders op John Kerry stemmen, en slechts 9% op Bush. Maar, verrassing, Nederlanders mogen helemaal niet stemmen op de Amerikaanse president! Bij NOVA heeft men een zo grote hekel aan Bush, dat elk kleine nieuwsberichtje dat negatief is voor Bush als item wordt gebracht. En als er geen nieuwsberichten zijn is er altijd nog wel een onbekende stand-up comedian of wat mensen op straat die wat willen zeggen - en weer een halve Nova gevuld met de boodschap "Bush is een lul". En nu maar weer een onzinnige enquete, zucht.

Nu ben ik persoonlijk geen aanhanger van Bush (of van John Kerry), maar wordt een beetje kregelig van de opgelegde mening van het met belastinggeld betaalde NOVA... Voorlopig lijken de Amerikanen zelf nog niet echt wakker te liggen van wat NOVA vindt (JK:217 - B:311).

gmail

Laat ik mijn altruïstische plicht vervullen; wie wil er een gmail-account? Ik heb er nog een stuk of vijf, die volgens het FIFO-principe worden verstrekt :-) Stuur maar een mailtje.

0 Reacties:

Een reactie plaatsen


Emacs, the UberEditor Powered by Blogger