zaterdag 16 augustus 2014

Het bestrijden van spam

Dagelijks worden er miljoenen onnodige pagina’s vol spam gecreëerd en we kunnen spam te lijf gaan met een samenvoeging van computerberekeningen en manuele controles. Websites gebaseerd op spam proberen hoog in de zoekresultaten te komen door middel van manieren zoals zoektermen meerdere malen te gebruiken, links aanschaffen die een hogere ranking hebben of een verborgen tekst op het beeldscherm plaatsen. Dit is niet bevorderlijk voor de zoekfunctie omdat de belangrijke sites zo niet zichtbaar worden én het is schadelijk voor legitieme eigenaren van websites omdat het lastiger wordt om hun websites vindbaar te maken.


Goed nieuws is echter dat de berekeningen van Google vrijwel elke spam kunnen opsporen en deze meteen naar een lagere ranking kunnen verplaatsen. Voor het overige hebben we medewerkers die websites stuk voor stuk beoordelen.


Het herkennen van spam

Websites gebaseerd op spam zijn er in elke vorm en maat die je maar kunt bedenken. Enkele van deze websites bevatten onzin die automatisch is gegenereerd en voor bezoekers niet te lezen is. Er zijn uiteraard ook websites die meer subtiele spamtechnieken toepassen. Hieronder zie je enkele voorbeelden van ‘pure spam’ op websites die de meest hardnekkige spamtechnieken hanteren.


Dit zijn een aantal live illustraties van spam die we persoonlijk hebben gevonden en recentelijk hebben weggehaald zodat we deze spam niet meer tegenkomen in de zoekresultaten. We hebben de inhoud die pornografie en malware bevatte uit deze video gehaald, maar verder is dit een ongefilterde samenvatting van recente Engelse voorbeelden van weggehaalde ‘pure spam’.


Soorten spam

Naast de eerdergenoemde spam hebben we ook andere soorten spam opgespoord waartegen we optreden.


Meer informatie over spam

Cloaking en/of verborgen omleidingen: de site lijkt last te hebben van cloaking (niet dezelfde content laten zien aan gebruikers dan aan zoekmachines) of het terugbrengen van gebruikers naar een andere pagina dan die Google zag.


Gehackte site: enkele webpagina’s op deze website zijn waarschijnlijk gehackt door derden om content of links met spam te laten zien. Eigenaren van websites moeten meteen in verzet komen om hun websites weer schoon te maken en mogelijke problemen omtrent de beveiliging op te lossen.


Niet-zichtbare tekst en/of buitensporig gebruik van zoektermen: enkele webpagina’s kunnen onzichtbare tekst en/of overdreven gebruik van zoektermen bevatten.


Geparkeerde domeinen: geparkeerde domeinen zijn placeholdersites met vrijwel geen authentiek content dus Google neemt ze vrijwel nooit op in de zoekresultaten.


Alleen maar spam: deze websites gebruiken hardnekkige spamtechnieken, zoals automatisch gegenereerde onzin, cloaking, content van andere sites en/of andere, opnieuw gebruikte of serieuze, schendingen van de voorschriften voor webmasters van Google.


Kosteloze hosts en gedreven DNS-providers met nogal wat spam: deze website wordt gehost door een kosteloze hostingdienst of gedreven DNS-aanbieder met content waarvan het wemelt van de spam.


Minimale inhoud met weinig of geen meerwaarde: deze site lijkt opgebouwd te zijn uit pagina’s van mindere kwaliteit of nietszeggende pagina’s die de gebruiker geen meerwaarde bieden (zoals partnerpagina’s met vrijwel geen content, doorway pages, overgenomen sites, automatisch gegenereerde content of overgenomen content).


Onechte links van een website: Google heeft op deze website een model van niet-natuurlijke, artificiële, verwarrende of beïnvloedende links opgespoord. Dit kan de einduitkomst zijn van het verkopen van links met een hoge ranking of participatie aan linkprogramma’s.


Kunstmatige links naar een website: Google heeft een model van niet-natuurlijke, artificiële, verwarrende of beïnvloedende links opgespoord die naar deze website leiden. Dit kan de einduitkomst zijn van het aanschaffen van links met een hoge ranking of participatie aan linkprogramma’s.


Spam gegenereerd door gebruikers: deze website schijnt door de gebruiker gegenereerde content met nogal wat spam te bevatten. De content waaruit problemen ontstaan wordt eventueel afgebeeld op forumpagina’s, pagina’s in gastenboeken of gebruikersprofielen.


Het ondernemen van stappen: hoewel onze berekeningen bijna alle spam verwijderen, gaan wij de resterende spam te lijf om ervoor te zorgen dat het invloed heeft op het niveau van je eindresultaten. Dit schema geeft het aantal domeinen weer dat manueel bewerkt is in een afgebakende tijdspanne. Het schema is opgedeeld in diverse soorten spam. Het aantal kan erg veel lijken zonder kader, maar het web is ook heel erg groot. Een nieuwe beschouwing op ons schema gaf weer dat bijna 0,22 procent van de domeinen persoonlijk is gemarkeerd voor eliminatie.




Het bestrijden van spam

Geen opmerkingen:

Een reactie posten