Spamdexing - Spamdexing

Spamdexing (også kjent som søkemotor spam , søkemotor forgiftning , black-hat søkemotoroptimalisering , søke spam eller web spam ) er bevisst manipulering av søkemotoren indekser . Det innebærer en rekke metoder, for eksempel å bygge lenker og gjenta ikke -relaterte setninger, for å manipulere relevansen eller fremtredelsen av indekserte ressurser, på en måte som er uforenlig med formålet med indekseringssystemet.

Spamdexing kan betraktes som en del av søkemotoroptimalisering , selv om det er mange søkemotoroptimaliseringsmetoder som forbedrer kvaliteten og utseendet på innholdet på nettsteder og tjener innhold som er nyttig for mange brukere.

Søkemotorer bruker en rekke algoritmer for å bestemme relevansrangeringen. Noen av disse inkluderer å avgjøre om søkeordet vises i brødteksten eller nettadressen til en webside . Mange søkemotorer ser etter forekomster av spamdexing og vil fjerne mistenkte sider fra indeksene. Søkemotoroperatører kan også raskt blokkere resultatlisten fra hele nettsteder som bruker spamdexing, kanskje som svar på brukerklager over falske treff. Fremveksten av spamdexing på midten av 1990-tallet gjorde datidens ledende søkemotorer mindre nyttige. Å bruke uetiske metoder for å få nettsteder til å rangere høyere i søkemotorresultater enn de ellers ville, blir ofte referert til i SEO (søkemotoroptimalisering) -bransjen som "black-hat SEO". Disse metodene er mer fokusert på å bryte regler og retningslinjer for markedsføring av søkemotorer. I tillegg til dette risikerer gjerningsmennene at nettstedene deres blir alvorlig straffet av algoritmer for rangering av søkeresultatene Google Panda og Google Penguin .

Felles spamdexing teknikker kan deles inn i to hovedklasser: innhold spam (eller begrepet spam ) og kobling spam .

Historie

Den tidligste kjente referansen til begrepet spamdexing er av Eric Convey i sin artikkel "Porn sneaks way back on Web", The Boston Herald , 22. mai 1996, der han sa:

Problemet oppstår når nettstedoperatører laster sine nettsider med hundrevis av fremmede termer, slik at søkemotorer vil vise dem blant legitime adresser. Prosessen kalles "spamdexing", en kombinasjon av spam - internettbegrepet for å sende brukere uoppfordret informasjon - og " indeksering ".

Innholdssøppel

Disse teknikkene innebærer å endre den logiske visningen som en søkemotor har over sidens innhold. De tar alle sikte på varianter av vektorrommodellen for informasjonsinnhenting på tekstsamlinger.

Stikkord for søkeord

Søkeordstopping innebærer beregnet plassering av søkeord på en side for å øke antall søkeord, variasjon og tetthet på siden. Dette er nyttig for å få en side til å se ut som relevant for en webcrawler på en måte som gjør det mer sannsynlig at den blir funnet. Eksempel: En promoter for et Ponzi -opplegg ønsker å tiltrekke nettsurfere til et nettsted der han annonserer svindelen sin. Han plasserer skjult tekst som passer for en fan -side av en populær musikkgruppe på siden sin, i håp om at siden vil bli oppført som et fan -nettsted og motta mange besøk fra musikkelskere. Eldre versjoner av indekseringsprogrammer teller ganske enkelt hvor ofte et søkeord dukket opp, og brukte det til å bestemme relevansnivåer. De fleste moderne søkemotorer har muligheten til å analysere en side for søkeordfylling og avgjøre om frekvensen stemmer overens med andre nettsteder som er opprettet spesielt for å tiltrekke søkemotortrafikk. Store nettsider blir også avkortet, slik at massive ordlistelister ikke kan indekseres på en enkelt webside. (Spammere kan imidlertid omgå denne begrensningen på nettstørrelsen bare ved å sette opp flere nettsider, enten uavhengig eller knyttet til hverandre.)

Skjult eller usynlig tekst

Ikke-relatert skjult tekst er forkledd ved å gjøre den i samme farge som bakgrunnen, ved å bruke en liten skriftstørrelse, eller skjule den i HTML- kode, for eksempel "ingen ramme" -deler, alt-attributter , DIV -er i null størrelse og "ingen skript" -deler. Folk som manuelt screener rødflaggede nettsteder for et søkemotorfirma, kan midlertidig eller permanent blokkere et helt nettsted for å ha usynlig tekst på noen av sidene. Skjult tekst er imidlertid ikke alltid spamdeksende: den kan også brukes til å forbedre tilgjengeligheten .

Metataggfylling

Dette innebærer å gjenta søkeord i metakodene og bruke metaord som ikke er relatert til nettstedets innhold. Denne taktikken har vært ineffektiv siden 2005.

Døråpningssider

"Gateway" eller døråpningssider er websider av lav kvalitet laget med svært lite innhold, som i stedet er fylt med svært like søkeord og uttrykk. De er designet for å rangere høyt i søkeresultatene, men tjener ingen hensikt for besøkende som leter etter informasjon. En døråpningsside vil vanligvis ha "klikk her for å gå inn" på siden; automatisk videresending kan også brukes til dette formålet. I 2006 fordrev Google bilprodusenten BMW for å ha brukt "døråpningssider" til selskapets tyske nettsted, BMW.de.

Skrapersteder

Skrapesider opprettes ved hjelp av forskjellige programmer designet for å "skrape" søkemotors resultatsider eller andre innholdskilder og lage "innhold" for et nettsted. Den spesifikke presentasjonen av innhold på disse nettstedene er unik, men er bare en sammenslåing av innhold hentet fra andre kilder, ofte uten tillatelse. Slike nettsteder er vanligvis fulle av reklame (for eksempel betal-per-klikk- annonser), eller de omdirigerer brukeren til andre nettsteder. Det er til og med mulig for skrapesider å gå ut over originale nettsteder for sin egen informasjon og organisasjonsnavn.

Artikkelen snurrer

Artikkelspinning innebærer å omskrive eksisterende artikler, i motsetning til bare å skrape innhold fra andre nettsteder, for å unngå straffer pålagt av søkemotorer for duplisert innhold . Denne prosessen utføres av innleide forfattere eller automatiseres ved hjelp av en synonymdatabase eller et neuralt nettverk .

Maskinoversettelse

På samme måte som artikkelsnurr , bruker noen nettsteder maskinoversettelse for å gjengi innholdet på flere språk, uten menneskelig redigering, noe som resulterer i uforståelige tekster som likevel fortsetter å bli indeksert av søkemotorer og derved tiltrekker seg trafikk.

Lenke spam

Link spam 'er definert som lenker mellom sider som er tilstede av andre årsaker enn fortjeneste. Link spam tar fordel av lenkebaserte rangering algoritmer, som gir nettsteder høyere rangering jo flere andre høyt rangerte nettsteder lenker til den. Disse teknikkene tar også sikte på å påvirke andre lenkebaserte rangeringsteknikker som HITS-algoritmen .

Link gårder

Linkfarmer er tett sammensveisede nettverk av nettsteder som lenker til hverandre med det ene formål å utnytte søkemotorrangeringsalgoritmene. Disse er også kjent som gjensidig beundringssamfunn . Bruken av koblingsfarmer har blitt kraftig redusert med lanseringen av Googles første Panda-oppdatering i februar 2011, som introduserte betydelige forbedringer i spam-deteksjonsalgoritmen.

Private bloggenettverk

Bloggnettverk (PBN) er en gruppe autoritative nettsteder som brukes som en kilde til kontekstuelle lenker som peker til eierens hovednettsted for å oppnå høyere søkemotorrangering. Eiere av PBN-nettsteder bruker utløpte domener eller auksjonsdomener som har tilbakekoblinger fra nettsteder med høy myndighet. Google målrettet og straffet PBN -brukere ved flere anledninger med flere massive indekseringskampanjer siden 2014.

Skjulte lenker

Å sette hyperkoblinger der besøkende ikke vil se dem, brukes til å øke koblingens popularitet . Fremhevet lenketekst kan hjelpe til med å rangere en webside høyere for å matche denne setningen.

Sybil -angrep

Et Sybil -angrep er smiing av flere identiteter for ondsinnet hensikt, oppkalt etter den berømte pasienten med flere personlighetsforstyrrelser " Sybil ". En spammer kan opprette flere nettsteder på forskjellige domenenavn som alle lenker til hverandre, for eksempel falske blogger (kjent som spamblogger ).

Spamblogger

Spamblogger er blogger som er laget utelukkende for kommersiell markedsføring og passering av lenkeautoritet til målnettsteder. Ofte er disse "sploggene" utformet på en misvisende måte som vil gi effekten av et legitimt nettsted, men ved nøye inspeksjon vil det ofte bli skrevet med spinningprogramvare eller være veldig dårlig skrevet med knapt lesbart innhold. De er av lignende natur for å knytte gårder.

Gjesteblogg spam

Gjestebloggsøppel er prosessen med å plassere gjesteblogger på nettsteder med det ene formål å få en lenke til et annet nettsted eller nettsteder. Dessverre forveksles disse ofte med legitime former for gjesteblogging med andre motiver enn å plassere lenker. Denne teknikken ble berømt av Matt Cutts , som offentlig erklærte "krig" mot denne formen for lenkesøppel.

Kjøper utløpte domener

Noen lenkespammere bruker utløpt domenesøkeprogramvare eller overvåker DNS -poster for domener som snart utløper, så kjøper de dem når de utløper og erstatter sidene med lenker til sidene. Det er imidlertid mulig, men ikke bekreftet at Google tilbakestiller koblingsdataene på utløpte domener. For å opprettholde alle tidligere Google -rangeringsdata for domenet, anbefales det at en kjøper tar tak i domenet før det "slippes".

Noen av disse teknikkene kan brukes for å lage en Google -bombe - det vil si å samarbeide med andre brukere for å øke rangeringen av en bestemt side for en bestemt spørring.

Fylling av informasjonskapsler

Cookie -fylling innebærer å plassere en tilknyttet sporingskake på en besøkendes datamaskin uten deres kunnskap, som deretter vil generere inntekter for personen som lager informasjonskapslen. Dette genererer ikke bare uredelig salg av tilknyttede selskaper, men har også potensial til å overskrive andre datterselskapers informasjonskapsler, og i hovedsak stjele deres legitimt opptjente provisjoner.

Bruke verdensskrivbare sider

Nettsteder som kan redigeres av brukere kan brukes av spamdexers til å sette inn lenker til spam-nettsteder hvis passende tiltak mot spam ikke iverksettes.

Automatiske spambots kan raskt gjøre den brukerredigerbare delen av et nettsted ubrukelig. Programmerere har utviklet en rekke automatiserte spamforebyggende teknikker for å blokkere eller i det minste bremse spambots.

Spam i blogger

Søppelpost i blogger er å plassere eller oppfordre til lenker tilfeldig på andre nettsteder, og plassere et ønsket søkeord i hyperkoblede teksten til den inngående lenken. Gjestebøker, forum, blogger og ethvert nettsted som godtar besøkendes kommentarer er bestemte mål og er ofte ofre for drive-by-spamming der automatisert programvare lager tullinnlegg med lenker som vanligvis er irrelevante og uønskede.

Kommenter spam

Kommentarer spam er en form for lenke spam som har oppstått på nettsider som tillater dynamisk brukerredigering som wikier , blogger og gjestebøker . Det kan være problematisk fordi agenter kan skrives som automatisk velger tilfeldig en brukerredigert nettside, for eksempel en Wikipedia -artikkel, og legger til søppelpostkoblinger.

Wiki spam

Wiki -spam er når en spammer bruker wiki -systemers åpne redigerbarhet for å plassere lenker fra wikisiden til spam -nettstedet.

Referrerlogg spam

Referansespam finner sted når en spam -gjerningsmann eller tilrettelegger får tilgang til en webside ( dommeren ), ved å følge en lenke fra en annen webside ( henviseren ), slik at dommeren får adressen til henviseren av personens nettleser. Noen nettsteder har en henvisningslogg som viser hvilke sider som lenker til nettstedet. Ved å ha en robot tilfeldig tilgang til mange nettsteder tilstrekkelig mange ganger, med en melding eller spesifikk adresse gitt som henviser, vises den meldingen eller Internett -adressen i henvisningsloggen til de nettstedene som har henvisningslogger. Siden noen nettsøkemotorer baserer viktigheten av nettsteder på antall forskjellige nettsteder som linker til dem, kan henvisningslogg-spam øke søkemotorrangeringene til spammers nettsteder. Nettstedsadministratorer som legger merke til henvisningsloggoppføringene i loggene sine, kan også følge lenken tilbake til spamens henviserside.

Motforanstaltninger

På grunn av den store mengden spam som ble lagt ut på nettsteder som kan redigeres av brukeren, foreslo Google en "nofollow" -tagge som kunne være innebygd med lenker. En lenkebasert søkemotor, for eksempel Googles PageRank- system, vil ikke bruke lenken til å øke poengsummen til det koblede nettstedet hvis koblingen bærer en nofollow-tag. Dette sikrer at spam-lenker til brukerredigerbare nettsteder ikke vil øke nettstedets rangering med søkemotorer. Nofollow brukes av flere store nettsteder, inkludert Wordpress , Blogger og Wikipedia .

Andre typer

Speil nettsteder

Et speilnettsted er hosting av flere nettsteder med konseptuelt lignende innhold, men som bruker forskjellige nettadresser . Noen søkemotorer gir en høyere rangering til resultater der søkeordet du søkte etter vises i nettadressen.

URL -omdirigering

URL -omdirigering er å ta brukeren til en annen side uten vedkommendes intervensjon, f.eks . Ved å bruke META -oppdateringskoder , Flash , JavaScript , Java eller server -omdirigeringer . Men 301-viderekobling , eller permanent redirect, ikke anses som en ondsinnet atferd.

Tilsløring

Cloaking refererer til noen av flere måter å betjene en side til søkemotoren edderkopp som er forskjellig fra den som er sett av menneskelige brukere. Det kan være et forsøk på å villede søkemotorer angående innholdet på et bestemt nettsted. Tilsløring kan imidlertid også brukes til etisk å øke tilgjengeligheten til et nettsted for brukere med nedsatt funksjonsevne eller gi menneskelige brukere innhold som søkemotorer ikke kan behandle eller analysere. Det brukes også til å levere innhold basert på en brukers plassering; Google bruker selv IP -levering , en form for tildekking, for å levere resultater. En annen form for tilsløring er kodebytte , det vil si optimalisering av en side for topprangering og deretter bytte av en annen side i stedet når en topprangering er oppnådd. Google omtaler denne typen viderekoblinger som Sneaky Redirects .

Motforanstaltninger

Utelatelse av sider etter søkemotor

Søppelmessige sider blir noen ganger eliminert fra søkeresultatene av søkemotoren.

Utelatelse av siden av brukeren

Brukere kan bruke søkeoperatorer for filtrering. For Google vil et søkeord som går foran "-" (minus) utelate nettsteder som inneholder søkeordet på sidene eller i nettadressen til sidene fra søkeresultatet. Som et eksempel vil søket "-<uønsket nettsted>" eliminere nettsteder som inneholder ordet "<uønsket nettsted>" på sidene og sidene hvis URL inneholder "<uønsket nettsted>".

Brukere kan også bruke Google Chrome -utvidelsen "Personal Blocklist (by Google)", lansert av Google i 2011 som en del av mottiltak mot innholdsbruk . Via utvidelsen kan brukere blokkere en bestemt side eller et sett med sider fra å vises i søkeresultatene. Fra og med 2021 ser det ut til at den opprinnelige utvidelsen er fjernet, selv om lignende funksjonelle utvidelser kan brukes.

Se også

Referanser

Eksterne linker