Vores site er klonet – hvad nu?

Der er kommet en del produkter på markedet der gør det nemt at klone et komplet site. Det er der flere suspekte virksomheder, der udnytter til forskellige formål.

Sådan forhindres kloning

Kloning kan desværre ikke forhindres 100%, men nedenstående metoder gør det meget svært at klone dit site

  1. Udeluk scrapebots via  robots.txt. Se sektionen # PROTECT FROM CLONER: https://inboundcph.dk/robots.txt .Denne metode gør det lidt mere besværligt for scrape software, men kan sagtens omgåes.
  2. Langt de fleste scrapere kommer fra udenlandske IP adresser.

    1. Lav en redirect for alle besøgende der ikke kommer fra lande der ikke er kernemarkeder og send dem over til en side med Captcha. Her er det VIGTIGT at du ikke udelukker Googlebot, Facebook (USA) mv. – her kan du se de lokationer Googlebot benytter: https://royal.pingdom.com/2008/04/11/map-of-all-google-data-center-locations/

    2. Sætte et crawl limit fra et ip nummer, og når dette crawl limit er nået, så gør sitet langsomt, man skal blot lige huske ikke at gøre det med Googlebot, så går det helt galt.
  3. Når en bruger har set eksempelvis 30 sider indenfor 2 minutter, så sæt en captcha op. 
  4. Bloker særlige IP numre, dette kan gøre ved at kigge i den fysiske log fil og lede efter IP numre som har set eksempelvis mere end 300 sider eller hvad man nu mener er urealistisk at en bruger ville gøre 
  5. Man kan “classe” sine html koder. Da de fleste scrapere kigger og vurderer HTML koden, kan man i stedet for body, h1, etc bruge en class. 
  6. Hvis du benytter WordPress, kan du finde en række plugins, der kan forhindre kopiering af indhold, men det har de fleste klonings-værktøjer mulighed for at omgå.

Vi kan anbefale at man læser denne artikel også. Den indeholder yderligere tips.
https://stackoverflow.com/…/how-do-i-prevent-site-scraping

Er dit site blevet klonet?

Hvis dit site er helt eller delvis klonet, skal du se om du kan finde ejeren af domænet (ofte vanskeligt) via whois. Alternativt kontakte domænets abuse adresse (som du også finder på whois).

Hvis det lykkedes at finde ejeren, skal du kontakte notallowed.dk, der er specialister i ophavsret (ikke et sponseret link – vi har faktisk brugt dem, og de er super seje)

Har du brug for hjælp? Kontakt mig direkte på ir(at)inboundcph.dk eller gi mig et kald på 27297720.

 

 

Ingen kommentarer

Skriv en kommentar

Virksomheder vi gør en forskel for

X