Waarom is dat? Wat is duplicate content nu precies en waarom kun je het beter vermijden op je website? En minstens zo belangrijk: hoe weet je of jouw site erdoor geschaadt wordt? Bij DoubleSmart hebben we regelmatig te maken met duplicate content en weten we dus hoe je hiermee omgaat. Na het lezen van dit artikel weet jij dat ook.

In dit artikel gaan we in op:

  • Wat duplicate content is
  • Waarom het schadelijk kan zijn voor je SEO
  • Hoe je het opspoort en aanpakt

Wat is duplicate content?

Duplicate content is content (het gaat vrijwel altijd om tekst) die identiek is aan – of sterk lijkt op – de content op een andere webpagina. Dat kan zowel een andere pagina op je eigen site zijn, of een pagina op een ander domein.

Verschijnt (vrijwel) dezelfde content op meer dan één URL? Dan is er sprake van duplicate content. En dat kan een negatieve impact hebben op je posities in de zoekresultaten.

De impact van duplicate content op SEO

Dat (veel) duplicate content op je website een rechtstreeks “penalty” (een door Google toegekende straf waardoor je website lager wordt ingeschaald) zou opleveren, is volgens Search Engine Land een mythe. Waarom is duplicate content dan toch iets om te vermijden?

Wanneer er verschillende pagina’s en stukken content op het internet te vinden zijn die – wat Google betreft – grotendeels identiek zijn, dan is het voor zoekmachines lastig om te bepalen welke versie het meest relevant is bij een bepaalde zoekopdracht. Het is dan, met andere woorden, lastig voor een zoekmachine om te bepalen welke pagina zou moeten ranken.

Google stelt zelfs expliciet dat er hard wordt gestreefd naar het ranken van pagina’s met unieke, onderscheidende informatie.

Het is dus belangrijk om je te onderscheiden van je concurrentie door écht de beste content bij een bepaalde term te leveren. Met duplicate content op je eigen website snijd je jezelf eigenlijk nog extra in de vingers: je zorgt er dan namelijk voor dat je met jezelf concurreert op bepaalde zoekopdrachten. We noemen dat ook wel zoekwoord kannibalisatie: twee pagina’s op eenzelfde domein ranken op hetzelfde zoekwoord en eten elkaars volume op. In veel gevallen zou één goede pagina namelijk hoger scoren dan die twee losse pagina’s.

Kortom: genoeg reden om duplicate content te vermijden. Maar hoe voorkom je dan expliciet dat jij door duplicate content geschaad wordt?

Praktische tips: duplicate content begrijpen en oplossen

Zoals bij alles geldt natuurlijk ook bij duplicate content: voorkomen is beter dan genezen. Zorg er daarom voor dat je altijd unieke content schrijft wanneer je een nieuwe blog of pagina wilt publiceren.

Toch kan het zijn dat jouw website onbedoeld met duplicate content te maken heeft gekregen. Hieronder geven we je praktische tips voor het opsporen en oplossen van duplicate content.

We laten je zien hoe duplicate content (vaak) ontstaat en wat je daaraan kunt doen.

1. Dezelfde content op verschillende URL’s

Dit ontstaat vaak bij grote e-commerce websites, die veel producten in dezelfde categorie aanbieden.

Stel dat je T-shirts verkoopt vanaf een pagina waar bezoekers op verschillende dingen kunnen filteren, zoals maat en kleur. Idealiter verschijnen de resultaten van die filters op dezelfde pagina.

Maar in sommige gevallen maakt een website automatisch een compleet nieuwe pagina (en dus URL) aan voor iedere specifieke optie. Wanneer je van dat ene product dan veel verschillende variaties aanbiedt, zit je in één klap met een hele berg duplicate content pagina’s. (Tenzij je bij iedere variatie unieke content serveert natuurlijk.)

Als je nu wilt ranken op “katoenen T-shirts”, maar er zijn vervolgens op jouw website tientallen of zelfs honderden variaties op diezelfde pagina te vinden, heeft Google natuurlijk geen idee welke daarvan het beste resultaat biedt.

2. Check je geïndexeerde pagina’s

Je kunt zelf controleren hoeveel van je pagina’s Google heeft geïndexeerd. Dit is een van de eenvoudigste manieren om duplicate content op jouw site op het spoor te komen.

Dit doe je door te Googelen op site:voorbeeldsite.nl.

Of door het rapport met geïndexeerde pagina’s te raadplegen in Google Search Console .

Het aantal pagina’s dat je op deze manier vindt, zou overeen moeten komen met het aantal pagina’s dat je handmatig hebt gemaakt. Ligt het aantal pagina’s dat je vindt veel hoger? Dan kun je ervan uitgaan dat er – bijvoorbeeld zoals we bespraken onder punt 1 – automatisch pagina’s worden aangemaakt. De kans op duplicate content op die pagina’s is dan aanzienlijk.

3. Redirect problemen

Ook verkeerde redirects zijn een bron van duplicate content. Het kan namelijk zelfs zo zijn dat je niet verschillende versies van dezelfde pagina hebt, maar meerdere versies van dezelfde website.

Twee gevallen komen regelmatig voor:

  • Zowel de versie van een website mét als zonder www in de domeinnaam bestaan afzonderlijk, in plaats van dat de een naar de ander doorverwijst. Voorbeeld: wanneer je “voorbeeldsite.nl” intikt, word je idealiter geredirect naar “voorbeeldsite.nl”. Wanneer in plaats daarvan beide versies bereikbaar zijn, betekent dat twee aparte websites, maar met identieke content.
  • Hetzelfde kan voorkomen tussen de HTTP en HTTPS versie van een site. De eerste zou moeten doorverwijzen naar de laatste (beveiligde) versie, maar dit gebeurt niet altijd goed.

4. Duplicate content oplossen met redirects

Nu we het toch over redirecten hebben: redirects zijn ook een goede manier om duplicate content op te lossen.

Heb je duplicate content gevonden op je website? Dan is de meest voor de hand liggende oplossing vaak om de kopieën te redirecten naar de originele pagina, of in ieder naar de pagina die volgens jou de meest belangrijke pagina is van de verzameling op elkaar lijkende pagina’s.

Een crawlende zoekmachine bot zal deze redirect keurig volgen en alleen de doelpagina indexeren, waardoor die pagina een (aanzienlijk) grotere kans maakt om goed te ranken op de betreffende zoekterm.

Crawlen website

5. Canonical tag

Het weggooien en/of redirecten van pagina’s met duplicate content is niet altijd een optie. Om tóch duidelijk te maken welke van die op elkaar lijkende pagina’s de belangrijkste is, kun je de zogenaamde canonical tag (rel=canonical) gebruiken.

In feite zeg je met deze tag tegen Google (en andere zoekmachines): “Dit is de belangrijkste pagina over dit onderwerp. We hebben er meer die erop lijken, maar die kun je negeren.”

Sterker nog: Google raadt zelf aan dat dit de beste manier is om met duplicate content om te gaan.

Volgens Google is dit hoe dan ook een betere aanpak dan het blokkeren van bots met bijvoorbeeld een no-index tag of robots.txt

6. Handige tools

Natuurlijk zijn er ook voor duplicate content SEO tools te vinden die jouw leven een stuk gemakkelijker kunnen maken. Dit zijn een aantal tools die je zou kunnen inzetten om duplicate content in beeld te brengen:

  • Siteliner scant je website en laat zien welke pagina’s veel dezelfde content bevatten.
  • Duplichecker laat je controleren of bepaalde content elders op het internet ook voorkomt.
  • PlagSpotter laat je ook scannen voor duplicate content en die content vervolgens vergelijken om de originaliteit in beeld te brengen.

Dit kan je helpen om duplicate content op je eigen site op het spoor te komen, maar zou je zelfs kunnen wijzen op concurrenten die jouw content kopiëren.

7. Pagina’s samenvoegen

We gaven al aan dat duplicate content niet alleen identieke pagina’s betreft. Ook pagina’s die té veel op elkaar lijken kunnen hieronder vallen.

Dit gebeurt bijvoorbeeld wanneer je zelf het idee hebt dat twee zoekopdrachten een verschillende pagina verdienen, maar dat ze wel zo dicht bij elkaar liggen dat ook de uiteindelijke content erg op elkaar lijkt. Ook komt het – door een gebrekkige contentstrategie – wel voor dat een collega een artikel schrijft over een onderwerp dat iemand anders allang had behandeld.

Zelfs wanneer de twee pagina’s volledig los van elkaar geschreven zijn en dus heel andere tekst bevatten, kan dat nadelig zijn. Er is dan weliswaar niet echt sprake van duplicate content, maar Google heeft toch moeite om te bepalen welke hoger moet worden ingeschat.

Of de content van de pagina’s nu duplicate te noemen is of niet: de beste remedie is in dit geval waarschijnlijk het samenvoegen van de pagina’s. Oftewel: van de twee (of meer) pagina’s die met elkaar concurreren op dezelfde zoektermen, maak je één geweldig goede pagina. De overige pagina’s verwijder je en die URL’s redirect je naar de nieuwe pagina.

Meer uit je SEO resultaten halen?

Veelgestelde vragen over duplicate content

Wat betekent duplicate content?

Duplicate content is wanneer twee pagina’s op het internet (vrijwel) identieke content bevatten. De pagina’s lijken dan zoveel op elkaar, dat het voor zoekmachines moeilijk is om te bepalen welke daarvan het beste op een zoekintentie aansluit.

Duplicate content doet ertoe in SEO omdat het je resultaten negatief kan beïnvloeden. Hoewel het vrijwel nooit een straf van Google oplevert, kan duplicate content er wel voor zorgen dat de pagina minder hoog ranket omdat hij niet onderscheidend genoeg is van het overige aanbod.

Duplicate content voorkomen doe je vooral door ervoor te zorgen dat je voor iedere pagina die je publiceert handmatig een uniek stuk content schrijft. Voorkom dat er automatisch pagina’s worden gegenereerd door filteropties van de producten in je webshop, of kopiëren en plakken van tekst wanneer je snel pagina’s moet vullen.

Duplicate content Duplicate content