Vad är duplicate content och unika texter?
Duplicate content är ett komplext uttryck, som det råder delade meningar om. Överlag anses det att ha innehåll som är skrivet för varje enskild sida du har, så kan du öka chanserna att de visas i sökmotorerna. Framförallt om du har samma eller väldigt liknande texter på flera sidor så finns risken att Google bedömer endast en av sidorna som relevant att visas i sökmotorerna. De andra innehåller ju samma information, så det finns ingen anledning att visa den. Att inte visas på grund av att ens innehåll inte är unik kallas ibland för duplicate content penalty.
Därför anser många att skriva helt nya texter för varje sida du har är den bästa lösningen. Genom att ha innehåll som bara förekommer på just den sidan – det man kallar för unikt innehåll eller UC, unique content – riskerar du inte att din sida inte visas.
Duplicate content är ett komplext ämne
Vissa anser att duplicate content penaltyn främst är en faktor om det är texter på en och samma domän, och inte om en text förekommer på olika domäner. Duplicate content på en domän kan ofta ske av misstag, när till exempel en kategorisida eller en arkivsida återger samma innehåll som enstaka artiklar, produktsidor eller undersidor.
Sedan anser många att det gäller innehåll på andra domäner med. Samtidigt finns det flera exempel där exakt samma artikel kan ranka flera gånger. I visa fall anses det dock endast vara fallet om det gäller nyhetsartiklar, som kan vara i en “news” filter på Google de första dagarna, och därav visas på ett annorlunda sätt.
Allt detta belyser lite att duplicate content och unika texter är ett komplext ämne. Men alla är överens om att duplicate content på en och samma domän kan skada, samt att ha unika texter överlag aldrig kan skada, så kan du ha unika texter överallt se till att ha det.
Vad menas med unika texter?
En annan svår fråga är när är en text verkligen unik? Detta kan verka trivialt i början, men vid närmare eftertanke består alla texter av ord från samma språk. Räcker det med att byta ut några ord för att en text ska anses ‘unik’? För även om det skrivs texter från början, finns ju risken att delar av meningar eller hela meningar är likadana som på andra sidor. Var går den gränsen?
Ingen har kunnat svara på vad som anses som tillräckligt unikt eller inte. En branschstandard är verktyg som Copyscape, som är en så kallad duplicate content checker. Copyscape fungerar som så att den delar upp texter i mindre stycken – 4 ord i taget för det mesta – och sedan ser hur många av dessa stycken som har exakta matchningar i sökmotorerna, i Copyscapes fall Yahoo! och Google. Om mer än en viss procentsats fastnar (ingen vet precis hur många procent, men några få procent kan räcka), så flaggas texten som icke-unik. Om detta är samma gräns som Google har också är dock ingen som verkligen kan svara på.
Det finns ingen riktig standard för branschen för när en text är unik och inte. Vissa säger 50%, visa 75%, och andra att det behöver vara 90% eller högre. Vi på Contentor har som riktlinje 85% unikhet i enklare innehåll och texter vi skriver, och ännu högre vid mer högkvalitativa webcopy och innehåll.
Vanliga orsaker till duplicate content
Det finns många olika anledningar att duplicate content uppstår
- Du har en e-handelsbutik och använder texter som din leverantör har tagit fram – och denne själv använder på sin webbsida eller som andra e-handlare också använder.
- Du har samma innehåll på flera sidor, vilket kan vara vanligt förekommande om du har kategorisidor eller arkivsidor där flera undersidors innehåll visas i sin helhet.
- Du återpublicerar nyheter från andra källor.
- Du har kopierat innehåll från andra sidor, så som Wikipedia eller konkurrenters sidor.
Alla dessa saker är dåliga ur SEO perspektiv och bör undvikas.
Räknas menyer eller liknande till unikheten?
Det anses som standard att text i menyer, sidebars, texter i sidfoten och andra ställen som återkommer på många av dina sidor inte räknas till huvudtexten. Med det menas att de texterna inte behöver tas i beaktning för att kolla om en text är unik eller inte.
Faror med duplicate content
Det finns två risker med att inte ha unika texter. Den uppenbara är att din sida som har duplicate content inte syns i sökresultatet. Men utöver det finns det även sedan den första Panda uppdateringen risk att hela din domän anses som sämre ifall du har sektioner med texter som är kopierade eller på annat sätt icke-unikt. Effekterna här är inte helt självklara, men det anses sedan den första Panda som god sed att undvika den typen av innehåll generellt, eller göra den otillgänglig för sökmotorerna genom robot.txt filen i så fall.
Sammanfattning
För att sammanfatta det hela, rekommenderas följande:
- Ha alltid unikt innehåll om du kan.
- Skriv texter från grunden.
- Om du av olika anledningar kopierar innehåll från andra: gör det på rätt sätt där du gör det lätt för Google att se var innehållet kommer ifrån, eller att du säkerställer att det inte indexeras av Google.
Vill du veta mer har MOZ en bra video där flera detaljer gås igenom. Här belyses också vikten av både unique content, och unique value.