SEO
Nenechte se penalizovat aneb duplicitní obsah může být problém nejen pro návštěvníky. Jak se mu vyhnout a zabránit jeho vzniku?

Věděli jste, že pokud se váš obsah zobrazuje duplicitně, může to být rušivý element nejen pro vaše návštěvníky, ale i pro vyhledávače? Ty vás za něj mohou dokonce penalizovat. Pojďme si blíže říci, co to duplicitní obsah vlastně je a jak mu zabránit.

Není asi pochyb o tom, že žijeme v době, která je přesycená informacemi. Ty se na nás hrnou ze všech stran a někdy není úplně snadné držet si přehled o tom, co se děje. A nemusí to platit jen globálně, ale i s ohledem na váš web. Někdy se prostě může stát „chyba“ a váš obsah se může objevit duplicitně – což je vlastně ten lepší způsob. Ten horší způsob nastává ve chvíli, kdy se váš obsah objeví na webu někoho jiného v naprosto totožném znění. Informace jsou tedy duplicitní na více místech, což mate vyhledávače a může to zhoršit vaši důvěryhodnost a umístění ve výsledcích vyhledávání.

SEO nezná bratra aneb obsah musí být unikát

Zabránit duplicitám je pro úspěšné SEO velmi důležité. Pokud si kladete otázku, co je vlastně myšleno duplicitním obsahem, pak vězte, že je to situace, kdy se identický základní obsah objeví na dvou různých URL adresách. Ve chvíli, kdy tuto duplicitu objeví vyhledávač (a nemusí se jednat o kompletní text, ale i identické části obsahu), rozhoduje se, kterou verzi zobrazí jako viditelnou. V tuto chvíli tedy může nastat problém, pokud vytvoříte obsah pro generování návštěvnosti webu a návštěvníci skončí na špatné stránce. Zejména pokud tato stránka není na vaší vlastní doméně, nebo pokud se na jednu z URL adres vztahují právní požadavky specifické pro danou zemi.  

Z hlediska pozice Googlu vás samotný vyhledávač nebude penalizovat, pokud objeví několik kopií jednoho obsahu, může ale penalizovat indexování vašeho webu. Způsob činnosti vyhledávačů spočívá v tom, že neprocházejí všechny stránky na webu. Zastaví se ve chvíli, když odhadnou, že veškerý důležitý obsah již nalezly. Často se tato chvíle nazývá jako „rozpočet procházení“ a platí, že jestliže utratíte celý svůj rozpočet na procházení za duplicitní obsah, riskujete, že jiný obsah nebude vůbec indexován.

Proč k duplicitnímu obsahu vůbec dochází?

Pokud objevíte duplicitní obsah, můžete jej vyřešit nejrůznějšími způsoby, ať už potlačením jedné verze, přesměrováním méně důležité verze na primární odkaz, zakázáním indexace nižších verzí obsahu nebo použitím kanonických tagů, kterými přesměrujete na primární obsah. Aby však nebylo těchto činností třeba, je ideální, pokud duplicitní obsah vůbec nevznikne. A možná vás překvapí, jak snadno k duplicitě může dojít. Někdy je totiž duplicita způsobena nedopatřením, jindy neznalostí osvědčených postupů SEO. Reálnými příčinami však bývají i účelné podvody a plagiáty.

Nejběžnějšími chybami vedoucími k duplicitě jsou především následující faktory:

Vytváření webových stránek na generické doméně nejvyššího řádu .dev

Běžnou praxí při vývoji webu je umístit vyvíjený web na subdoménu, kterou pojmenujete například dev.vasedomena.com nebo novyweb.vasedomena.com. Uživatelé, kteří neznají konkrétní URL adresu, ji však nebudou moci najít. A stejně tak ani prohledávače vyhledávačů. Naneštěstí však stačí jeden jediný, mnohdy i nechtěný odkaz směřující na jakoukoli stránku na tomto novém webu z veřejné stránky, aby vyhledávač web rozpoznal. A pokud bude procházet tuto jednu stránku, bude zároveň procházet a indexovat i všechny ostatní stránky ve výstavbě, což už zavání velkým problémem. Proto během vývoje nezapomeňte všechny své stránky chránit heslem!

Nepozornost při konfiguraci

Další častou chybou je volná konfigurace záznamu DNS (způsob, jakým je nakonfigurován název vaší domény) a certifikátu SSL (certifikát zabezpečeného serveru aktivující https). Pokud si nedáte pozor, můžete dosáhnout čtyř verzí vašeho webu, které jsou k dispozici k indexování:

http://www.vasedomena.com

https://www.vasedomena.com

http://vasedomena.com

https://vasedomena.com

A i zde opět platí, že stačí pouze jeden jediný odkaz na špatnou verzi vašeho webu, který může způsobit, že vyhledávače uvidí daný obsah dvakrát a i ho dvakrát indexují – nebo ještě hůř, indexují některé stránky z jedné verze a některé z jiné. Proto se vždy ujistěte, že přesměrováváte verzi http na https, a také, že verze vaší domény, kterou nechcete používat, přesměrovává na vaši primární URL adresu. Pokud konfigurace a interní propojení nejsou konzistentní, můžete skončit s několika URL adresami indexovanými pro stejnou stránku.

social media

Neopatrnost při používání systémů

Většina webů je vyvíjena a spravována pomocí systémů pro správu obsahu (CMS), jako je například Wordpress. A stránky e-commerce často používají nástroje pro vytváření obchodů, které jsou podobné CMS. Běžnou funkcí u produktového katalogu je umožnit více možností pro stránku produktu. Může to být změna barvy nebo velikosti produktu. Ke každé změněné možnosti přidá URL adresa stránky parametry vytvářející nové URL adresy, z nichž všechny může vyhledávač indexovat. A totéž se prakticky děje v každém CMS – pokud CMS vytváří adresy URL za chodu, je důležité používat na hlavní stránce kanonické tagy, jež jednoduše označí, která URL adresa odpovídá primární stránce.

Boj s roboty

K duplicitě obsahu může dojít také v důsledku takzvaných scrapovacích robotů, kteří zkopírují vaši stránku do databáze. Tito roboti jsou velmi podobní prohledávačům vyhledávačů a lze je plně automatizovat. Obvykle analyzují cílový web, aby určili, kde se obsah nachází, a poté automaticky zkopírují obsah, když se nová stránka aktualizuje. Útěchou může být, že jsou ve většině případů neškodní – pouze se snaží obohatit své stránky o obsah, ale jen zřídka se jim podaří umístit se na klíčová slova. Problém však může nastat ve chvíli, kdy má web, na který jsou texty zkopírovány, vysoce hodnocenou doménu, protože v některých případech by mohl překonat váš původní obsah. Často si tyto weby dokonce zachovají původní odkazy v obsahu odkazujícím zpět na vaši doménu, což zvyšuje počet odkazů směřujících na váš web. V některých případech jsou dokonce zkopírovány celé stránky a znovu publikovány na jiných doménách – někdy s mírně pozměněným obsahem, kdy vloží odkazy na přidružené stránky a doufají, že budou indexovány.

Pokud zjistíte, že byl váš obsah ukraden, můžete se pokusit najít vlastníka webu a podniknout právní kroky nebo alespoň poslat žádost o zastavení a smazání těchto informací. Problémem však bývá to, že pro většinu webů nedohledáte vlastníka. Můžete také informovat vyhledávače a požádat o odstranění stránky porušující autorská práva. Google má právní nástroje pro odstraňování těchto problémů, takže jej můžete využít.

Problémy s jazykovými mutacemi

Duplicitní obsah se může objevit i ve chvíli, kdy spravujete nadnárodní webové stránky v různých jazykových mutacích a nedojde k jejich správnému překrytí. Abyste tomuto problému zabránili, můžete použít takzvaný hreflang tag, který informuje vyhledávače, jakou jazykovou verzi používáte na konkrétní stránce – a vyhledávač ji na základě toho může nabídnout relevantním uživatelům. Zároveň vyhledávač bude vědět, jaká verze obsahu by měla být vložena do každé z jejich databází zemí, a bude tak zabráněno duplikátům.

I plagiátorství se dá zabránit

Jako poslední typ duplicitního obsahu si můžeme zmínit ten, s kterým se nejhůře bojuje, a to plagiátorství – text je tedy ukraden původnímu autorovi a používán na jiných webových stránkách. Bohužel se veškeré plagiáty nedají odhalit, ale existuje řada dostupných nástrojů, které vám pomohou rychle a efektivně zkontrolovat, zda váš text někdo neukradl. Použít můžete například bezplatný nástroj na kontrolu plagiátů od Grammarly.

Jakým způsobem odhalí duplicitní obsah vyhledávač?

Vyhledávače nejprve procházejí URL adresy a až poté obsah. V podstatě se podívají na základní kostru a teprve pak zkoumají podrobnosti, jež zkopírují a následně zkrátí. V této kratší podobě nejsou nabídky z menu a zápatí. Získaný obsah poté porovnají s existujícím obsahem v jejich databázích, aby byly schopny identifikovat podobný obsah. Jestliže je podobnost příliš vysoká, vyhledávač seskupí URL adresy ze stejné domény a zachová pouze jednu URL adresu. Pro podobný obsah na různých doménách obvykle vybírá starší verzi, takže vyhráno máte pouze tehdy, pokud byl váš obsah indexován jako první.

Proveďte analýzu architektury webu

Nyní už víte, jakým způsobem může dojít ke vzniku duplicitního obsahu. Jak však zjistit, zda už duplicitní obsah na svém webu nemáte? Je to jednoduché – proveďte SEO audit, při kterém zanalyzujete architekturu vašich webových stránek.

  • Důležitou roli hraje kontrola a oprava nastavení domény – vyhledejte na Googlu název své domény (bez www), abyste zjistili, jaké verze domény a jejích subdomén jsou indexovány. Můžete také využít nejrůznější nástroje pro vyhledávání subdomén – jedním z nich je například Subdomain Finder, který představuje rychlý a efektivní způsob, jak zobrazit všechny nakonfigurované subdomény pro kontrolu duplicitního obsahu.
  • Zaměřte se na ty, co vám kradou obsah – ať už vlastníte jakýkoliv web, vždy je třeba hlídat, zda se váš obsah nezalíbil nějakému plagiátorovi – tím může být i váš konkurent, který vám chce ukradením obsahu ublížit. Plagiáty můžete objevit tak, že do Googlu zadáte jedinečný název konkrétní stránky a provede hledání. Pokud by někdo vaše stránky kopíroval, zobrazil by vám vyhledávač pro dané vyhledávání další stránky. Nechcete-li se zdržovat překopírováváním obsahu, můžete využít i nejrůznější nástroje odhalující duplicitní obsah, jako například Copyscape, který zkopíruje vaši URL adresu a identifikuje duplikáty na jiných URL adresách.
  • Nezapomeňte ani na vlastní web – když už víte, zda vám někdo nekrade obsah, nezapomeňte zkontrolovat také sami sebe, zda nepoužíváte duplicitní URL adresy a obsah na svém vlastním webu. Postupovat můžete pomocí vyhledávače stejně jako u výše zmíněné kontroly, nebo využít nejrůznější nástroje, jako je například Screaming Frog a Xenu Link Sleuth.

Rada na závěr

Každý majitel webových stránek chce být jedinečný a vynikat vlastním obsahem. Abyste si sami sobě neškodili a nevytvářeli duplicitní obsah, buďte opatrní se subdoménami a během vývoje webu. Při spuštění webových stránek byste se měli ujistit, že je viditelná pouze primární verze webu a že všechny ostatní verze přesměrovávají na tuto verzi. U rozsáhlejších webů můžete použít kanonizaci, abyste se vyhnuli problémům s CMS, či využít hreflang tagy ke správnému nastavení mezinárodních verzí webu. Pokud čelíte plagiátorství, můžete zkusit odstranit obsah ze stránek těch, kteří vám jej ukradli. Docílíte tak správného zobrazování i indexování vašeho obsahu a tudíž i lepších konverzí.

Zdroj: marketingland.com, facebook.com, cpcstrategy.com

Autor: Vlastimil Malík

Foto zdroj: pixabay.com

 

Více článků z blogu

Používáme tyto nástroje

WordPress
PrestaShop
WooCommerce
Shoptet
Upgates
FastCentrik
GA4
Google Merchant
Google Tag Manager
Collabim
Marketing Miner
ahrefs
Ecomail
Mailchimp