Technický SEO audit potřebuje posun na další úroveň

Vlastimil Malík | 26. 6. 2026

Webové stránky potřebují nový rámec auditu, který zohledňuje AI crawlery, omezení vykreslování, strukturovaná data a parsování stromu přístupnosti.

Co v článku najdete

Vrstva 1: Přístup AI crawlerů
Vrstva 2: Vykreslování JavaScriptu
Vrstva 3: Strukturovaná data pro AI
Vrstva 4: Sémantické HTML a strom přístupnosti
Vrstva 5: Signály objevitelnosti pro AI
Analytika AI crawlerů
Od auditu k akci
Proč sem patří technický SEO audit
FAQ:

Standardní technický SEO audit kontroluje procházení (crawlability), indexovatelnost, rychlost webu, mobilní použitelnost a strukturovaná data. Tak to vždy bylo.

V roce 2026 má však vaše webová stránka alespoň tucet dalších ne-lidských spotřebitelů. AI crawlery jako GPTBot, ClaudeBota a PerplexityBot trénují modely a pohánějí AI vyhledávání. Agenti spouštění uživatelem, jako nově oznámený Google-Agent nebo jeho „sourozenci“ Claude-User a ChatGPT-User, procházejí webové stránky jménem konkrétních lidí v reálném čase. Analýza z 1. čtvrtletí roku 2026 napříč sítí Cloudflare zjistila, že 30,6 % veškerého webového provozu dnes pochází z botů, přičemž AI crawlery a agenti tvoří rostoucí podíl. Váš technický audit musí brát v úvahu všechny.

Zde je pět vrstev, které je třeba přidat k vašemu stávajícímu technickému SEO auditu.

Vrstva 1: Přístup AI crawlerů

Váš soubor robots.txt byl pravděpodobně napsán pro Googlebota, Bingbota a možná několik dalších botů. AI crawlery potřebují vlastní pravidla v robots.txt a ta by měla být oddělená od Googlebota a Bingbota.

Na co se tedy zaměřit?

Zkontrolujte svůj robots.txt a hledejte pravidla pro AI specifické user-agenty: GPTBot, ClaudeBot, PerplexityBot, Google-Extended, Bytespider, AppleBot-Extended, CCBot a ChatGPT-User. Pokud žádný z nich nevidíte, jedete na výchozích nastaveních, a ta nemusí odpovídat tomu, co ve skutečnosti chcete. Nikdy se nespoléhejte na výchozí nastavení, pokud si nejste jisti, že přesně odpovídají vašim potřebám.

Klíčové je dělat vědomé rozhodnutí pro každý crawler zvlášť, místo plošného povolení nebo blokování všeho. Ne všechny AI crawlery slouží stejnému účelu. Provoz AI crawlerů lze rozdělit do tří kategorií: na trénovací crawlery, které sbírají data pro trénink modelů, vyhledávací crawlery, které pohánějí AI vyhledávání, a agenty spouštěné uživatelem, jako Google-Agent a ChatGPT-User, kteří procházejí web jménem konkrétního člověka v reálném čase. Každá z těchto kategorií si zaslouží jiné pravidlo v robots.txt.

Poměry „procházení k referencím“ (crawl-to-referral) z reportu Cloudflare Radar vám mohou pomoci udělat informované rozhodnutí.

ClaudeBot od společnosti Anthropic prochází 20,6 tisíce stránek na každé jedno odeslané doporučení (referral), které vrátí. U OpenAI je tento poměr 1 300 : 1. Meta neposílá žádné referenční návštěvy. Blokování OpenAI OAI-SearchBot nebo PerplexityBot snižuje vaši viditelnost ve vyhledávání ChatGPT a v odpovědích Perplexity AI. Naopak blokování trénovacích crawlerů, jako je CCBot nebo crawler od Mety, zabraňuje získávání dat poskytovatelem, který vám na oplátku neposílá žádný provoz.

Poměry crawl-to-referral vám říkají, kdo bere, aniž by vracel.

Existuje jeden crawler, který vyžaduje zvláštní pozornost. Google přidal Google-Agenta na svůj oficiální seznam uživatelem spouštěných fetcherů 20. března 2026. Google-Agent identifikuje požadavky od AI systémů běžících na infrastruktuře Googlu, které procházejí webové stránky jménem uživatelů. Na rozdíl od tradičních crawlerů Google-Agent ignoruje robots.txt. Postoj Googlu je, že protože požadavek inicioval člověk, agent funguje spíš jako uživatelský proxy než autonomní crawler. Blokování Google-Agenta vyžaduje serverovou autentizaci, nikoli pravidla v robots.txt. To je samo o sobě zajímavé a důležité pro budoucnost, i když to už přesahuje rámec tohoto článku.

Vrstva 2: Vykreslování JavaScriptu

Googlebot vykresluje JavaScript pomocí headless Chromia. Na tom není nic nového. Co je ale nové a odlišné, je to, že prakticky žádný z hlavních AI crawlerů JavaScript nevykresluje.

AppleBot (který používá renderer založený na WebKitu) a Googlebot jsou jediné hlavní crawlery, které vykreslují JavaScript. Čtyři ze šesti hlavních webových crawlerů (GPTBot, ClaudeBot, PerplexityBot a CCBot) načítají pouze statické HTML, takže server-side rendering se stává požadavkem pro viditelnost v AI vyhledávání, nikoli jen optimalizací.

Pokud váš obsah existuje pouze v klientském JavaScriptu, je pro crawlery trénující modely OpenAI, Anthropic a Perplexity a pohánějící jejich AI vyhledávací produkty neviditelný.

Na co se zaměřit?

Spusťte curl -s [URL] na svých klíčových stránkách a v odpovědi vyhledejte klíčový obsah, jako jsou názvy produktů, ceny nebo popisy služeb. Pokud tento obsah není v odpovědi z curlu, GPTBot, ClaudeBot ani PerplexityBot ho také neuvidí.

Alternativně použijte „Zobrazit zdroj stránky“ (View Source) ve svém prohlížeči (ne „Inspect Element“, který zobrazuje DOM vykreslený po načtení JavaScriptu) a zkontrolujte, zda jsou důležité informace přítomné v surovém HTML.

Single-page aplikace (SPA) vytvořené v Reactu, Vue nebo Angularu jsou obzvlášť ohrožené, pokud nepoužívají server-side rendering (SSR) nebo statickou generaci stránek (SSG).

React SPA, která vykresluje popisy produktů, ceny nebo klíčová tvrzení výhradně na straně klienta, posílá AI crawlerům prázdnou stránku s odkazem na JavaScriptový balíček.

Oprava není složitá. Server-side rendering (SSR), statická generace stránek (SSG) nebo předrenderování tento problém řeší pro všechny hlavní frameworky.

Next.js nativně podporuje SSR a SSG pro React, Nuxt poskytuje totéž pro Vue a Angular Universal zajišťuje serverové vykreslování pro aplikace v Angularu.

Audit jen potřebuje označit, které stránky spoléhají na klientský JavaScript pro zobrazování klíčového obsahu.

Vrstva 3: Strukturovaná data pro AI

Strukturovaná data jsou součástí technických SEO auditů už roky, ale hodnoticí kritéria je potřeba aktualizovat. Otázka už není jen „má tato stránka schema markup?“, ale „pomáhá toto značení AI systémům pochopit a citovat tento obsah?“

Na co se zaměřit?

Implementace JSON-LD (upřednostňovaná před Microdata a RDFa pro parsování AI).
Typy schémat, které jdou nad rámec základů: Organization, Article, Product, FAQ, HowTo, Person.
Vztahy mezi entitami: vlastnosti sameAs, author a publisher, které propojují váš obsah se známými entitami.
Úplnost: jsou vyplněny všechny relevantní vlastnosti, nebo jen „odškrtnete políčko“ pomocí základních (kostrových) schémat s názvem a URL?

Proč je to důležité?

Fabrice Canel, hlavní produktový manažer Microsoft Bing, potvrdil v březnu 2025, že schema markup pomáhá velkým jazykovým modelům (LLM) porozumět obsahu pro Copilot. Tým Google Search v dubnu 2025 uvedl, že strukturovaná data poskytují výhodu ve výsledcích vyhledávání.

Ne, se samotným schema markupem nemůžete „vyhrát“. Ano, může pomoci.

Důležitý je také aspekt hustoty dat. Výzkumný článek GEO od Princetonské univerzity, Georgia Tech, Allen Institute for AI a IIT Delhi zjistil, že přidání statistik do obsahu zlepšilo viditelnost v AI o 41 %. Analýza společnosti Yext zjistila, že weby bohaté na data získávají 4,3× více AI citací než seznamové (directory-style) stránky. Strukturovaná data přispívají k hustotě dat tím, že AI systémům poskytují strojově čitelná fakta místo nutnosti extrahovat význam z volného textu.

Důležité upozornění: Zatím neexistují žádné peer-reviewované akademické studie, které by konkrétně zkoumaly vliv schema markup na míru citací v AI. Data z průmyslu jsou slibná a konzistentní, ale je třeba je brát spíše jako indikátory než jako záruky.

W3Techs uvádí, že přibližně 53 % z top 10 milionů webových stránek používá JSON-LD k začátku roku 2026. Pokud váš web mezi nimi není, přicházíte o signály, které používají jak tradiční, tak AI vyhledávací systémy k porozumění vašemu obsahu.

Duane Forrester, který pomáhal budovat Bing Webmaster Tools a spoluzakládal Schema.org, tvrdí, že schema markup je pouze první krok. Jak se AI agenti posouvají od pouhého interpretování stránek k rozhodování, budou muset značky publikovat také tzv. provozní pravdu (ceny, zásady, omezení) ve strojově ověřitelných formátech s verzováním a kryptografickými podpisy.

Publikování strojově ověřitelných „source packů“ je dnes mimo rozsah standardního auditu, ale kontrola úplnosti a přesnosti strukturovaných dat je základ, na kterém budou tyto ověřené zdrojové balíčky stavět.

Vrstva 4: Sémantické HTML a strom přístupnosti

První tři vrstvy auditu připravenosti na AI pokrývají přístup crawlerů (robots.txt), vykreslování JavaScriptu a strukturovaná data. Další dvě se zaměřují na to, jak AI agenti skutečně čtou vaše stránky a jaké signály jim pomáhají objevovat a vyhodnocovat váš obsah.

Většina SEO specialistů hodnotí HTML z pohledu vyhledávačů. Agentní prohlížeče jako ChatGPT Atlas, Chrome s automatickým procházením nebo Perplexity Comet však neanalyzují stránky stejně jako Googlebot. Místo toho čtou strom přístupnosti.

Strom přístupnosti je paralelní reprezentace vaší stránky, kterou prohlížeče generují z HTML. Odstraňuje vizuální stylování, rozvržení a dekorace a ponechává pouze sémantickou strukturu: nadpisy, odkazy, tlačítka, formulářová pole, popisky a vztahy mezi nimi. Čtečky obrazovky jako VoiceOver a NVDA používají strom přístupnosti už desítky let k tomu, aby zpřístupnily web lidem se zrakovým postižením. AI agenti nyní používají stejný strom k pochopení webových stránek a interakci s nimi.

A důvod je jednoduchý: efektivita. Zpracování screenshotů je jak dražší, tak pomalejší než práce se stromem přístupnosti.

To je důležité, protože strom přístupnosti odhaluje, co vaše HTML skutečně komunikuje, ne to, jak to vypadá díky CSS (nebo JavaScriptu). <div> nastylovaný tak, aby vypadal jako tlačítko, se ve stromu přístupnosti jako tlačítko neobjeví. Obrázek bez alt textu neznamená vůbec nic. Hierarchie nadpisů, která přeskočí z H1 na H4, vytváří narušenou strukturu, ve které se budou špatně orientovat jak čtečky obrazovky, tak AI agenti.

Nástroj Microsoftu Playwright MCP, standardní nástroj pro propojení AI modelů s automatizací prohlížeče, používá místo surového HTML nebo screenshotů právě snapshoty stromu přístupnosti. Funkce browser_snapshot v Playwright MCP vrací reprezentaci stromu přístupnosti, protože je kompaktnější a pro LLM sémantičtěji smysluplná.

Dokumentace OpenAI uvádí, že ChatGPT Atlas používá pro interpretaci struktury stránky při procházení webů ARIA tagy.

Přístupnost webu a kompatibilita s AI agenty jsou dnes stejná disciplína. Správná hierarchie nadpisů (H1–H6) vytváří smysluplné sekce, které AI systémy používají pro extrakci obsahu. Sémantické elementy jako <nav>, <main>, <article> a <section> dávají strojům informaci o tom, jakou roli má každý blok obsahu. Popisky formulářů a popisný text tlačítek zpřístupňují interaktivní prvky agentům, kteří nepracují s vizuálním designem, ale se stromem přístupnosti.

Na co se zaměřit?

Hierarchie nadpisů: logická struktura H1–H6, kterou stroje mohou použít k pochopení vztahů mezi obsahem.
Sémantické prvky: nav, main, article, section, aside, header, footer — používané správně a ve správném kontextu.
Formulářové prvky: každý input má svůj label a každé tlačítko má popisný text.
Interaktivní prvky: klikatelné prvky používají <button> nebo <a>, ne <div onclick>.
Strom přístupnosti: spusťte Playwright MCP snapshot nebo test pomocí VoiceOver/NVDA, abyste viděli, co skutečně „vidí“ agenti.

Na této frontě se situace bohužel zhoršuje. Zpráva WebAIM Million 2026 zjistila, že průměrná webová stránka má nyní 56,1 chyb v přístupnosti, což je nárůst o 10,1 % oproti roku 2025.

Používání ARIA (Accessible Rich Internet Applications) vzrostlo za jediný rok o 27 %. ARIA je sada HTML atributů, které přidávají prvkům dodatečné sémantické informace a říkají čtečkám obrazovky a AI agentům například „tento div je ve skutečnosti dialog“ nebo „tento seznam funguje jako menu“.

Klíčové je ale toto: stránky s ARIA měly výrazně více chyb než stránky bez ARIA.

Přidávání ARIA bez pochopení jeho fungování situaci zhoršuje, nikoli zlepšuje, protože nesprávné ARIA přepisuje výchozí interpretaci stromu přístupnosti v prohlížeči chybnými informacemi.

Začněte správným sémantickým HTML. ARIA přidávejte pouze tehdy, když nativní prvky nestačí.

Techničtí SEO specialisté se nemusejí stát experty na přístupnost. Ale přistupovat k přístupnosti jako k problému někoho jiného už není udržitelné, když stejný strom, který zpracovávají čtečky obrazovky, je nyní hlavním rozhraním mezi AI agenty a vaším webem.

Poznámka bokem: zkratka s Markdownem nefunguje

Servírování surových Markdown souborů AI crawlerům místo HTML může snížit spotřebu tokenů na stránku až o 95 %. Nicméně Google Search Advocate John Mueller to v únoru 2026 na Bluesky označil za „hloupý nápad“.

Jeho argument zněl: „Význam žije ve struktuře, hierarchii a kontextu. Když to zploštíte, neděláte to strojově přívětivé, ale bezvýznamné.“

Velké jazykové modely byly od začátku trénovány na běžných HTML stránkách a nemají problém je zpracovávat. Odpovědí není vytvářet plochou, zjednodušenou verzi pro stroje. Je jím správně strukturované HTML samotné. Dobře napsané sémantické HTML je už samo o sobě strojově čitelný formát.

A navíc tato zjednodušená reprezentace už existuje – je to strom přístupnosti, který AI agenti už dnes používají.

Vrstva 5: Signály objevitelnosti pro AI

Poslední vrstva pokrývá signály, které se nehodí do klasických kategorií auditu, ale přímo ovlivňují, jak AI systémy objevují a vyhodnocují váš web.

llms.txt

Uvedeno jako první z jednoho jediného důvodu: zeptejte se libovolného LLM, co udělat pro lepší viditelnost webu v AI systémech, a llms.txt bude na vrcholu nebo blízko vrcholu doporučení. Je to zkrátka jejich svět, předpokládám.

Specifikace llms.txt poskytuje jednoduchý Markdown soubor, který pomáhá AI agentům pochopit účel vašeho webu, jeho strukturu a klíčový obsah. Zatím neexistují žádná data o masovém nasazení a jeho skutečný dopad na AI citace není prokázán. Ale LLM ho konzistentně doporučují, což znamená, že nástroje pro AI audity a konzultanti budou jeho absenci označovat jako problém.

Vytvoření zabere jen pár minut a jeho údržba nic nestojí.

Analytika AI crawlerů

Sledujete provoz botů AI systémů? Dashboard „AI Audit“ od Cloudflare ukazuje, které AI crawlery přicházejí, jak často a které stránky navštěvují. Pokud nepoužíváte Cloudflare, zkontrolujte serverové logy na user-agent řetězce jako Google-Agent, ChatGPT-User a ClaudeBot. Google publikuje soubor user-triggered-agents.json, který obsahuje IP rozsahy používané Google-Agentem, takže můžete ověřit, zda příchozí požadavky skutečně pocházejí od Googlu, a ne od podvržených user-agentů.

Definice entity
Definuje váš web jasně, co je vaše firma, kdo ji vede a co dělá? Ne marketingovým textem, ale strukturovaným, strojově čitelným značením. Schéma Organization by mělo obsahovat název, URL, logo, datum založení a odkazy sameAs na ověřené profily na LinkedIn, Crunchbase a Wikipedii. Schéma Person pro klíčové osoby by mělo tyto lidi propojit s organizací pomocí vlastností author a employee.

AI systémy potřebují nejprve jednoznačně rozpoznat vaši identitu jako samostatnou entitu, než vás budou moci s jistotou doporučit oproti konkurenci s podobnými názvy nebo nabídkami. Nedávejte to jen „navrch“ webu, až designer skončí svou práci. Začněte tímto, ušetří vám to spoustu problémů.

Pozice obsahu
To, kam na stránce umístíte informace, přímo ovlivňuje, zda je budou AI systémy citovat. Analýza Kevina Indiga, která zkoumala 98 000 záznamů citací v ChatGPT napříč 1,2 milionu odpovědí, zjistila, že 44,2 % všech AI citací pochází z horních 30 % stránky. Spodních 10 % stránky získává pouze 2,4–4,4 % citací bez ohledu na odvětví.

Duane Forrester tento jev označuje jako „dog-bone thinking“ (myšlení ve tvaru psí kosti): silný začátek a konec, slabý střed. Výzkumníci ze Stanfordu tento vzorec potvrdili jako fenomén známý pod názvem „lost in the middle“ („ztraceno uprostřed“).

Při auditu klíčových stránek si proto položte otázku: Jsou nejdůležitější tvrzení a datové body umístěny v prvních 30 % obsahu, nebo jsou schované někde uprostřed?

Extrahovatelnost obsahu
Vezměte jakékoli klíčové tvrzení ze své stránky a přečtěte si ho samostatně, bez okolního kontextu. Dává stále smysl?

Systémy pro vyhledávání a získávání informací používané nástroji jako ChatGPT, Perplexity nebo Google AI Overviews extrahují a citují jednotlivé pasáže a věty. Věty, které se pro svůj význam spoléhají na odkazy typu „toto“, „to“, „výše uvedené“ nebo podobné neurčité odkazy, se po vytržení z původního kontextu stávají nepoužitelnými.

Vynikající framework pro psaní tzv. „utility contentu“ od Ramona Eijkemanse převádí tyto principy do praxe na základě známých mechanismů retrieval systémů: používejte samostatně srozumitelné věty, explicitně vyjadřujte vztahy mezi entitami a vytvářejte citovatelné klíčové výroky (anchor statements), které mohou AI systémy bez obav citovat, aniž by musely domýšlet chybějící souvislosti.

Od auditu k akci

Tento audit identifikuje nedostatky. Jejich náprava však vyžaduje správné pořadí, protože některé kroky jsou závislé na jiných.

Optimalizovat strukturu obsahu dříve, než vytvoříte strojově čitelnou identitu, znamená, že agenti sice dokážou váš obsah extrahovat, ale nedokážou ho spolehlivě přiřadit k vaší značce.

Právě proto jsem vytvořil koncept Machine-First Architecture, který stanovuje následující posloupnost: identita → struktura → obsah → interakce, přičemž každý pilíř staví na tom předchozím.

Proč sem patří technický SEO audit

Technicky vzato, většina z toho není SEO. Pravidla robots.txt pro AI crawlery neovlivňují pozice v Googlu. Optimalizace stromu přístupnosti nezlepší umístění na klíčová slova. Hodnocení pozice obsahu na stránce nemá nic společného s indexací ve vyhledávačích.

Přesto většina těchto oblastí vychází právě z technického SEO. Správa procházení webu, strukturovaná data, sémantické HTML, vykreslování JavaScriptu nebo analýza serverových logů: to jsou dovednosti, které techničtí SEO specialisté už mají.

Metodika auditu se přenáší prakticky beze změny. Změnil se pouze „spotřebitel“, kterému audit slouží.

Weby, které budou citovány v odpovědích AI systémů, které budou správně fungovat při návštěvě prostřednictvím Chrome Auto Browse a které se objeví ve chvíli, kdy někdo požádá ChatGPT o doporučení, nebudou jen ty s nejlepším obsahem.

Budou to ty, jejichž technický základ umožní strojům tento obsah snadno najít, pochopit a využít.

Techničtí SEO specialisté jsou lidé, kteří mají nejlepší předpoklady takový základ vybudovat. Stará šablona technického auditu jen potřebuje novou sekci, která tuto změnu zohlední.

FAQ:

Proč je potřeba rozšířit technický SEO audit o AI prvky?
Protože web dnes neprocházejí pouze vyhledávače, ale také AI crawlery a agenti, kteří ovlivňují viditelnost značky v AI odpovědích a doporučeních.

Jaký význam má server-side rendering pro AI vyhledávání?
Většina AI crawlerů nevykresluje JavaScript, takže obsah dostupný pouze na straně klienta pro ně zůstává neviditelný.

Jak souvisí přístupnost webu s AI systémy?
AI agenti často využívají strom přístupnosti k pochopení struktury stránky, takže správné sémantické HTML a přístupnost pomáhají strojům lépe interpretovat obsah.

Zdroj: searchengineland.com, searchenginejournal.com, marketingland.com, facebook.com, cpcstrategy.com

Autor: Vlastimil Malík

Foto zdroj: AI, pixabay.com