tvorba webových stránek

Aktuální stav českých domén s pokročilejší analýzou

Tento skript systematicky analyzuje HTML obsah webových stránek a identifikuje různé technologie a klíčové informace pomocí specifických funkcí, které hledají charakteristické řetězce a tagy pro dané technologie. Tímto způsobem lze určit, jaké CMS nebo měřící nástroje web používá, zda používá HTTPS, a také získat kontaktní údaje, jako jsou e-mailové adresy a telefonní čísla.

Statistiky webových stránek

V následující tabulce jsou uvedeny statistiky různých technologií používaných na webových stránkách. Pro lepší přehlednost a snadnější interpretaci výsledků jsme použili různé barvy pozadí, které označují přesnost detekce jednotlivých technologií a dalších informací.

 

Legenda barev:

  • Zelená: Vysoká přesnost detekce (např. WordPress, Shoptet, Google Analytics)
  • Světlá zelená: Střední přesnost detekce (např. WooCommerce)
  • Oranžovo-žlutá: Nízká až střední přesnost detekce (např. Joomla, Webnode, Wix)
  • Tmavě oranžová: Specifické funkce (např. Consent V2, HTTPS(u neaktivních domén je dostupný certifikát))

 

PopisPočet
Celkový počet domén973961
Mrtvé weby639761
Používá Shoptet21166
Používá WordPress166920
Používá WooCommerce62603
Používá Joomla9672
Používá Drupal0
Používá Webnode4520
Používá Wix8907
Používá Shopify799
Používá PrestaShop1858
Měří statistiky188725
Používá Google Analytics129661
Používá GTM83679
Consent V25673
Používá HTTPS390422

 

1. Identifikace použití CMS (Content Management System)

  • WordPress: Funkce containsWordPress($html) hledá specifické indikátory v HTML, jako jsou výskyty wp-includes a wp-content v hlavičce stránky.
  • Joomla: Funkce containsJoomla($html) hledá meta tag generator s hodnotou Joomla! - Open Source Content Management.
  • Drupal: Funkce containsDrupal($html) hledá meta tag generator s hodnotou Drupal.
  • WooCommerce: Funkce containsWooCommerce($html) hledá výskyty specifických řetězců, jako jsou woocommerce, wc-, woocommerce-message, woocommerce-cart a woocommerce-checkout.
  • Shoptet: Funkce containsShoptet($html) prohledává HTML obsah na indikátory specifické pro Shoptet, například https://cdn.myshoptet.com/prj/, shoptet_config, shoptet.dataLayer.push a shoptet.consent.onAccept.
  • Webnode: Funkce containsWebnode($html) hledá meta tag generator s hodnotou Webnode.
  • Wix: Funkce containsWix($html) hledá meta tag generator s hodnotou Wix.com Website Builder.
  • Shopify: Funkce containsShopify($html) hledá specifický link tag s hodnotou https://cdn.shopify.com.
  • PrestaShop: Funkce containsPrestaShop($html) hledá meta tag generator s hodnotou PrestaShop.

2. Kontrola HTTPS

  • Kontrola HTTPS: Funkce isHttps($url) zjišťuje, zda URL používá HTTPS protokol.

3. Kontrola měřících nástrojů

  • Google Analytics: Funkce checkGoogleAnalytics($html) hledá přítomnost URL obsahujících https://www.googletagmanager.com/gtag/js, https://www.google-analytics.com/analytics.js nebo https://www.google-analytics.com/ga.js.
  • Google Tag Manager: Funkce checkGoogleTagManager($html) hledá přítomnost URL obsahujících https://www.googletagmanager.com/gtm.js nebo googletagmanager.com/gtm.js.
  • Režim souhlasu: Funkce checkConsentMode($html) hledá řetězec gtag("consent", "default").

4. Extrahování kontaktů

  • E-mail: Funkce findEmailAndPhone($html, $domain) extrahuje e-mailové adresy z HTML obsahu pomocí regulárních výrazů hledající anchor tagy s mailto nebo samotné e-mailové adresy.
  • Telefonní číslo: Funkce findEmailAndPhone($html, $domain) také extrahuje telefonní čísla z HTML obsahu pomocí regulárních výrazů hledající anchor tagy s tel nebo samotné telefonní čísla.

5. Identifikace unikátních domén

  • Unikátní domény: Funkce getUniqueDomains($html, $currentDomain) extrahuje všechny odkazy (anchor tagy) z HTML a identifikuje unikátní domény, které se liší od aktuální domény.

 

Závěr

Tento skript systematicky analyzuje HTML obsah webových stránek a identifikuje různé technologie a klíčové informace pomocí specifických funkcí, které hledají charakteristické řetězce a tagy pro dané technologie. Tímto způsobem lze určit, jaké CMS nebo měřící nástroje web používá, zda používá HTTPS, a také získat kontaktní údaje, jako jsou e-mailové adresy a telefonní čísla.

Potřebujete poradit?

Nejste si i přesto jisti a potřebujete poradit? Neváhejte s kontaktováním.
Tato stránka je chráněna službou reCAPTCHA a platí Zásady ochrany soukromí a Podmínky služby společnosti Google.

Líbil se Vám tento článek?

Sdílet na Facebook
Sdílet na Twitter
Sdílet na Linkedin
Sdílet na Pinterest