Duplicitný obsah vs. google

Duplicita je častá chyba pri tvorbe/optimalizácii webov. Postihmi za duplicitný obsah nám google pripomína význam originálneho (ani nie tak kvalitného) obsahu.

Často sa neúspech zdvôvodňuje chybami v kóde,  nízkym počtom spätných odkazov, alebo ich kvalitou, vekom webu, či napríklad sandboxom, no chyba môže byť práve v samotnom obsahu, ktorý web (ne)poskytuje návštevníkom.

Formy duplicity

Je ich niekoľko. Ako vidíte nejde len o obsah. Takouto formou vám môžu uškodiť aj:

  • duplicitné adresy (url) – známy canonical problém, rôzne tvary url smerujúce na zhodnú stránku
  • skopírovanie celého alebo časti textu, to platí aj pre preložené a čiastočne pozmenené texty
  • rovnaké nadpisy (title)- taktiež určitá forma duplicity

Ako google rieši duplicitu

Postup vyhodnotenia a následnej “penalizácie” je zhruba nasledovný.

  1. rozpoznanie duplicitného obsahu
  2. porovnanie viacerých zdrojov, ktoré sa zdajú byť podobné
  3. identifikovanie originálu – originál môže byť spoznaný podľa:
  • najskôr zaindexovaný
  • trust rank webu
  • cieľ spätných odkazov na danú problematiku
  • odkazy z kópií textu smerujú späť na originál

4. penalizácia kópií

Tou penalizáciu nemám na mysli nejaký sandbox alebo ban, ale supplemental index. Trestom je teda znížena pozícia v serp-e, čím ste pripravení o návštevnosť z vyhľadávača. Tým sa celá snaha minie účinku.

Čo sa dá robiť?

K tomuto článku ma vlastne priviedol jeden z mnohých rozhovorov na barcampe (ako bolo na BC tu a tu) s Michalom Králom (pricemania.sk). Posťažoval si na horšie pozície ako časť konkurencie, no a mňa hneď napadla práve duplicita. V podstate sú v katalógu duplicitné informácie, ktoré su preberané z materských eshopov. V tomto prípade, je len jedna možnosť. Získavať silné (v zmysle trust ranku, nie pageranku) odkazy, aby google viac veril tomuto webu a posunul ho vyššie vo výsledkoch.

Pridávam video o dôležitosti unikátneho obsahu (en)

15 thoughts on “Duplicitný obsah vs. google

  1. Máte nějaký aktuální fígl, jak zjistit, které stránky webu jsou v normálním a které v supplemental indexu? Co vím, existoval nedokumentovaný dotaz s ***, ale podle posledních informací google se snaží intimní údaje, jako co je v supplemental indexu a co ne, skrýt, tak tuto funkci nepodporuje.

    Jsou nějaké důkazy o tom, že by techniku supplemental indexu používaly i jiné vyhledávače (seznam)_

  2. seznam vraj bojuje s duplicitou, ale ziadne konkretne udaje nemam. Ono potreba ich mat ani nie je, pretoze seznam sa da stale dost lahko oblafnut.
    Pre google “figel” nemam ziadny, je to vec skusenosti a nie je to az take zlozite zistit o co asi ide. Urcite su ale neni taketo udaje volne dostupne.

  3. Ale moze, skus si pustit to video co som sem prave preto dal. Nikde vsak nepisem ze ked sa tak stane ze stranka/clanok vypadne z indexu, ak to google uzna za hodnotny clanok moze ostat zaradeny.

  4. Ahoj T@mas,

    co si myslíš o duplicitě, kdy na 10ti svých webech mám například u kontaktního formuláře stejný text typu: Kontaktujte nás tehdy a tehdy, proto a proto… bla, bla, bla…?

    Může i toto být riziko?

  5. Zase to netreba prehanat :) Potrebujes mas v indexe stranku s formularom, asi nie?! Ale aj tak si nemyslim zeby to mal byt dovod na jej vyradenie.
    Ja som skor narazal napriklad na pr clanky, ktore su prelozene a 100x skopirovane po roznych serveroch pricom google mozno zoberie 1 a na ostatne sa vybodne = zbytocna snaha, 0 ucinok.

  6. To by mohol byt problem pri uverejnovaní tlacoviek, kedy ostava rovnaky nazov a cely obsah.

    V poslednej dobe sa snazim na to davat pozor. Fuuu a ako to je s ciastocne pozmeneným textom v tlacovej sprave sa toho vela neda pozmeniť.

    A posledná vec, ktorá ma zaujíma je penalizácia kópii? (napr: tlacovky). Nepostrehol som, aby prichádzalo k zmazaniu (penalizáciu kopii, chápem ako zmazanie) … poprípade je to niečo iné?

    Tnx

  7. hej kopie tlacovych sprav je dalsi dobry priklad. V indexe sa objavi zdroj a mozno 1-2 dalsie ak ma ale web vysoky trust rank, inak skonci v priepasti google indexu :)
    Ak sa skopiruje cast textu vadit by to nemalo, nie je ziadny meter ze 5 viet byt moze a 10 uz je vela.

  8. Ja tedy dam radeji prednost prekladu kvalitniho materialu nez zfusovanemu bullshitu, proc by vyhledavac nemel postupovat stejne?

    Na vlastnich vebech mam dost prelozenedo materialu a s takovouto strankou jsem nikdy nemel na google problem, prekladam z anglictiny, rustiny a nekdy polstiny, pritom se vyhybam prekladani wiki a podobnych zdroju, kde je pravdepodobnost, ze nekdo udela to same hodne velka.

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *

Môžete použiť tieto HTML značky a atribúty: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>