Duplicita je častá chyba pri tvorbe/optimalizácii webov. Postihmi za duplicitný obsah nám google pripomína význam originálneho (ani nie tak kvalitného) obsahu.
Často sa neúspech zdvôvodňuje chybami v kóde, nízkym počtom spätných odkazov, alebo ich kvalitou, vekom webu, či napríklad sandboxom, no chyba môže byť práve v samotnom obsahu, ktorý web (ne)poskytuje návštevníkom.
Formy duplicity
Je ich niekoľko. Ako vidíte nejde len o obsah. Takouto formou vám môžu uškodiť aj:
- duplicitné adresy (url) – známy canonical problém, rôzne tvary url smerujúce na zhodnú stránku
- skopírovanie celého alebo časti textu, to platí aj pre preložené a čiastočne pozmenené texty
- rovnaké nadpisy (title)- taktiež určitá forma duplicity
Ako google rieši duplicitu
Postup vyhodnotenia a následnej “penalizácie” je zhruba nasledovný.
- rozpoznanie duplicitného obsahu
- porovnanie viacerých zdrojov, ktoré sa zdajú byť podobné
- identifikovanie originálu – originál môže byť spoznaný podľa:
- najskôr zaindexovaný
- trust rank webu
- cieľ spätných odkazov na danú problematiku
- odkazy z kópií textu smerujú späť na originál
4. penalizácia kópií
Tou penalizáciu nemám na mysli nejaký sandbox alebo ban, ale supplemental index. Trestom je teda znížena pozícia v serp-e, čím ste pripravení o návštevnosť z vyhľadávača. Tým sa celá snaha minie účinku.
Čo sa dá robiť?
K tomuto článku ma vlastne priviedol jeden z mnohých rozhovorov na barcampe (ako bolo na BC tu a tu) s Michalom Králom (pricemania.sk). Posťažoval si na horšie pozície ako časť konkurencie, no a mňa hneď napadla práve duplicita. V podstate sú v katalógu duplicitné informácie, ktoré su preberané z materských eshopov. V tomto prípade, je len jedna možnosť. Získavať silné (v zmysle trust ranku, nie pageranku) odkazy, aby google viac veril tomuto webu a posunul ho vyššie vo výsledkoch.
Máte nějaký aktuální fígl, jak zjistit, které stránky webu jsou v normálním a které v supplemental indexu? Co vím, existoval nedokumentovaný dotaz s ***, ale podle posledních informací google se snaží intimní údaje, jako co je v supplemental indexu a co ne, skrýt, tak tuto funkci nepodporuje.
Jsou nějaké důkazy o tom, že by techniku supplemental indexu používaly i jiné vyhledávače (seznam)_
seznam vraj bojuje s duplicitou, ale ziadne konkretne udaje nemam. Ono potreba ich mat ani nie je, pretoze seznam sa da stale dost lahko oblafnut.
Pre google “figel” nemam ziadny, je to vec skusenosti a nie je to az take zlozite zistit o co asi ide. Urcite su ale neni taketo udaje volne dostupne.
Ako to myslis s tym prekladom, ked dam predsa prelozit cesky alebo anglicky clanok do slovenciny, nemoze zatial rozoznat duplicitu, alebo ano?
Ale moze, skus si pustit to video co som sem prave preto dal. Nikde vsak nepisem ze ked sa tak stane ze stranka/clanok vypadne z indexu, ak to google uzna za hodnotny clanok moze ostat zaradeny.
Ahoj T@mas,
co si myslíš o duplicitě, kdy na 10ti svých webech mám například u kontaktního formuláře stejný text typu: Kontaktujte nás tehdy a tehdy, proto a proto… bla, bla, bla…?
Může i toto být riziko?
Zase to netreba prehanat
Potrebujes mas v indexe stranku s formularom, asi nie?! Ale aj tak si nemyslim zeby to mal byt dovod na jej vyradenie.
Ja som skor narazal napriklad na pr clanky, ktore su prelozene a 100x skopirovane po roznych serveroch pricom google mozno zoberie 1 a na ostatne sa vybodne = zbytocna snaha, 0 ucinok.
To by mohol byt problem pri uverejnovaní tlacoviek, kedy ostava rovnaky nazov a cely obsah.
V poslednej dobe sa snazim na to davat pozor. Fuuu a ako to je s ciastocne pozmeneným textom v tlacovej sprave sa toho vela neda pozmeniť.
A posledná vec, ktorá ma zaujíma je penalizácia kópii? (napr: tlacovky). Nepostrehol som, aby prichádzalo k zmazaniu (penalizáciu kopii, chápem ako zmazanie) … poprípade je to niečo iné?
Tnx
hej kopie tlacovych sprav je dalsi dobry priklad. V indexe sa objavi zdroj a mozno 1-2 dalsie ak ma ale web vysoky trust rank, inak skonci v priepasti google indexu
Ak sa skopiruje cast textu vadit by to nemalo, nie je ziadny meter ze 5 viet byt moze a 10 uz je vela.
Tomáš, preklad nie je duplicitou, je to užitočný obsah. Zle si porozumel tomu, čo Rand na videu hovorí.
no lepsie som to popisal v tomto komente http://www.svetdomen.sk/duplicitny-obsah-vs-google/#comment-2847
Samozrejme aj preklad moze byt uzitocny, ale web ktory len preklada clanky nebude prilis cenny, rovnako ako prelozeny text, ktore je xkrat kopirovany. Citacia ale sem-tam preklad urcite neuskodi ak sa prida aj vlastny text.
Ja tedy dam radeji prednost prekladu kvalitniho materialu nez zfusovanemu bullshitu, proc by vyhledavac nemel postupovat stejne?
Na vlastnich vebech mam dost prelozenedo materialu a s takovouto strankou jsem nikdy nemel na google problem, prekladam z anglictiny, rustiny a nekdy polstiny, pritom se vyhybam prekladani wiki a podobnych zdroju, kde je pravdepodobnost, ze nekdo udela to same hodne velka.
ako som pisal, sem tam preklad obohateny vlastnym textom ti neuskodi, ak ale svoj web postavis na preberani a prekladani cudzieho textu, tak pohoris.