Duplikacja treści popularnie zwana duplicate content nierzadko spędza sen z powiek wielu właścicielom stron a tym bardziej seowcom i tym początkującym i tym zaawansowanym. Wszyscy wiemy, ze Google nie lubi kopii treści i nierzadko reaguje alergicznie na problemy z tym związane najczęściej grasuje po serwisie Panda. Jak sobie poradzić z powielaniem treści? Nie ma zawsze jednoznacznej metody, która wprost załatwi problem. Ale czy zawsze warto zwalczać duplikację? Przyjrzyjmy się kilku przypadkom.
Duplikacja treści ze względu na kilka stron głównych
Jest to problem nadal występujący objawiający się indeksowaniem przez wyszukiwarki strony głównej, która występuje pod kilkoma adresami.
Czyli w indeksie może znaleźć się:
- pl/
- pl/index.html
- pl/index.php
- zgred.pl/index.html
- i kilka innych
Rozwiązaniem jest kilka:
- Nanosimy poprawki w skrypcie – chyba najtrudniejszy element
- Wykonujemy stosowne przekierowania 301 – tego może być dużo i nie zawsze jest dostęp do ftp
- Implementujemy rel=”canonical” – wymaga poprawek w skrycie. Parametr trzeba umiejętnie wdrożyć bo można to spier… znaczy się zepsuć sobie ponownie.
Nieprawidłowe wdrożenie certyfikatu SSL
W związku z coraz powszechniejszym wykorzystywaniem certyfikatu SSL, szczególnie w branży e-commerce, właściciele decydują się na zaimplementowanie SSL i przejściu na protokół HTTPS nie tylko na stronach wymagających zaufania (koszyk, rejestracja, płatności etc..) ale w całym serwisie.
Sama implementacja nie stanowi problemu ale zapomina się o tym, że serwis z wdrożonym certyfikatem oraz bez niego to dwie różne witryny dla Google. Stąd też:
- Po pierwsze: wykonujemy przekierowania 301 z wersji nonSSL na wersję z wdrożonym SSL (podkreślam: 301 a nie jakieś uje muje dzikie węże)
- Po drugie: w panelu Google Search Console weryfikujemy serwis z wdrożonym HTTPS i ustawiamy domenę preferowaną. Ważne: nie kasujemy z panelu GSC wersji bez SSL.
Uwaga, często poprawy / uaktualnienia wymagają również canonicale użyte wcześniej na stronie – jeśli część z nich była ustawiana ręcznie może zdarzyć się, że wciąż będą wskazywały na adresy z http zamiast z https – w rezultacie tworzy się pętla i problem duplikacji nie znika.
Wersje językowe jako przykład duplikacji treści
Chcąc wyjść poza granice Polski i rozpocząć karierę międzynarodową sprzedając swoje produkty czy usługi poza Polską należy zaimplementować parametr href lang. Tutaj od razu uściślę, że na terenie PL można też zaimplementować wersję anglojęzyczną skierowaną do np. Anglików przebywających na terenie Polski aby serwis zgłaszał im się po angielsku?
Wróćmy jednak do HREF LANG. Implementacja wersji językowych może odbyć się na kilka sposobów – zostały one opisane w support’cie Google pod adresem: https://support.google.com/webmasters/answer/182192?hl=pl&ref_topic=2370587

Najgorszym rozwiązaniem jest implementacja przełączania pomiędzy językami za pomocą parametrów. Zawsze w takim przypadku wersja językowa np. polska i angielska nakładają się to znaczy, że mamy ten sam adres w wersji polskiej i angielskiej – zmienia się tylko treść. Zerknijmy zatem do serwisu: plantulepillows.com

Jak widać pod tym samym adresem znajduje się wersja polska i angielska. Dodatkowo niewłaściwie zaimplementowane są wersje językowe wskazujące ten sam adres dla wersji w języku polskim i angielskim.
Rozwiązanie to oczywista oczywistość – trzeba przebudować skrypt i poprawnie zaimplementować href lang. Ważne: razem z href lang musi być obowiązkowo zaimplementowany parametr rel=”canonical”.
Innymi problemami mogą być wersje tego samego języka np. niemieckiego lub angielskiego przeznaczone na różne kraje. Rozwiązaniem jest oczywiście zaimplementowanie odpowiednich flag językowych. Odsyłam do case study wykonanym przez Bartka Góralewicza i jego team Elephate:
- https://en.ryte.com/magazine/one-global-domain-vs-multiple-tlds-for-an-international-brand-841-visibility-boost-case-study
- https://sprawnymarketing.pl/miedzynarodowe-seo/
Jak to ujął Bartek na jednej z konferencji: przetłumaczyłem angielski na angielski i weszło.
Te same produkty występujące pod różnymi adresami
Wiele sklepów e-commerce posiada takie same opisy produktów w różnych kategoriach. Nie ma problemu gdy zastosujemy parametr canonical, który wskazuje gdzie leży oryginalny produkt z równie oryginalnym opisem. Jednakże nierzadko zabijamy sobie długi ogon na różne produkty z podziałem ze względu na np. kolor, rozmiar.
Jeżeli szukamy np. nazwy produktu plus nazwa firmy to sprawa jest oczywista – można zaprojektować karty produktu z tymi samymi opisami, przełączanymi kolorami i wdrożyć canonical na wersję podstawową. Z punktu widzenia SEO – mamy zaindeksowany produkt oraz nazwę. Z punktu widzenia UX użytkownik ma wszystko pod ręką.
Przykład: https://pl.ecco.com/pl-PL/product/5638498976/ECCO-COOL-2-0

Zmiana koloru powoduje zmianę adresu URL ale jest wdrożony jeden parametr canonical dla wszystkich kart produktowych jednego typu produktu z różnymi kolorami. Podobne rozwiązania ma Samsung na swojej stronie (podstrony ze smartfonami).
Powyższe rozwiązanie jest często stosowane w sklepach producentów. Zerknijcie do Samsunga – ma wdrożone canonicale na wersję podstawową a inne kolory smartfonów mają canonical na „czarne”.
W przypadku sklepów niefirmowych zmiana adresu URL pociąga za sobą zmianę opisu produktu – przykład:
URL: www.eobuwie.com.pl/sneakersy-ecco-cool-2-0-gore-tex-84251301001-black.html

Specjalnie wybrałem te same produkty aby pokazać różnicę w realizacji.
Innym rozwiązaniem może być stworzenie strony pośredniej, na której można wybierać różne gramatury, smaki produktów z własnym opisem i dopiero na tej pośredniczącej stronie kierować użytkownika do produktów docelowych. Wtedy optymalizacja jest wykonana pod kilka słów kluczowych a strony docelowe już pod konkretne słowa wraz z gramaturami, smakami czy kolorami.
Przykład strony pośredniczącej: www.zooplus.pl/shop/psy/karma_dla_psa_mokra/animonda

Na niebiesko oznaczyłem różne gramatury. Na każdej stronie docelowej mamy różne smaki do wyboru.
Paginacja – czyli stronicowanie
W przypadku paginacji zaleca się zastosować dwa parametry: canonical oraz prev/next. Paginacja pozwala na lepsze, szybsze indeksowanie produktów. Pozwala tez sterowac juicy SEO. Niektóre testy pokazują w jaki sposób indeksować i wykonywać stronicowanie aby przynosiło pozytywne rezultaty: https://www.portent.com/blog/seo/pagination-tunnels-experiment-click-depth.htm
Niewłaściwe wykonanie stronicowania może doprowadzić do duplikacji treści pomimo faktu przełączania się między stronami. Google dla stronicowania rekomenduje takie wdrożenie parametru canonical oraz prev/next aby canonical wskazywał „sam na siebie” a prev/next zgodnie z definicją – następną i poprzednią stronę (support Google pod adresem: https://support.google.com/webmasters/answer/1663744?hl=pl)
Co jednak zrobić kiedy audyt seo wskazuje, aby np. opis kategorii to był długi tekst wykonany pod kątem SEO?
Dobry przykład (przypadkowo wzięty z Internetu) znajdziemy pod adresem: https://www.dobrerowery.pl/rowery-gorskie – na pierwszej stronie stronicowania znajduje się drobny tekst SEO. Jeśli przełączymy się na drugą stronę – tekst znika. I to jest dobre rozwiązanie.

Co zrobić w przypadku, gdy tekst nadal by został? Nie ma problemu gdy on jest dość krótki. W przypadku jest dobrej optymalizacji taki tekst będzie posiadał najmarniej 2500zzs. Tym samym na następnych stronach nie powinien istnieć. Dlatego można zastosować jedne z poniższych rozwiązań:
- Tekst na drugiej i każdej następnej podstronie jest usuwany
- Wykonujemy canonical ze wszystkich stron stronicowania na pierwszą stronę
- Na strony od2 do ostatniej wstawiamy „noindex” do stronicowania
- oraz inne możliwe rozwiązania.
Blokowanie stronicowania za pomocą „noindex” oraz canonical nie jest dobre gdyż obcinamy sobie indeksację, juicy seo dla produktów w danej kategorii.
Sortowanie, które zawsze miesza
W przypadku sortowania i parametryzacji z tym związanej jedyną rzeczą, którą się stosuje jest canonical na wersję bez parametrów.
Jednakże warto chwile się zastanowić i przeanalizować, czy z sortowania nie można wykonać dodatkowej nowej podstrony, którą można zoptymalizować pod kątem SEO i pozyskać dodatkowy ruch organiczny na jakieś tam słowo kluczowe.
Powielone opisy produktów
Poradzenie sobie z mnogością produktów, które mają ten sam opis jest wiele można je by mnożyć, bo każdy ma jakieś sensowne rozwiązanie. Wystarczy czasem przejrzeć konkurencję w poszukiwaniu dobrego rozwiązania.
Wiadomo, że najprościej jest wykonać reedycję opisu, napisać opis produktu na 500-1000zzs i cieszyć się oryginalnością. Ale wszystko zawsze jest do czasu aż ktoś skopiuje wtedy można się przejmować, gdy Nas przeskoczy, ale z reguły wtedy jesteśmy już daleko z przodu.
Najczęstszym błędem jest podpinanie tych samych opisów w sklepie do porównywarek cenowych. Wtedy nie pomoże nam praktycznie nic. Każda porównywarka przeskoczy Nas w wynikach na nazwę produktu. Tutaj jedyną rekomendacją jest stworzenie dwóch opisów – jeden masz swój własny, drugi wysyłasz w świat.
Z punktu widzenia zarządzania dobrym rozwiązaniem jest zastosowanie macierzy BCG.

Źródło: productvision.pl
Znając swoja sprzedaż, sezonowość i inne aspekty produktowe jesteśmy w stanie podzielić je na 4 kategorie. Znakami zapytania i kulami u nogi się nie zajmujemy – są to produkty, które słabo się sprzedają lub praktycznie wcale. Na nich się nie zarabia (wtedy wystawia się je na Allegro). Natomiast warto poświęcić chwilę uwagi tym, które są bardzo popularne i mają dużą marżę – czyli zarabiamy. Dla tych produktów warto pochylić się nad opisem. Dzięki temu zbudujemy przewagę konkurencyjną i mamy rozwiązany, przynajmniej częściowo, problem duplikacji treści.
Pewnego rodzaju rozwiązaniem może być stosowanie na kartach produktów dużej liczby linków wewnętrznych związanych z cross-selling’iem oraz up-selling’iem. Odpowiednio przedstawione inne produkty na karcie danego produktu wraz z kawałkiem opisu produktu linkowanego nie musi powodować duplikacji treści względem wielu setek takich samych opisów na innych sklepach. Ale tutaj dodatkowo należy wyświetlać zajawki tekstów z bloga kafelki z kawałkiem tekstu z każdego opisu.
Oczywistą oczywistością jest to, że opinie i recenzje budują zawsze content taki nieunikalny, skopiowany staje się contentem unikalnym (no może prawie). Do recenzji czy komentarza zawsze warto zachęcić – czy to w formie mejla z podziękowaniem czy to za dodatkowe bonusy. Ale jak to nie pomoże to czemu by nie napisać swojego?
Pośrednią metodą na radzenie sobie z duplikacją, szczególnie w sklepach, jest wykonanie mocno rozbudowanego opisu kategorii nadrzędnej i wykonanie linkowania wewnętrznego dla dosłownie kilku produktów z treści opisu kategorii. W trakcie procesu pozycjonowania kategoria zawsze jest elementem pozycjonowanym – dzięki temu juicy seo wpływa silnie na produkt ze zduplikowanym opisem.
Parametryzacja, linki afiliacyjne
Parametryzacja czy tez program partnerski ze swoimi linkami afiliacyjnymi może doprowadzić do duplikacji treści. Parametry typu UTM mogą być indeksowane przez wyszukiwarki – tym samym będzie zachodzić podejrzenie duplikowania treści pod tymi samymi adresami. Wystarczy w Google wpisać polecenie „inurl:utm_campaign” aby odnaleźć kilka przykładów.
W przypadku linków związanych z programami partnerskimi w indeksie mogą pojawić się adresy związane np. ze stroną główną i po znaku zapytania jakieś parametry np. ref_id.
Rozwiązaniem jest (bardzo rzadkim) zastosowanie znaku „#” (hash) – Google nie indeksuje rzeczy po „#”. Ale tutaj uwaga: w wynikach mobilnych już indeksuje. Tak więc rozwiązaniem jest zastosować odpowiednio wykonany canonical w nagłówku.
Poniżej screen gdzie canonical’a niestety brak:

Należy tez pamiętać, że parametry można blokować z poziomu Google Search Console.
Niestety, nie samym Google’m człowiek żyje dlatego też ta opcja nie zawsze się przydaje jeśli docelowo chcemy zaistnieć również w innych wyszukiwarkach typu Bing, Yandex czy inne.
Duże bloki tej samej treści
Problemem mogą być również duże bloki tej samej treści powielane (wyświetlane) np. w sklepach e-commerce na każdej podstronie. Dotyczy to wstawionego tekstu z wymiarami, opisami, regulaminem lub wywoływanego za pomoca okienek popup. Tutaj nie ma dobrego rozwiązania jednakże najpopularniejszym jest wykonanie tego kawałka tekstu w postaci obrazka – jednakże obrazek może być problemem na urządzeniach mobilnych. Dlatego najlepiej jest wyrzucić to na osobną stronę. Za pierwszym razem klient sprawdzi rozmiary ale za kolejnym no przecież już zna swój rozmiar. No chyba, że efekt jojo lub przytył 😉
Podsumowanie
Co o tym sądzicie? Oczywiście na koniec drobna bibliografia:
https://projektmarketing.pl/duplicate-content-powielanie-tresci/ – to warto odwiedzić !!!
https://blog.clearsense.pl/blog/duplicate-content-czym-jest-zjawisko-duplikacji-tresci/
https://makoblog.com/pl/polski-czesc-1-duplicate-content-czym-jest-duplikacja-tresci-i-jak-sie-przed-nia-uchronic/
https://support.google.com/webmasters/answer/66359?hl=pl i to na koniec
Tak. Jest krytyczna z punktu widzenia indeksacji oraz rankowania w wynikach organicznych. Nagromadzenie duplikacji negatywnie wpływa na tak zwany crawl budget a to przekłada się na gorsze pozycje.
Najszybciej, ale i najdrożej, to napisać wszystkie teksty unikalne. Patrząc na rezultat jest to, moim zdaniem, najlepszy wybór.
Rozwiązaniem jest otwarcie się na komentarze, recenzje, pytania FAQ – dzięki temu powstaje unikalny content, który jest dobrze postrzegany przez roboty i pozycje rosną.
Zdecydowanie canonical. Przekierowanie 301 powoduje, że strona przestaje istnieć w serwisie i jest niedostępna dla użytkownika. Więc tutaj bardziej kierujemy się użytecznością niż wartościami SEO.
Dodaj komentarz