Jak duplicate content (duplikacja treści) wpływa na SEO? Rozpoznanie, eliminacja i prewencja powielonego contentu
Aktualizacja: 15 listopada 2024
Duplikacja treści to jedna z pierwszych rzeczy, przed którą ostrzeże Cię specjalista SEO. Jak mantrę będzie powtarzać, że content powinien być wartościowy, a przede wszystkim unikalny, niekopiowany ze stron konkurencji, materiałów od producentów. Na czym tak naprawdę polega duplicate content i czemu tak porusza seowców? Jak wykrywać i eliminować kopie treści na stronie internetowej? I – co najważniejsze – jak powinna wyglądać prewencja, czyli jak nie dopuścić do powielania treści w serwisie? Temat jest nieco techniczny i nie ze wszystkim poradzisz sobie samodzielnie, ale nakreślę istotne zagadnienia oraz podpowiem, co możesz zrobić we własnym zakresie, pracując na contencie.
Co to jest duplicate content?
Duplikacja treści występuje, gdy ten sam tekst znajduje się na różnych stronach internetowych (duplikacja zewnętrzna) lub na różnych podstronach tego samego serwisu (duplikacja wewnętrzna). Kopiowanie tekstów nie jest dobrą praktyką, ponieważ:
- jeśli przekopiujemy treść z innej strony internetowej i nie mamy na to zgody właściciela treści, dokonujemy kradzieży własności intelektualnej, możemy za to odpowiedzieć przed sądem,
- jeśli użytkownik po raz kolejny widzi ten sam content, zrezygnuje z konsumpcji treści, która nie wnosi żadnych nowych informacji, nie przynosi żadnej wartości,
- i oczywiście wyszukiwarka Google nie lubi nieunikalnych treści, nakładając kary i obniżając pozycje serwisu w wynikach wyszukiwania.
Źródło: https://www.semrush.com/blog/duplicate-content/
Czyli duplicate content to po prostu posiadanie takiej samej treści jak konkurencja lub powielanie jej w obrębie swojego serwisu. Motywacje i powody takiej sytuacji mogą być różne i ogólnie rzecz biorąc, kopie treści są złe. Istnieją pewnie wyjątki, co rozwijam poniżej.
Sprawdź, na czym polega content experience.
Rodzaje duplikacji treści
W powyższej definicji duplicate content pojawiają się już rodzaje duplikacji treści:
- zewnętrzna (external duplicate content),
- wewnętrzna (internal duplicate content).
Przyczyny i sposoby eliminacji powyższych typów duplikacji mogą być różne, w dalszej części artykułu znajdziesz zestawienie, z czego mogą wynikać i jak usuwać zarówno internal, jak i external duplicate content.
Jaka długość treści uznawana jest za duplicate content?
Tego niestety nie wie nikt. Reguły gry wyznacza w tym zakresie Google, który nie chwali się takimi informacjami. Uznaje się, że im krótszy ciąg znaków następujących po sobie jest takich samych jak na innej stronie, tym lepiej. Do powielania treści zalicza się także lekka modyfikacja treści – wyszukiwarka coraz lepiej radzi sobie z rozpoznaniem dość wiernej modyfikacji treści. Pamiętaj też, że Google ocenia duplikację contentu w skali całej podstrony, ustalając sobie pewien procent treści unikalnej do skopiowanej. Im więcej treści unikalnej, to tym lepiej.
Dowiedz się też, czym są intencje wyszukiwania.
Duplicate content a SEO – dlaczego kopie treści szkodzą stronie internetowej?
W 2011 r. wyszukiwarka Google wypuściła algorytm o nazwie Panda. Jego celem była ochrona internetu przed spamem i niskiej jakości treściami niespełniającymi potrzeb informacyjnych użytkowników. Pod niską jakością krył się wtedy content generowany automatycznie, skopiowany z innych stron oraz przygotowany z myślą o manipulacji algorytmu. Spadki w wynikach wyszukiwania notowały notorycznie strony posiadające zbyt małą ilość tekstu (thin content) lub właśnie kopie treści. Nakładane były też tzw. kary ręczne, wycinające zupełnie serwis z organicznych wyników wyszukiwania.
Z rok czy z dwa lata temu Panda została wciągnięta do głównego algorytmu Google, ale nie zmieniło to nic w zasadach oceny jakości treści, a nawet zostały zaostrzone. Co prawda kary ręczne za kopie treści nakładane są już dużo rzadziej, ale podstrony (nie całe serwisy) posiadające duplicate content albo nie pojawiają się w wynikach wyszukiwania, albo osiągają niskie pozycje. A to skutkuje spadkiem ruchu na stronie, mniejszą widocznością witryny, brakiem możliwości dotarcia do użytkowników zainteresowanych tematyką strony czy bloga.
Dlaczego Google uznaje kopiowanie treści za niegodną pochwały praktykę?
- Po pierwsze, Google od zawsze premiuje serwisy i twórców, którzy wkładają serce w prowadzenie swoich stron internetowych. W zamyśle ranking wyników wyszukiwania ma prezentować tylko takie serwisy, na których użytkownik znajdzie ciekawe informacje, które odpowiedzą na zadane pytanie. Opracowanie wartościowych treści zajmuje czas, wiąże się z posiadaniem wiedzy, doświadczenia. Kopia treści to po prostu kradzież czyjejś twórczości, pójście na łatwiznę i wykorzystanie czyjegoś wysiłku i czasu.
- Po drugie, algorytmy Google nie są ludźmi i nie potrafią (przynajmniej na razie) ocenić tak jak człowiek, czy dana treść jest ciekawa i wartościowa. Najłatwiejszym sposobem oceny jakości treści stało się więc sprawdzenie, czy treść powiela się na innych serwisach.
Sprawdź też, na czym polega recykling treści.
Ocena unikalności treści przez Google
Duplikacja treści wiąże się z jeszcze jednym problemem – przypisaniem autorstwa do treści. W przypadku duplicate content Google nie jest w stanie w sposób obiektywny ustalić, kto jest autorem treści. W indeksie prawdopodobnie nie są przechowywane daty publikacji contentu, więc wyszukiwarka ma problem z określeniem autorstwa. Co więc robi?
- Za autora treści zostaje uznana strona o największej reputacji.
- Na nią składa się szereg czynników – wiek domeny (strony), jej kondycja techniczna, liczba i jakość linków zwrotnych itd.
- Słowem wielkie serwisy, nad których optymalizacją pracują całe zespoły SEO, w większości przypadków wypadają lepiej niż blogi, małe i młode strony prowadzone przez blogerów.
- To powoduje, że jeśli np. Allegro skopiuje treść z mojej strony, po przeindeksowaniu prawdopodobnie to Allegro zostanie uznane za autora mojej treści.
Co w takiej sytuacji można zrobić? Wkroczyć na drogę sądową z osobą / firmą, która dokonała kradzieży treści i zadbać o unikalność tekstu u siebie, o czym przeczytasz poniżej. Google przecież nie będzie wiedzieć, że sprawa trafiła do sądu i że dochodzisz swoich praw jako autor treści.
Chcesz dowiedzieć się więcej o unikalności treści? Zapraszam na szkolenie z content marketingu.
Ocena jakości treści w trudnych branżach
Na szczęście algorytmy Google cały czas są usprawniane i dopasowywane do ograniczeń prawnych dotyczących niektórych branż. Wyszukiwarka „uczy się”, że nie każdy tekst może być unikalny, a pewne formułki czy treści muszą być takie same, bo tak po prostu wynika z przepisów. Przykładem są opisy produktów leków czy treści ustaw. W przypadku takich branż, w których powielanie treści jest na porządku dziennym, Google ma większą tolerancję na kopie. Nie są one tak jakby brane pod uwagę przy ocenie jakości np. contentu medycznego. Znaczenie ma tu inna, autorska treść pojawiająca się na stronie, o ile istnieje możliwość jej przygotowania.
Przykład – strona apteki online
- Kopie treści: opisy produktów
- Unikalna treść: poradnikowe teksty blogowe
Jak wykryć duplikację treści?
Identyfikacja kopii treści w serwisie nie jest czymś trudnym – może być czasochłonna albo kosztochłonna, ale nie powinna nastręczyć Ci większych trudności. A metod wykrycia powielonego contentu masz do wyboru kilka.
Ręczne sprawdzanie zewnętrznej duplikacji treści w Google
- Skopiuj charakterystyczny fragment treści ze swojej strony. Nie może być zbyt długi.
- Wklej go do wyszukiwarki w cudzysłowie. Cudzysłów sprawi, że Google będzie szukać treści o dokładnym dopasowaniu.
- Zobacz, co pojawiło się w wynikach wyszukiwania.
- Jeśli jest tam tylko Twoja strona, to Ok, nie masz problemu z duplikacją treści na tej podstronie lub z tym fragmentem tekstu.
- Jeśli widzisz inne serwisy, a w Decription pogrubiona jest dokładnie taka sama treść, którą wkleiłeś do Google, oznacza to kopie treści.
Sprawdź też, na czym polega content decay.
Duplicate content checker
To dedykowane narzędzia wykrywające kopie treści. Pamiętaj, że checkery wyłapujące zewnętrzną duplikację nigdy nie wykazują 100% pewności, ponieważ nie mają dostępu do indeksu Google, a operują na swoich bazach danych. Jeśli wskażą duplicate content, to znaczy, że kopie występują, ale w drugą stronę mogą wystąpić pewne przekłamania.
Mogę polecić Ci 2 następujące narzędzia:
- Copyscape – wykrywa duplikację zewnętrzną,
- Siteliner – wyłapuje kopie treści w obrębie serwisu.
Jest jeszcze Screaming Frog, który pomaga w identyfikacji wewnętrznej duplikacji treści. To już bardziej zaawansowane narzędzie, crawler, który analizuje zawartość strony www, podobnie jak robi to Google. Nie jest to duplicate checker a kombajn do crawlowania strony, używany głównie przez specjalistów SEO.
Sprawdź też, na czym polega kanibalizacja słów kluczowych.
Przyczyny internal duplicate content – jak naprawić duplikację treści na podstronach swojego serwisu?
Zaczniemy od przeanalizowania przyczyn i sposobów pozbycia się wewnętrznej duplikacji treści. Nad tekstami powielonymi w obrębie serwisu jest zdecydowanie łatwiej zapanować, ponieważ w dużej mierze kopie wynikają z błędów technicznych. Ich usunięcie, choć może wymagać wsparcia deweloperskiego, od razu pozwala na zażegnanie problemu.
Tabela. Najczęstsze powody internal duplicate content i metody eliminacji kopii treści
Przyczyna wewnętrznej duplikacji treści | Opis | Rozwiązanie |
---|---|---|
Zaindeksowanie strony deweloperskiej. | Bardzo często deweloperzy testują zmiany na wersji testowej strony, która jest kopią wersji produkcyjnej. Jeśli zostanie zaindeksowana, powstanie duplikacja treści. | Zablokowanie strony deweloperskiej przed indeksacją, a nawet zablokowanie dostępu do niej hasłem, aby postronne osoby nie mogły się do niej dostać. |
Różne wersje serwisu: z www i bez www, z https i http, ze / i bez / na końcu. | Dla Google adres www.nazwa.pl i nazwa.pl to dwie różne strony. | Wdrożenie przekierowań 301. |
Strona główna istnieje pod różnymi adresami, np. domena.pl, domena.pl/index.html. | Jak wyżej. | • Poprawa struktury i skryptu strony, by nie powstawały różne URL-e dla tej samej strony/zawartości. • Wdrożenie przekierowań 301. • Wprowadzenie przekierowań kanonicznych. |
Duplikacja treści w Title i Description. | Znaczniki Title i Description powinny być unikalne dla każdej podstrony. | • Przygotowanie unikalnych meta tagów dla każdej podstrony. • Przy dużych serwisach można przygotować schematy pozwalające na generowanie unikalnych znaczników, np. w przypadku Title: H1 (nazwa podstrony) – rodzaj strony (np. kategoria, blog) – element brandowy. |
Powielanie treści na podstronach o podobnej tematyce. | Problem dotyczy najczęściej dużych sklepów internetowych, mających w strukturze dość wąskie kategorie (np. buty do biegania rozmiar 38). | Przygotowanie unikalnych treści dla każdej z kategorii, a przynajmniej nie kopiowanie ich i wprowadzanie jedynie kosmetycznych zmian. |
Niewłaściwie wyświetlanie treści na kolejnych stronach paginacji. | Taki sam tekst wyświetla się na kolejnych stronach paginacji. | • W przypadku paginacji warto zastosować rozwiązania: o Kanoniczne adresy URL – rel=”canonical” o Atrybuty rel=”prev” i rel=”next”, o Kanoniczne adresy URL i atrybuty rel=”prev” i rel=”next”. • Pokazywanie treści tylko na 1 stronie paginacji, nie powielanie jej na kolejnych podstronach. |
Generowanie stron w oparciu o filtry, sortowanie, tagi, wyniki wyszukiwania z wyszukiwarki. | Strony generowane automatycznie w oparciu o kryteria filtrowania albo wyszukiwania produktów często posiadają podobną zawartość, a produkty są pokazane w innej kolejności. To też duplikacja treści. | • Wprowadzenie przekierowań kanonicznych. • Zablokowanie stron przed indeksacją. |
Duplikacja opisów podobnych produktów. | Produkty różniące się jedną lub kilkoma cechami, np. kolorem, gramaturą, smakiem itd. posiadają ten sam opis. | • Odpowiednie przygotowanie karty produktu, aby zmiana cechy/parametru nie powodowała generowanie nowego adresu URL. • Wprowadzenie przekierowań kanonicznych. • Przygotowanie unikalnego opisu dla każdego wariantu produktu. |
Sprawdź też, na czym polega content pruning.
Jak walczyć z zewnętrzną duplikacją treści?
Zewnętrzna duplikacja treści, o ile nie jesteś właścicielem tekstów, dodatkowo naraża Cię na ryzyko prawne. Niesie też dotkliwsze konsekwencje w postaci obniżenia pozycji w wynikach wyszukiwania, Google traktuje ją jak kradzież treści, czyli jedno z największych przewinień.
Przyczyny zewnętrznej duplikacji treści
- Kopiowanie (kradzież) treści z innych serwisów.
- Korzystanie z treści od producenta, które udostępniane są wielu partnerom / serwisom.
- Publikowanie tej samej treści w różnych kanałach – np. tworzenie opisu produktu, który trafia na naszą stronę www, Allegro i inne platformy sprzedażowe.
- Nieuczciwy copywriter, który zamiast pisać unikalne treści, kradnie je z innych serwisów. Sprawdź, jak znaleźć dobrego copywritera do współpracy.
- Zbyt mocne inspirowanie się treściami konkurencji i zbyt mała modyfikacja treści.
- Cytowanie zbyt długich fragmentów treści – dla Google kopia treści to kopia, nieważne, że dodasz źródło i przypis, wskazując autora tekstu.
- Stosowanie nieumiejętnie przygotowanych tekstów w synonimach, czyli takich, które generują mało unikalnych kombinacji treści.
- Publikowanie tej samej treści w social media, co na stronie internetowej.
- Formułki prawne, treść polityki cookies, regulaminy.
- Nieumiejętne wykorzystanie ChataGPT do generowania treści.
Treści generowane przez AI i ChatGPT a duplicate content
Na chwilę chciałabym się zatrzymać przy wszędobylskim ChacieGPT. To narzędzie nie robi sobie nic z praw autorskich i może przygotować tekst, który będzie kopią treści np. konkurencji. Niezła byłaby wtopa, gdyby na Twojej stronie pojawił się taki sam content jak u zawziętego rywala, który na dodatek spędził wiele godzin nad przygotowaniem materiału.
- By się przed tym ustrzec, wskazuj w prompcie, że tekst ma być unikalny.
- Nie wierz jednak AI na słowo. Dodatkowo skorzystaj z narzędzi do wykrywania duplikacji i sprawdź unikalność.
- Modyfikuj także tekst, dopasowując go do własnego stylu.
Pamiętaj także, że Chat, jak copywriter, może powielać sam siebie. Korzystając z niego, trenujemy go, może się więc zdarzyć, że wygeneruje Ci tekst, który wygenerował innemu użytkownikowi. Do tego też Chat posługuje się pewnymi schematami układania zdań, wypowiedzi, a one sprawiają, że teksty są do siebie bardzo podobne. Weź więc sobie do serca modyfikację treści po ChacieGPT.
Więcej o prawach autorskich w kontekście ChataGPT przeczytasz w artykule: AI a pisanie książek.
Jak usunąć zewnętrzną duplikację treści?
- Przeredaguj tekst.
- Napisz go na nowo.
- Zablokuj stronę przed indeksacją – rozwiązanie polecane do wszelkich treści „prawniczych”, które muszą być w serwisie, ale nie są wartościowe dla użytkowników, nie stanowią też clue Twojego biznesu.
- Minimalizuj treść, która z jakiś względów musi być taka sama, której nie możesz zmodyfikować (np. ze względu na ograniczenia prawne) i obudowuj ją unikalną, oryginalną treścią.
- Zamieść tekst na grafice – formułki prawne i treści, których nie możesz zmodyfikować, zamieść na grafice. Pamiętaj tylko, że z punktu widzenia Google masz wtedy grafikę na stronie, a nie treść. Sprawdź też SEO images.
A co jeśli to konkurencja ukradła od nas treść?
- Skontaktuj się ze złodziejem i poproś o usunięcie treści. Postrasz naruszeniem spraw autorskich.
- Wytocz proces sądowy, jeśli konkurencja nie będzie chciała spełnić Twoich roszczeń.
- Jeśli to możliwe, zmień treść na swojej stronie, chociaż do czasu, zanim nie zniknie ze strony konkurencji. Google niestety nie wie, co się dzieje poza online (np. w sądach), a jak wspomniałam wcześniej, nie zawsze dobrze przypisze autorstwo treści. Jeśli zależy Ci na wynikach organicznych, musisz też zadziałać po swojej stronie.
Sprawdź też, jak obliczyć content marketing ROI.
Prewencja duplikacji treści – jak zapobiegać powstawaniu kopii treści
Myślę, że już wiesz, co należy zrobić, aby nie doprowadzić do duplicate content – pisać unikalne treści!
- Nie kopiuj i nie kradnij contentu.
- Nie korzystaj z treści od producentów.
- Unikaj schematycznego pisania, aby nie doprowadzić do autoduplikacji.
- Przygotuj różne wersje np. opisów produktów. Jeden na swoją stronę i jeden na inne platformy sprzedażowe. Treści pomiędzy platformami sprzedażowymi mogą się powtarzać.
- Nie kopiuj treści artykułu blogowego, by zamieścić go w social media.
- Nie cytuj zbyt długich fragmentów treści.
- Twórz umiejętnie treści w synonimach, korzystaj rozsądnie z generatorów treści AI.
- Dbaj o techniczne aspekty strony www i na bieżąco rozwiązuj problemy z internal duplicate content.
- Prowadź regularny monitoring unikalności treści – ręcznie, za pomocą Copyscape lub Semrush.
Przykład i Case Study: duplikacja treści na blogach recenzentów książkowych
Gdy ukazała się moja książka Oddech Śmierci, zauważyłam, że wielu blogerów i recenzentów książkowych na portalach pokroju lubimyczytac.pl, a też w sklepach internetowych posiadających możliwość komentowania produktów, zamieszcza tę samą treść recenzji, która już znajduje się na blogu. Efekt? Oczywiście powstanie duplicate content.
Ponadto często obok recenzji znajduje się opis książki pochodzący najczęściej z okładki lub oficjalnych materiałów wydawnictwa. Każda księgarnia, każdy sklep lub portal książkowy dysponuje takim tekstem i zamieszcza go na swojej stronie, więc bloger automatycznie w swoim serwisie posiada kolejną, nieunikalną treść!
Sprawdźmy, co dzieje się w wynikach wyszukiwania. Skopiowałam fragment tekstu z bloga Biblioteczka ciekawych książek i wrzuciłam go do wyszukiwarki w cudzysłowie (oznaczającym dokładne dopasowanie).
Blog nie znalazł się na pierwszym miejscu w wynikach wyszukiwania, a wyprzedziła go domena o znanym brandzie. Dodatkowo do TOP10 trafiły inne, rozpoznawalne domeny. Przyzwyczajamy się do znanych i popularnych marek (a w tym przypadku nazw portali), więc użytkownik w pierwszej kolejności kliknie link, który będzie prowadził do rozpoznawalnego serwisu, a nie mało znanego bloga książkowego.
Wniosek? Nie dzielmy się treścią z innymi serwisami. Z recenzjami książek jest tak samo jak z wrzucaniem takich samych opisów produktów na swoją stronę i na platformy sprzedażowe. Nie udostępniajmy tej wartościowej treści. Jeśli chcesz opublikować swoje przemyślenia na serwisach typu lubimyczytac, przygotuj 2 wersje recenzji – dopieszczoną na bloga, drugą na zewnętrzny serwis. Może Ci w tym pomóc ChatGPT, który dość dobrze poradzi sobie z parafrazowaniem treści, przygotowaniem jej drugiej wersji.
Nie chcesz borykać się z problemem duplicate content? Twórz tylko unikalne treści!
Zadbaj o treści na swoim serwisie. Nie kopiuj, nie powielaj i nie kradnij. Pisz z myślą o użytkowniku, stosuj zasady SEO copywritingu i nie idź na łatwiznę. Kolejne aktualizacje algorytmów coraz mocniej uderzają w strony z contentem o słabej jakości. Dobre teksty kosztują i pochłaniają czas, więc lepiej podchodzić do tego procesu strategicznie i z rozmysłem, niż tworzyć duplicate content na potęgę, który tylko zaszkodzi pozycjom Twojego serwisu w wyszukiwarce Google.
Źródła i dodatkowe informacje
- https://www.semrush.com/blog/duplicate-content/
- https://www.searchenginejournal.com/truth-about-duplicate-content/442265/
- https://backlinko.com/hub/seo/duplicate-content