محتوای تکراری : دلایل ایجاد شدن مطالب تکراری و نحوه حل آن

8

موتورهای جستجو مانند گوگل معمولا با مشکلی با نام محتوای تکراری1 مواجه هستند. محتواهای تکراری به این معناست که در سایت شما دو یا چند محتوای یکسان اما با URL‌های مختلف وجود دارند. با وجود چنین محتواهای تکراری در سایت موتورهای جستجو سردرگم می‌شوند و نمی‌دانند که کدام یک را در صفحه نتایج جستجو نشان دهند.  این مشکل می‌تواند به رتبه‌گیری و سئو این صفحات لطمه وارد کند. به علاوه وقتی که افراد مختلف شروع به لینک دادن به انواع مختلف این مطالب شبیه به هم کنند مشکلات بیشتر هم می‌شود.

این مقاله به شما کمک خواهد کرد که دلایل ایجاد شدن مطالب تکراری در سایت را شناسایی کنید و نحوه حل انواع این مشکل را نیز فرا بگیرید. با ما همراه باشید.

 

محتوای تکراری چیست؟

محتوای تکراری محتوایی است که در سایت شما در جاهای مختلف (با لینک‌های مختلف) وجود دارد. به دلیل وجود لینک‌های مختلف برای مطالب یکسان، موتورهای جستجو نمی‌توانند تشخیص دهند کدام‌یک را بالاتر از دیگری در موتورهای جستجو قرار دهند. بنابراین ممکن است رتبه هر دو را کاهش دهند و سایت‌های دیگر را بالاتر قرار دهند.

در این مقاله بیشتر بر دلایل فنی و تکنیکی ایجاد محتوای تکراری در سایت و حل این مشکلات تمرکز خواهیم کرد.

 

نمونه ای محتوای تکراری

بیایید با یک مثال موضوع محتوای تکراری را روشن‌تر کنیم.

تصور کنید که در یک جاده در حال رانندگی هستید و قصد سفر به یک شهر خاص را دارید. اگر تابلوهای جاده دو مسیر مختلف و متضاد را به همان شهر نشان دهند چه اتفاقی می‌افتد؟ کدام مسیر را باید رفت؟ در این حالت حتما سردرگم خواهید شد.

در مورد محتوای تکراری هم همین مشکل وجود دارد.

شاید برای کاربران خیلی فرقی نکند که از کدام محتوا (بین چند محتوای یکسان) دیدن کنند. چون این محتواها یکسان هستند برای کاربران مهم نیست که با چه لینکی منتشر شده‌اند. اما این موضوع برای موتورهای جستجو مهم است. آنها باید بتوانند تشخیص دهند که کدام محتوا را در صفحه نتایج جستجو نشان دهند و قصد ندارند که دو محتوای تکراری را به مخاطبان عرضه کنند.

تصور کنید شما مطلبی در سایت خود دارید با عنوان X که در این آدرس قرار دارد:

http://www.example.com/X

حالا تصور کنید که این مطلب در جایی دیگر از سایت شما با این لینک نیز وجود دارد:

 http://www.example.com/articles/X

شاید فکر کنید این یک موقعیت خیالی است اما واقعیت این است که این اتفاق در بسیاری از وب‌سایت‌ها اتفاق می‌افتد. حالا در نظر بگیرید که برخی از بلاگرها و یا وبمسترها به مطلب اول شما لینک بدهند و برخی نیز به مطلب دوم. اینجاست که مشکل موتورهای جستجو یا بهتر بگوییم مشکل شما بیشتر می‌شود.

محتوای تکراری مشکل شماست به این دلیل که این بک ‌لینک‌ها هر دو باعث اعتباربخشی به هر دو محتوای شما می‌شوند و به این ترتیب موتورهای جستجو نمی‌دانند کدام‌یک مد نظر شماست. اما اگر همگی به یکی از این مطالب لینک دهند شانس شما برای رتبه‌گیری این صفحه بیشتر خواهد شد.

 

دلایل ایجاد محتوای تکراری

دلایل متعددی وجود دارند که باعث ایجاد محتوای تکراری در سایت شما می‌شوند. از آنجا که هیچ شخصی آگاهانه چند محتوای مشابه را بدون اینکه مشخص کند کدام یک محتوای اصلی است، در سایت قرار نمی‌دهد، به سادگی می‌توان فهمید که اغلب این دلایل فنی هستند که باعث می‌شوند محتوای تکراری در سایت ایجاد شود.

این اشکالات فنی اغلب به این خاطر اتفاق می‌افتد که توسعه‌دهندگان2 و برنامه‌نویسان وب مانند موتورهای جستجو فکر نمی‌کنند.

 

  • عدم درک درست از مفهوم URL

می‌توان گفت که نوعی از تفاوت در طرز نگاه توسعه‌دهندگان و موتورهای جستجو وجود دارد.

اغلب سیستم‌های مدیریت محتوا3 به گونه‌ای هستند که مقالات یکسان را در دیتابیس خود به عنوان یک مقاله ذخیره می‌کنند ولی اجازه می‌دهند این مقاله با URL‌های مختلف بازیابی شود. به همین دلیل اغلب توسعه‌دهندگان به ID مقاله توجه می‌کنند و ID را به عنوان شناسنده منحصر به فرد یک مقاله می‌شناسند و به URL‌ها توجهی ندارند. اما در مقابل از دید موتورهای جستجو، این URL‌ها هستند که شناسنده و تمایز دهنده مقالات از هم هستند. حتما اگر این موضوع را به برنامه‌نویس سایت خود بگویید آن را درک خواهد کرد. در ضمن پس از خواندن این مقاله قادر هستید که خودتان راه‌حل درست را به برنامه‌نویس خود یاد بدهید!

 

  • IDهای مربوط به نشست‌ ها4

حتما به عنوان یک وبمستر شما نیز باید امکاناتی را در اختیار کاربران خود قرار دهید.

مثلا این امکان برای آنها فراهم شود که محصولات مورد نظر خود را در سبد خرید ذخیره کنند. در این مواقع برای کاربران یک نشست یا session ایجاد می‌شود. این نشست در واقع تاریخچه مختصری از اقداماتی است که کاربران در سایت شما انجام داده‌اند مانند همان انتخاب محصولات و اضافه کردن آنها به سبد خرید که پیشتر به آن اشاره کردیم.

برای اینکه این نشست وقتی که کاربر بر روی لینک‌های مختلف در سایت شما کلیک می‌کند حفظ شود، مشخص‌کننده نشست که به آن Session ID می‌گویند، باید در جایی ذخیره شود. رایج‌ترین راه برای ذخیره این ID استفاده از کوکی‌هاست. با این حال موتورهای جستجو اغلب کوکی‌ها را ذخیره نمی‌کنند.

به همین خاطر برخی سیستم‌ها از این ID‌ها در URL استفاده می‌کنند. بدین ترتیب ID مربوط به هر نشست به تمام لینک‌های داخلی سایت شما اضافه می‌شود و بدین ترتیب URLهای جدید اضافه می‌شود. در این حالت  یک مطلب می‌تواند URLهای مختلفی به خود بگیرد و محتوای تکراری در سایت شما ایجاد شود.

 

  • پارامترهایی که در URL به منظور ردیابی5 و دسته‌بندی استفاده می‌شود

می‌دانید که می‌توان برای ردیابی برخی اطلاعات و آمارها پارامترهایی را به URL اضافه کرد. به عنوان مثال برای لینک زیر:

http://www.example.com/keyword-x/

یک پارامتر در نظر گرفته‌اید تا متوجه شوید مخاطبین سایت شما از چه جاهایی وارد سایت شما شده‌اند:

http://www.example.com/keyword-x/?source=rss

در این حالت نیز با اینکه مطلب شما تفاوتی نداشته است اما شما دو URL مختلف را دارید و این خود از دلایل ایجاد محتوای تکراری در سایت است.

شاید در این حالت اطلاعات خاصی را به دست بیاورید، اما از سوی دیگر رتبه گرفتن این صفحه در موتورهای جستجو با مشکل مواجه خواهد شد.

پارامترهای دیگری هم هستند که موجب ایجاد محتوای تکراری می‌شوند.

به عنوان مثال اگر شما از پارامترهایی برای تغییر دسته‌بندی و نمایش محصولات مختلف در سایت خود استفاده کنید نیز همین اتفاق خواهد افتاد و محتوای تکراری ایجاد می‌شود.

 

  • کپی کردن مطالب سایت شما

گاهی ایجاد محتوای تکراری به علت خطا یا بی‌توجهی شماست.

اما گاهی نیز پیش می‌آید که مقصر این امر دیگران هستند. در برخی مواقع سایت‌های دیگر عین مطلب سایت‌تان را بدون رضایت شما کپی و منتشر می‌کنند و به سایت شما که منبع اصلی این مقاله است نیز لینک نمی‌دهند. به همین دلیل موتورهای جستجو متوجه این امر نشده و باز هم با دو URL با محتوای یکسان روبه‌رو هستند. هرچه سایت شما محبوب‌تر شود این اتفاق بیشتر و بیشتر تکرار می‌شود.

 

  • ترتیب پارامترها

یکی دیگر از دلایل رایج ایجاد محتوای تکراری این است که CMS از URLهای تمیز و واضح استفاده نمی‌کند.

بلکه از مواردی مانند /?id=1&cat=2 استفاده می‌کند که در آن ID به مقاله و cat به دسته‌بندی یا کتگوری اشاره می‌کنند.

از طرفی /?cat=2&id=1 نیز در اکثر سیستم‌ها همان محتوا را باز می‌گرداند. اما این دو URL کاملا برای موتورهای جستجو متفاوت هستند.

 

  • صفحه‌بندی6 کامنت‌ها

در وردپرس و بسیاری دیگر از سیستم‌ها، قابلیتی وجود دارد که از طریق آن می‌توانید کامنت‌های خود را صفحه‌بندی کنید. این کار با ایجاد  /comment-page-1/ و /comment-page-2/ در انتهای URL مختص به همان مقاله، در واقع چند URL برای یک محتوا در سایت شما ایجاد می‌کند.

  • صفحات بهینه ‌شده برای پرینت

اگر سیستم مدیریت محتوایی که از آن استفاده می‌کنید صفحاتی را مختص پرینت گرفتن ایجاد می‌کند، و شما نیز از درون مقالات خود به آنها لینک می‌دهید، در این حالت نیز گوگل معمولا این صفحات مختص پرینت را نیز پیدا می‌کند. مگر اینکه مخصوصا این صفحات را بلاک کرده باشید.

اما گوگل باید کدام صفحه را نشان دهد؟ صفحه‌ای که تبلیغات و مطلب شما در آن است یا صفحه‌ای که فقط مطلب در آن است و برای پرینت گرفتن مهیا شده است؟

 

  • www و بدون www

این مورد را شاید در جاهای دیگر نیز شنیده باشید و تکراری باشد اما موتورهای جستجو هنوز هم وقتی نسخه دارای www و نسخه بدون www سایت شما در دسترس است، این دو را محتوای تکراری در نظر می‌گیرند.

همچنین اگر سایت شما در دو نسخه دارای HTTP و HTTPS در دسترس باشد نیز دوباره با مشکل محتوای تکراری مواجه خواهید شد.

محتوای تکراری با کنونیکال

توضیح مفهومی راه حل مشکل محتوای تکراری: Canonical URL

همانطور که دیدیم به دلایل مختلف ممکن است که URLهای مختلفی برای یک مطلب ایجاد شوند و دچار مشکل محتوای تکراری شوید. اما این مشکل را می‌توان حل کرد. بدین منظور باید URL اصلی مشخص شود. این URL اصلی با نام کنونیکال (canonical URL) شناخته می‌شود.

 

پیدا کردن مشکل محتوای تکراری

شاید این سوال برایتان به وجود آمده باشد که اگر سایت شما نیز دچار محتوای تکراری است چگونه باید متوجه آن شوید. استفاده از گوگل یکی از ساده‌ترین راه‌هاییست که می‌توانید این موضوع را بررسی کنید.

هنگام جستجو در گوگل عملگرهای مختلفی وجود دارند که می‌توانید با استفاده از آنها جستجوی خود را هدفمند‌تر کنید و در مواردی مانند پیدا کردن محتوای تکراری می‌توانید از آن استفاده کنید. اگر قصد دارید که تمام URL‌هایی که در سایت شما شامل یک کلمه کلیدی خاص هستند را پیدا کنید می‌توانید به صورت زیر عملیات جستجو را در گوگل انجام دهید:

“site:example.com intitle:”Keyword X

در اینجا به جای example.com نام سایت مد نظر خود و به جای Keyword x کلمه کلیدی مد نظر خود را وارد کنید.

با انجام این کار گوگل تمام صفحاتی را که در این دامنه قرار داشته و شامل کلمه کلیدی مورد نظر هستند را به شما نمایش خواهد داد.

از واژه Intitle نیز می‌توانید به تنهایی برای پیدا کردن محتوای تکراری در گوگل استفاده کنید.

به عنوان مثال فرض کنید که عنوان کامل مقاله سایت شما  ‘Keyword X – why it is awesome’ می‌باشد. بنابراین با جستجوی عبارت زیر گوگل تمام سایت‌هایی را که با این عنوان مطابقت دارند را به شما نمایش خواهد داد.

“intitle:”Keyword X – why it is awesome

اگر تصور می‌کنید که شاید برخی سایت‌ها محتوای شما را کپی کرده ولی عنوان آن را تغییر داده‌اند می‌توانید از همین روش استفاده کرده و یک یا دو جمله کامل از مقاله خود را جستجو کنید.

 

راهکارهای عملی برای مشکل محتوای تکراری در سایت

برای حل این مشکل باید به گوگل، تگ کنونیکال خود را هرچه زودتر معرفی کنید. برای حل مشکل محتوای تکراری این ۴ روش را می‌توان به کار برد:

  1. کاری کنید که محتوای تکراری ایجاد نشود.
  2. محتواهای تکراری را به canonical URL ریدایرکت کنید.
  3. المان لینک canonical URL را به صفحه تکرار شده اضافه کنید.
  4. لینک canonical URL را به صورت HTML در صفحات تکرار شده قرار دهید.

 

  • پرهیز از ایجاد محتوای تکراری

برخی از این دلایلی که باعث ایجاد محتوای تکراری می‌شود را می‌توان به سادگی حل کرد:

  • آیا در URLهای شما Session ID وجود دارد؟

وجود چنین IDهایی را می‌توان اغلب به راحتی در تنظیمات سیستم خود غیرفعال کرد.

  • آیا برای صفحات خود، صفحه مخصوص پرینت نیز ایجاد می‌کنید؟

این صفحات واقعا غیرضروری نیستند. آنها را ایجاد نکنید.

  • آیا از صفحه‌بندی نظرات مخاطبین در وردپرس استفاده می‌کنید؟

در این صورت کافیست که به سادگی این قابلیت را در بخش گفتگوی تنظیمات وردپرس غیرفعال کنید.

  • آیا پارامترهای شما ترتیب‌های مختلفی دارند؟

در این صورت به برنامه‌نویس خود بگویید که با نوشتن یک اسکریپت کاری کند که همیشه پارامترهای URLهای شما به یک ترتیب قرار بگیرد.

  • پارامترهایی که برای ردیابی تعبیه شده‌اند را نیز بررسی کنید

گاهی می‌توان برای ردیابی مشتریان از هشتگ‌های مخصوص استفاده کنید. استفاده از پارامترهایی که در انتهای URLها قرار می‌گیرند می‌توانند مشکل محتوای تکراری را ایجاد کنند.

  • شاید دچار مشکل www شده باشید

یا نسخه www و یا نسخه بدون www را انتخاب کنید و دیگری را روی نسخه‌ای که انتخاب کرده‌اید ریدایرکت کنید.

 

  • استفاده از ریدایرکت 301

گاهی و در سیستم‌های مختلف شاید نتوانید از ایجاد URLهای مختلف برای یک مطلب جلوگیری کنید. در این حالت باید از ریدایرکت7 استفاده کنید. به برنامه‌نویس خود بگویید که تمام محتواهای تکراری قدیمی را به URL اصلی ریدایرکت کند.

  • استفاده از لینک‌ها

گاهی ممکن است کارهایی انجام دهید ولی نتوانید مشکل محتوای تکراری را حل کنید. یا به دلیلی قصد حدف URL‌های دیگر را نداشته باشید. موتورهای جستجو برای حل این مشکل خاص المان canonical URL را معرفی کرده‌اند. این المان در بخش <head> سایت شما قرار می‌گیرد و چنین ظاهری دارد:

</”/link rel=”canonical” href=”http://example.com/wordpress/seo-plugin>

در بخش href متعلق به لینک canonical، باید canonical URL درست را وارد کنید. وقتی موتورهای جستجو که از این المان پشتیبانی می‌کنند به این المان برخورد می‌کنند ریدایرکت ۳۰۱ انجام می‌شود.

  • بک‌لینک دادن به محتوای اصلی

اگر به هر دلیل نتوانستید از راه‌حل‌هایی که در بالا به آنها اشاره کردیم استفاده کنید، بک‌لینک‌ دادن از URL‌های مختلف، در بخش اول یا انتهای مقاله، به مطلب اورجینال ایده جایگزین خوبی است. با این لینک دادن‌هاست که گوگل متوجه می‌شود که URL اصلی کدام است.

 

نتیجه گیری: مشکل محتوای تکراری در سایت قابل حل است و باید حل شود

مشکل محتوای تکراری در هرجایی ممکن است اتفاق بیافتد و شما یه عنوان یک سئوکار باید به صورت منظم حواستان به این مشکل باشد. و در نظر داشته باشید که این مشکل قابل حل است. با حل کردن مشکل محتوای تکراری، مطلب شما در URL درست، شانس بیشتری برای رتبه‌گیری در صفحه نتایج موتورهای جستجو خواهد داشت.

 


1: Duplicate Content
2: Developers
3: CMS
4: Session
5: Tracking
6: Pagination
7: Redirect

منبع Yoast

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.