محتوای تکراری Duplicate Content چیست ؟ چگونه محتوای تکراری را تشخیص دهیم
محتوای تکراری Duplicate Content محتوایی است که در صفحات وب مختلف بارها تکرار شده است. دقت کنید که صحبت از آدرس اینترنتی URL است و نه لزوما وبسایتهای مختلف با آدرسهای مختلف نام دامنه. یعنی حتی تکرار یک محتوا در دو آدرس مختلف URL از یک وبسایت واحد، محتوای تکراری محسوب میشود.
گرچه استفاده از محتوای تکراری به خودی خود جریمهای از طرف گوگل در پی ندارد، ممکن است بر روی رتبه سایت در گوگل اثر منفی داشته باشد.
محتواهایی در اینترنت پیدا میشود که دقیقا کپی و تکراری نیستند ولی بخش زیادی از آن به صورت مشترک تکرار شده است. گوگل چنین محتوایی را محتوای خیلی مشابه Appreciably Similar Content مینامد. با درج محتوای خیلی مشابه در بیش از یک آدرس URL از یک وبسایت یا وبسایتهای مختلف، موتورهای جستجو در انتخاب نسخهای از محتوا که ارتباط بیشتری با جستجوی کاربر دارد به اشتباه و سختی میافتند.
اهمیت محتوای تکراری Duplicate Content
اهمیت محتوای تکراری را میتوان از دیدگاههای مختلف مورد بررسی قرار داد. در ادامه ابتدا اهمیت آن را از دید موتورهای جستجو و همچنین از دید صاحب وبسایت مورد بررسی قرار میدهیم:
اهمیت محتوای تکراری از دید موتور جستجو
محتوای تکراری یا Duplicate Content میتواند موجب بروز سه مشکل برای یک موتور جستجو شود:
- موتور جستجو در انتخاب نسخه صحیح به منظور درج یا حذف از ایندکس خود به اشتباه میافتد
- موتور جستجو در شمارش اعتبار مرتبط با محتوا (نظیر اعتبار، اعتماد، متن لینک و قدرت و اهمیت لینک) بین دو صفحه به اشتباه میافتد
- موتور جستجو از درج لینک صفحه صحیح در نتایج جستجوی بالاتر به اشتباه میافتد
اهمیت محتوای تکراری از دید صاحب سایت
با وجود محتوای تکراری، صاحب سایت ترافیک قابل ملاحظهای را از دست خواهد داد. این ترافیک در خوشبینانهترین حالت ممکن بین صفحات مختلف همان وبسایت توزیع خواهند شد. این سبب افت رتبه نهایی کل وبسایت و البته صفحات مختلف آن میشود. در این زمینه معمولا دو مشکل بزرگ به وجود میآید:
- موتورهای جستجو به منظور ارائه نتایج با کیفیت از درج نتایج مشابه خودداری میکنند. به این منظور ناچار به انتخاب بین دو نسخه مختلف از محتوای تکراری میشوند و این سبب کاهش شانس دیدهشدن هر یک از دو نتیجه میشود. حتی در بعضی از موارد موتور جستجو از خیر چنین محتوایی میگذرد و هیچ یک از نسخههای تکراری را نمایش نخواهد داد.
- وبسایتهایی که به دنبال ایجاد لینک به چنین محتوایی هستند نیز در انتخاب نسخه اصلی دچار تردید میشوند و لینک ورودی به محتوا نیز کاهش چشمگیری خواهد داشت. از آنجا که کمیت و کیفیت لینک ورودی یکی از فاکتورهای رتبه بندی سئو است، این میتواند به نمایش وبسایت هدف در نتایج جستجو و رتبه آن آسیب جدی وارد کند.
نتیجه نهایی محتوای تکراری Duplicate Content چیست؟ محتوایی که میتوانست در نتایج جستجو به خوبی مشاهده شود و بالا بیاید، شانس خود را در این زمینه تقریبا از دست داده است.
مشکلات مرتبط با محتوای تکراری چگونه رخ میدهند؟
در بسیاری از موارد صاحبان وبسایت، عمدا و دانسته، چنین محتوایی را در وبسایت خود درج نمیکنند. ولی این نوع محتوا در هر صورت خواسته یا ناخواسته در صفحات وب تولید میشود. بر طبق آمارهای منتشر شده، تا سال ۱۳۹۷ شمسی، نزدیک به ۲۹٪ محتوای وب تکراری است! بد نیست با هم نگاهی بیندازیم و ببینم چگونه این محتوای تکراری Duplicate Content تولید میشود:
۱. نوشتارهای مختلف و متعدد آدرس URL
پارامترهای GET که در آدرس URL درج و اضافه میشوند یکی از نمونههای بارز ایجاد محتوای تکراری هستند. این پارامترها ممکن است به دلیل ضبط و رصد تعامل کاربر با وبسایت و استخراج دادههای آماری نحوه استفاده، اضافه شده باشند. این مشکل نه تنها با اضافه و حذف شدن این پارامترها ایجاد میشود بلکه با جابجایی ترتیب این پارامترها نیز رخ میدهد. مثلا آدرسهای زیر در یک موتور جستجو به عنوان سه محتوای تکراری مجزا شناسایی میشوند:
www.weseo.ir/products
www.weseo.ir/products?color=red
www.weseo.ir/products?color=red&size=large
www.weseo.ir/products?size=large&color=red
همچنین شناسه نشست اگر در URL ذخیره شود سبب ایجاد URL های متفاوت به ازای کاربران مختلف خواهد شد. یک موتور جستجو نیز، با هر بار مراجعه به وبسایت شناسه نشست جداگانهای دریافت خواهد کرد و URL های مختلف از محتوای یکسان خواهد دید. این مساله به سادگی منجر به ایجاد محتوای تکراری Duplicate Content میشود. البته درج شناسه نشست کاربر در URL امروزه کمتر متدوال است و استفاده از آن در وبسایتهای اینترنتی رو به کاهش است. اگر مایلید از عدم درج شناسه نشست در وبسایت اینترنتی خود مطمئن شوید، میتوانید با وی سئو تماس بگیرید. کارشناسان ما با کمال میل این مساله را در مورد وبسایت شما بررسی کرده و از طریق تماس تلفنی به شما اطلاع خواهند داد.
۲. پروتکلهای جایگزین HTTP و HTTPS و همچنین آدرسهای با و بدون www
اگر وبسایت شما دو نسخه مختلف با و بدون استفاده از www داشته باشد و محتوای هر دو نسخه یکسان باشند، شما به راحتی مرتکب خطایی بزرگ شدهاید! شما دو نسخه مختلف از محتوای یکسان روی دامنههای با و بدون www خود دارید و این یعنی محتوای تکراری. مساله در مورد پروتکلهای HTTP و HTTPS نیز به همین شکل است.
بهتر است یکی از نسخههای با و بدون www و همچنین پروتکل HTTP و یا HTTPS را اصل و مبنای کار قرار دهید و آدرس دیگر را به آدرس اصلی هدایت Forward کنید. این کار با انجام تنظیماتی در پنل مدیریتی سرویسدهنده میزبانی وب شما قابل انجام است. به این منظور با هاستینگ خود تماس بگیرید یا از کارشناسان ما درخواست کمک کنید. دوستان شما در وی سئو به شما کمک خواهند کرد تا این مشکل را به راحتی برطرف کنید.
مثلا اگر نسخه اصلی
https://weseo.ir
است، باید نسخههای دیگر یعنی
http://weseo.ir
https://www.weseo.ir
http://www.weseo.ir
را به نسخه اصلی هدایت Forward کنید.
۳. محتوای مسروقه Scraped Content یا محتوای کپی Copied Content
محتوا نه تنها شامل پستهای وبلاگ شماست بلکه صفحات مشخصات محصول و خدمات نیز محتوای یک وبسایت به شمار میآید. سارقان محتوای وبسایت شما را در وبلاگ یا وبسایت خود باز نشر میدهند. اما مساله به این سادگی نیست. اگر یک کالای واحد در وبسایتهای مختلف به فروش برسد، آیا این باید یک محتوای تکراری قلمداد شود؟ واضح است که منبع اطلاعات برای کلیه این وبسایتها، اطلاعات دریافتی از تولید کننده است و بنابراین به احتمال زیاد همه وبسایتها از محتوای یکسانی استفاده خواهند کرد.
حل مشکل محتوای تکراری Duplicate Content
ایده اصلی برای حل مشکل محتوای تکراری تقریبا مشخص است. باید تشخیص دهیم که نسخه اصلی و یا به عبارتی نسخه صحیح کدام است؟
با پیدا شدن محتوای تکراری در آدرسهای URL مختلف با محتوای یکسان در یک وبسایت، باید برای موتور جستجو نسخه اصلی و نسخه Canonical مشخص شود. سه راه اصلی و عمده برای این کار وجود دارد:
- استفاده از تغییر مسیر ۳۰۱ به آدرس URL صحیح
- استفاده از
rel=canonical
- استفاده از ابزار دستکاری پارامتر در کنسول جستجوی گوگل
استفاده از تغییر مسیر ۳۰۱ به آدرس URL صحیح
در بسیاری از موارد، بهترین راه برای غلبه بر مشکل محتوای تکراری راهاندازی تغییر مسیر ۳۰۱ از صفحه تکراری به صفحه با محتوای اصلی است.
زمانی که امکان رتبه گرفتن صفحات متعدد با یکدیگر تجمیع شود، دیگر با یکدیگر رقابت نخواهند کرد. این مساله سبب ارتقای رتبه کلی سایت خواهد شد. همچنین امکان رتبه گرفتن صفحات اصلی و صحیح ایجاد شده و شانس دیده شدن محتوا در نتایج جستجو افزایش خواهد یافت.
استفاده از rel=canonical
یک راه دیگر غلبه بر مشکل محتوای تکراری Duplicate Content استفاده از خصیصه rel=canonical
در کد منبع صفحه است. تگ کنونیکال به موتور جستجو میگوید که این صفحه خاص را به عنوان یک کپی از صفحه دیگری که حاوی محتوای اصلی است در نظر بگیر. در ادامه موتور جستجو تمام اعتبار محتوا را به صفحه اصلی خواهد داد و از محتوای تکراری صرفنظر خواهد کرد.
این خصیصه باید به قسمت سرآیند head تمامی صفحات تکراری و غیر اصلی اضافه شود و موتور جستجو را به سمت نسخه اصلی هدایت کند.
استفاده از ابزار دستکاری پارامتر در کنسول جستجوی گوگل
حتما با کنسول جستجوی گوگل آشنا هستید. این کنسول به شما امکان معرفی نسخه اصلی دامنه سایتتان را میدهد. میتوانید مشخص کنید که نسخه اصلی از پروتکل HTTPS استفاده میکند یا خیر. همچنین میتوانید به گوگل بگویید که آیا نسخه اصلی حاوی www است یا خیر. همچنین میتوانید مشخص کنید که پارامترهای موجود در URL چگونه لحاظ شوند.
بسته به نوع طراحی ساختار URL های وبسایت شما، ممکن است مشکل محتوای تکراری در وبسایت شما رخ دهد. مشکل بزرگ در دستکاری پارامترها به منظور رفع مساله محتوای تکراری از طریق این کنسول این است که این تنظیمات فقط بر روی موتور جستجوی گوگل اعمال میشود و نه کلیه موتورهای جستجو (نظیر بینگ).
نتیجهگیری
محتوای تکراری گرچه به خودی خود مورد جریمه از طرف موتورهای جستجو قرار نمیگیرد، اما سبب کاهش رتبه سایت شما در موتورهای جستجو خواهد شد. بهتر است از روشهای شناخته شده رفع محتوای تکراری استفاده کنید. در بسیاری از موارد شما به عنوان صاحب یک وبسایت ناخواسته اقدام به تولید محتوای تکراری میکنید. حتی در غیر این صورت سارقان محتوا نیز در تولید محتوای تکراری از وبسایتتان به شما کمک خواهند کرد! باید در مورد تولید محتوای کپی حساسیت نشان دهید. قرار دادن محتوای خیلی مشابه نیز توسط موتورهای جستجو شناسایی و منجر به جریمه وبسایت شما و افت و کاهش رتبه وبسایت در نتایج جستجو خواهد شد. در آینده نزدیک مطالب و محتوای مفید و کاربری بیشتر در مورد محتوای تکراری و Duplicate Content در وبلاگ وی سئو خواهید خواند. به این منظور و برای استفاده مفیدتر میتوانید آدرس وبلاگ وی سئو را به بوک مارک Bookmark های مرورگر اینترنتی خود اضافه کنید.