چگونه یک نقشه سایت با فرمت XML ایجاد کنیم؟

73

همانطور که پیدا کردن یک مقصد جدید بدون نقشه دشوار است، برای گوگل نیز گاهی دشوار است که تمامی صفحات سایت شما را بدون نقشه سایت1 پیدا کند. خوشبختانه ایجاد و ارسال سایت مپ در فرمت XML2 به گوگل را می‌توان به سادگی و سرعت انجام داد. در ادامه توضیح خواهیم داد که چگونه این کار را گام به گام انجام دهید و نقشه سایت چه تاثیری در سئوی سایت دارد.

اما در ابتدا بیایید به چند اصل اولیه بپردازیم.

نقشه سایت چیست؟

سایت مپ یک فایل با فرمت XML است که شامل لیستی از تمامی محتواهای مهم شما در سایت است. هر صفحه یا فایلی که قصد دارید در صفحه نتایج موتورهای جستجو نشان داده شود باید در این نقشه به آن اشاره شده باشد.

یک حقیقت جالب

 

نقشه سایت نمی‌تواند بیشتر از پنجاه هزار URL را لیست کند و همچنین اندازه‌اش نمی‌تواند بیش از پنجاه مگابایت باشد. اگر نقشه سایت شما یکی از این محدودیت‌ها را رد می‌کند بنابراین باید بیش از یک سایت مپ ایجاد کنید.

فایل سایت مپ با فرمت XML چگونه فایلی است؟

نقشه سایت XML برای موتورهای جستجو ساخته می‌شوند نه برای انسان‌ها. این فایل شاید در نگاه اول کمی پیچیده به نظر برسد.

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>https://ahrefs.com/</loc>
<lastmod>2019-08-21T16:12:20+03:00</lastmod>
</url>
<url>
<loc>https://ahrefs.com.com/blog/</loc>
<lastmod>2019-07-31T07:56:12+03:00</lastmod>
</url>
</urlset>

بیایید با جزئیات بیشتری در مورد این فایل صحبت کنیم.

  • اعلان XML

<?xml version=”1.0″ encoding=”UTF-8″?>

این قطعه به موتورهای جستجو می‌گوید که در حال خواندن یک فایل XML هستند. همچنین نسخه XML و نوع رمزگزاری استفاده شده را نیز بیان می‌کند. برای نقشه‌ سایت، این نسخه باید 1.0 و رمزگزاری نیز باید UTF-8 باشد.

  • URL set

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

این بخش شامل تمامی URLهای موجود در نقشه سایت است. همچنین به موتورهای جستجو نشان می‌دهد که از چه پروتکل استانداری استفاده می‌کند. اغلب نقشه‌های سایت از استاندارد Sitemap 0.90  استفاده می‌کنند که توسط گوگل، یاهو و مایکروسافت پشتیبانی می‌شود.

  • URL

<url>
<loc>https://ahrefs.com/</loc>
<lastmod>2019-08-21T16:12:20+03:00</lastmod>
</url>

این یک تگ والد برای هر URL محسوب می‌شود. باید در تگ <loc> لوکیشن URL خود را مشخص کنید. بسیار مهم است که در اینجا از لینک‌های موسوم به  absolute (لینک‌هایی که آدرس کامل را بیان می‌کند) و canonical (یعنی صفحه‌ای که در صورت وجود محتوای مشابه، تمایل دارید گوگل این صفحه را در صفحه نتایج خود نشان دهد) استفاده کنید. در اینجا از لینک‌های موسوم به relative که فقط قسمت انتهای لینک را نشان می‌دهد استفاده نکنید.

در زیر نمونه‌ای از این دو را با هم مشاهده می‌کنیم.

لینک absolute:

<a href = http://www.example.com/xyz.html>

لینک relative:

<a href = “/xyz.html”>

با اینکه مواردی که ذکر کردیم تنها تگ‌های ضروری هستند اما صفت‌های دیگری را هم به صورت اختیاری می‌توانید اضافه کنید.

<lastmod>

این تگ بیانگر تاریخ آخرین تغییرات اعمال شده در فایل است. این تاریخ باید فرمت W3C Datetime داشته باشد. به عنوان مثال اگر محتوای خود را در ۲۵ سپتامبر ۲۰۱۹ به‌روزرسانی کرده باشید، این صفت تاریخ 25-9-2021را می‌خواند. همانطور که گفتیم این مورد اختیاری است.

<priority>

این مورد اولویت یک URL را نسبت به تمام URLهای دیگر در یک سایت را مشخص می‌کند. این مقدار بین ۰.۰ تا ۱.۰ قرار می‌گیرد و هرچه عدد بالاتر باشد نشان از مهم بودن URL دارد.

<changefreq>

این تگ مشخص می‌کند که یک صفحه هر چند وقت یکبار احتمالا تغییر می‌کند. کار این تگ این است که برای موتورهای جستجو مشخص کند که بهتر است هرچند وقت یکبار این صفحه را کراول کنند. مقدارهای معتبری که می‌توانید در اینجا وارد کنید شامل این موارد است:

Always – hourly – daily – weekly – monthly – yearly – never

که به ترتیب به معنای همیشه، ساعتی، روزانه، هفتگی، ماهانه، سالانه و هرگز است.

هیچ کدام از این تگ‌های اختیاری برای سئو و بهینه سازی سایت مهم نیستند.

گری ایلیز در مورد تگ <lastmod> بیان می‌کند:

با اینکه وبمسترها سعی دارند در این موضوع دقت به خرج دهند اما گوگل اغلب این تگ را نادیده می‌گیرد. به این دلیل که اغلب ابزارهایی که نقشه سایت به کمک آن ایجاد می‌شود تاریخ همان روز را برای همه صفحات ثبت می‌کنند نه تاریخ آخرین تغییرات در آن صفحات را.

در مورد <priority> هم گوگل می‌گوید که حاوی اطلاعات غیر کاربردی است که به همین دلیل نادیده گرفته می‌شود.

جان مولر نیز در مورد <changefreq> می‌گوید:

که اولویت و اینکه هر چند وقت یکبار متن خود را تغییر می‌دهید نیز دیگر نقش مهمی در نقشه سایت ایفا نمی‌کنند.

چرا به نقشه سایت احتیاج داریم؟

گوگل توسط کراول3 کردن وب محتوای جدید را کشف می‌کند. وقتی که گوگل یک صفحه را کراول می‌کند به لینک‌های داخلی و خارجی آن صفحه توجه می‌کند. اگر URL کشف شده در ایندکس4 گوگل وجود نداشته باشد این محتوا را بررسی کرده و در جای مناسب ایندکس می‌کند.

اما گوگل نمی‌تواند تمامی محتواها را اینگونه پیدا کند. اگر یک صفحه از صفحات شناخته شده لینک دریافت نکرده باشد، گوگل نمی‌تواند آن را پیدا کند.

در اینجاست که سایت مپ وارد بازی می‌شود.

نقشه سایت به گوگل می‌گوید که کجا باید مهم‌ترین صفحات یک وب‌‌سایت را پیدا کند. بنابراین گوگل می‌تواند آنها را کراول و ایندکس کند.

این موضوع اهمیت دارد. چون که موتورهای جستجو اگر نتوانند محتوای شما را پیدا کنند نمی‌توانند محتوای شما را نیز رتبه‌بندی کنند.

 

چگونه یک نقشه سایت ایجاد کنیم؟

برخی سیستم مدیریت محتوا5 سایت مپ را برای شما ایجاد می‌کنند. وقتی که یک صفحه را به سایت خود اضافه یا از آن حذف می‌کنید، این نقشه به صورت خودکار به‌روزرسانی می‌شود. اگر CMS شما این کار را انجام نمی‌دهد، معمولا افزونه‌ای برای CMS شما وجود دارد که می‌توان با اضافه کردن آن sitemap را ایجاد کرد.

ایجاد نقشه سایت در وردپرس

اگرچه حدود ۳۴.۵ درصد وب‌سایت‌ها با وردپرس ساخته شده‌اند اما خود این پلتفرم برای شما sitemap را ایجاد نمی‌کند. برای ایجاد نقشه سایت در وردپس باید از افزونه‌هایی مانند Yoast SEO استفاده کنید.

برای نصب Yoast SEO وارد داشبورد یا همان پنل وردپرس شوید تا افزونه سئو وردپرس را نصب نمایید.

از قسمت Plugins یا همان افزونه‌ها، گزینه Add New یا افزودن جدید را انتخاب کنید.

اضافه کردن افزونه به وردپرس

سپس نام افزونه یعنی Yoast SEO را جستجو کنید و در همان گزینه اول گزینه Activate را کلیک کنید.

نصب افزونه یواست سئو

اکنون این مسیر را طی کنید:

SEO > General > Features

سپس مطمئن شوید که گزینه XML sitemaps بر روی on قرار دارد.

فعال سازی نقشه سایت یواست

اکنون باید قادر باشید که نقشه سایت خود را در یکی از این آدرس‌ها مشاهده کنید:

yourdomain.com/sitemap.xml

yourdomain.com/sitemap_index.xml

نکته

 

اگر وردپرس شما در یک ساب فولدر یا ساب دامین نصب شده است، sitemap شما در همین مسیر قرار می‌گیرد. به عنوان مثال شاید یک سایت داشته باشید که بخش بلاگ آن با وردپرس درست شده است. آنگاه نقشه سایت در این آدرس قرار می‌گیرد.

ahrefs.com/blog/sitemap_index.xml

همچنین می‌توانید کاری کنید که انواع خاصی از صفحات (مانند: صفحات تگ‌ها، صفحات دسته‌بندی و..) از sitemap شما حذف شوند. بدین منظور وارد سربرگ تنظیمات ظاهر جستجو6 شوید.

همچنین می‌توانید از طریق متاباکس Advanced هنگام ایجاد یا ویرایش یک مطلب تصمیم بگیرید که آن صفحه یا نوشته در نقشه سایت قرار بگیرد یا خیر.

البته فقط صفحاتی را در sitemap قرار ندهید که نمی‌خواهید در نتایج جستجو نمایش داده شود.

 

برای دریافت مشاوره سئو از بهترین متخصصان سئو هم اکنون با ما ارتباط بگیرید.

 

ایجاد نقشه سایت در Wix

Wix می‌تواند به صورت اتوماتیک نقشه سایت را برای شما ایجاد کند. این نقشه در آدرس زیر قابل مشاهده است:

yourwixsite.com/sitemap.xml

متاسفانه از این طریق خیلی بر روی صفحاتی که در نقشه سایت قرار می‌گیرند یا نمی‌گیرند کنترلی ندارید. ولی اگر قصد دارید یک صفحه خاص را از نقشه سایت حذف کنید به سربرگ تنظیمات سئو سایت بروید و گزینه‌ای که مشاهده می‌کنید را روی off قرار دهید.

ایجاد نقشه سایت در Wix

دقت داشته باشید که با این کار همچنین متا تگ noindex به صفحه اضافه می‌شود که دیگر در صفحه نتایج گوگل نشان داده نخواهد شد.

نکته:

اگر یک URL را به عنوان canonical URL (یعنی اعلام کنید که این صفحه نسخه اصلی چند محتوای مشابه به هم است) در Wix معرفی کنید، Wix آن را از نقشه سایت حذف نمی‌کند. با اینکه وجود چنین صفحه‌ای در نقشه سایت تاثیری بر اغلب کارکنان ندارد، اما قرار دادن این صفحات در نقشه سایت اقدام مناسبی نیست و می‌تواند سیگنال‌های متضادی را به گوگل ارسال کند.

ایجاد نقشه سایت در Squarespace

Squarespace نیز همچنان به صورت اتوماتیک نقشه سایت را ایجاد می‌کند و می‌توانید در آدرس زیر آن را پیدا کنید:

yoursquarespacesite.com/sitemap.xml

هیچ راهی نیست که بتوانید به صورت دستی نقشه سایت خود را در Squarespace ویرایش کنید. با این حال می‌توانید صفحات دلخواه را در زبانه تنظیمات SEO به حالت noindex در آورید.

ایجاد نقشه سایت در Squarespace

بدن ترتیب این صفحه هم از نقشه سایت حذف می‌شود و هم در صفحه نتایج گوگل نشان داده نمی‌شود.

ساخت نقشه سایت در Shopify

Shopify نیز به صورت اتوماتیک نقشه سایت را برای شما ایجاد می‌کند که در آدرس زیر قابل دسترسی است:

yourstore.com/sitemap.xml

متاسفانه هیچ روش ساده‌ای برای noidex کردن صفحات در Shopify وجود ندارد. برای این کار باید مستقیما کدهای موجود در فایل .liquid را ویرایش کنید.

ساخت نقشه سایت بدون CMS

اگر فکر می‌کنید سایت شما کمتر از حدود ۳۰۰ صفحه دارد، نسخه رایگان Screaming Frog را نصب کنید.

پس از نصب وارد این مسیر شوید:

Mode > Spider

URL مربوط به صفحه اصلی سایت خود را در کادری که دارای برچسب Enter URL to spider است، وارد کرده و بر روی Start کلیک کنید.

نکته:

مطمئن شوید که نسخه اصلی یا canonical صفحه اصلی سایت خود را وارد کرده‌اید. اگر نسخه اصلی را وارد نکنید، Screaming Frog فقط یک URL را کراول می‌کند.

وقتی که کار کراول کردن کامل شد، به گوشه سمت راست پایین بنگرید. باید چیزی شبیه به این را مشاهده کنید:

اگر این عدد ۴۹۹ یا کمتر از آن باشد به این آدرس بروید:

Sitemaps > XML sitemap

از آنجا که گوگل توجهی به تگ‌های <lastmod>، <changefreq> و <priority> نمی‌کند، توصیه می‌کنیم که این‌ها را از فایل نقشه سایت حذف کنید.

نقشه سایت در اسکریمینگ فراگ

سپس بر روی Next کلیک کنید و نقشه سایت را درون کامپیوتر خود ذخیره کنید. کار انجام شده است.

اگر عدد ۵۰۰ یا بیشتر از آن بود، ارزشی ندارد که از این نقشه سایت خروجی بگیرید، به این دلیل که تعداد صفحات شما زیاد است و همه صفحات که شاید تعدادشان به صدها مورد برسد نیز کراول نشده‌اند و بنابراین در نقشه سایت شما قرار ندارد و این نقشه بی فایده است.

یک راه برای حل این مشکل این است که برای پیدا کردن یک ایجاد کننده نقشه سایت رایگان در گوگل جستجو کنید. تعداد بسیار زیادی ابزار در این زمینه وجود دارد اما متاسفانه اغلب قابل اعتماد نیستند.

ما تعداد زیادی از این ابزارها را تست کردیم و فقط تعداد کمی از آنها شامل URLهای غیر canonical، صفحات noindex و redirects هستند. و این یک اقدام نامناسب برای بهینه سازی سایت است.

اما می‌توانید از ابزار Site Audit متعلق به سایت Ahrefs استفاده کنید. که قابل اعتماد است و کل سایت شما را کراول می‌کند.

 

چگونه نقشه سایت را به گوگل ارسال کنیم؟

برای شروع باید بدانید که نقشه سایت شما در کجا قرار دارد.

اگر از افزونه‌های استفاده می‌کنید احتمالا نقشه سایت شما در این آدرس قرار دارد:

domain.com/sitemap.xml

اگر فایل نقشه سایت خود را دارید نامی مانند sitemap.xml بر روی آن قرار دهید سپس آن را داخل پوشه root در وب‌سایت خود آپلود کنید. سپس باید قادر باشید که در این آدرس به نقشه سایت خود دسترسی داشته باشید:

domain.com/sitemap.xml

البته که می‌توانید نام‌های دلخواه خود را انتخاب کنید اما این روش مناسب‌تر است. همچنین اگر چند نقشه سایت دارید می‌توانید بدین شکل نام‌گذاری کنید:

sitemap_1.xml, sitemap_2.xml

اکنون از داخل سرچ کنسول گوگل وارد قسمت Sitemaps شوید و URL نقشه سایت خود را وارد کنید و بر روی Submit کلیک کنید.

تمام کار همین است تمام شد.

نکته

 

همچنین روش خوبی است که URL نقشه سایت خود را به فایل robots.txt اضافه کنید.

می‌توانید این فایل را در مسیر root سرور سایت خود پیدا کنید. برای اضافه کردن نقشه سایت خود، فایل robots.txt را باز کرده و کد زیر را در آن وارد کنید:

Sitemap: https://www.yourdomain.com/sitemap.xml

سایت مپ در گوگل سرچ کنسول

البته دقت کنید که باید نام سایت خود و آدرس نقشه سایت خود را وارد کنید.

اگر چند نقشه سایت دارید باید چندین مورد را به شکل زیر وارد کنید:

Sitemap: https://www.asos.com/sitemap_1.xml
Sitemap: https://www.asos.com/sitemap_2.xml

حل خطاهای رایج سایت که می‌تواند بر نقشه سایت اثر بگذارد

سرچ کنسول گوگل اغلب خطاهای فنی مرتبط با نقشه سایت را به شما گزارش می‌دهد.

به عنوان مثال در اینجا هشدار داده میشود که یکی از urlهای شما توسط robots.txt بلاک شده است:

بلاک شدن توسط robots.txt

اما گفته می‌شود که مشکلاتی نیز هست که گوگل آنها را به شما گزارش نمی‌دهد. در ادامه به دو مورد از این مشکلات اشاره خواهیم کرد و خواهیم گفت که چگونه این مشکلات را پیدا کرده و رفع کنید.

  • صفحات بی‌کاربرد و بی‌کیفیت درون نقشه سایت

هر صفحه‌ای که در نقشه سایت شما قرار دارد باید قابلیت ایندکس و کنونیکال داشته باشد. اما متاسفانه این بدان معنا نیست که تمامی این صفحات دارای کیفیت مناسبی نیز هستند. اگر دارای صفحات و مطالب زیادی هستید برخی از صفحات بی کیفیت سایت نیز احتمالا در نقشه سایت شما قرار دارند..

برای پیدا کردن چنین صفحاتی از ابزار Site Audit وارد قسمت Duplicate Content شوید.

پیدا کردن صفحات بی کیفیت در ahrefs

به دنبال گروه‌‌های صفحات duplicate یا near-duplicate که بدون canonical هستند بگردید. این گروه‌ها در قسمت نارنجی رنگ قرار دارند. بر روی آن کلیک کنید تا تمامی صفحات این دسته را مشاهده کنید.

سعی کنید این صفحات را از لحاظ کیفیت بررسی کنید.

داشتن محتوای بی کیفیت بر روی سایت به 3 دلیل می‌تواند بد باشد:

  • این صفحات بودجه کراول شدن سایت شما را کاهش می‌دهند. هدر دادن زمان و بودجه گوگل برای کراول کردن صفحات کم کیفیت و بی استفاده اصلا خوب نیست. در عوض ممکن بود که گوگل این منابع و زمان را بتواند بر روی صفحات مهم‌تر صرف کند. (البته در ذهن داشته باشید که گوگل بیان کرده است که بودجه کراول کردن چیزی نیست که لازم باشد اغلب وبمسترها به آن فکر کنند.)
  • این صفحات اعتبار لینک‌ها را از صفحات مهم‌تر می‌دزدند: همبستگی واضحی بین اعتبار یک صفحه و رتبه‌ای که می‌گیرد وجود دارد. لینک‌های داخلی که به صفحات کم کیفیت داده می‌شود می‌تواند باعث کاهش اعتباری شود که ممکن است بتوانید آن را به صفحات مهم‌تر منتقل کنید. گاهی با پاک کردن این صفحات بی‌ کیفیت سایت از درون سایت شاهد افزایش ترافیک خواهید بود.
  • این صفحات باعث رقم زدن تجربه کاربری ضعیف می‌شوند: بازدید از چنین صفحاتی هیچ ارزشی برای کاربران ندارد. کلیک کردن بر روی چنین صفحاتی باعث رنجش کاربران می‌شود و ممکن است که کاربران احساس کنند که سایت شما دارای کیفیت کمی است و از آن خارج شوند.

در مجموع می‌توان گفت که بهترین اقدام این است که صفحات بی‌کیفیت را از سایت و از نقشه سایت خود حذف کنید. اگر چنین کاری می‌کنید به خاطر داشته باشید که باید لینک‌های داخلی که به این صفحات ایجاد شده‌اند را نیز حذف کنید. اگر این کار را نکنید با مشکل وجود لینک‌های شکسته در سایت خود مواجه خواهید شد.

همچنین می‌توانید به دنبال صفحاتی نیز بگردید که میزان محتوای خیلی کمی دارند.

برای این کار در ابزار Site Audit به دنبال صفحاتی بگردید که دارای اخطار Low word count هستند.

  • صفحاتی که تصادفا از نقشه سایت شما حذف شده‌اند

اگر از یکی از این روش‌های پیشنهاد شده برای ایجاد نقشه سایت استفاده کردید صفحاتی که دارای تگ noidex یا canonical هستند در نقشه سایت وجود نخواهند داشت.

مشکلی نیست و نباید هم نقشه سایت شما شامل URLهای canonical یا صفحات noindex باشد.

اما اگر در برخی صفحات ناخواسته از تگ noindex استفاده کرده باشید، این صفحات نیز در نقشه سایت قرار نمی‌گیرند.

برای پیدا کردن چنین مواردی از ابزار Site Audit وارد گزارش Indexability شوید و بر روی هشدار Noindex page کلیک کنید. بدین ترتیب تمامی صفحاتی که noindex شده‌اند را مشاهده خواهید کرد.

شاید اغلب این سایت‌ها عمدا و با خواست شما noindex شده باشند اما ارزش دارد که این لیست را دوباره بررسی کنید.

اگر صفحه‌ای را مشاهده کردید که چنین تگ ناخواسته‌ای داشت باید آن تگ را حذف کرده و آن صفحه را به نقشه سایت خود اضافه کنید. اگر از یک csm یا افزونه استفاده می‌کنید این کار باید به صورت خودکار انجام شود.

نکته:

 

همچنین ارزشمند است که صفحاتی که دارای ریدایرکت یا canonical ناخواسته هستند را نیز پیدا کنید.
  • بدین منظور وارد بخش Data Explorer شوید و این فیلترها را اعمال کنید:
  • به دنبال canonical‌های ناخواسته بگردید.
  • به دنبال ریدایرکت‌های ناخواسته بگردید.
  • سپس این این تگ‌های ناخواسته را حذف کنید و این صفحات را به نقشه سایت خود اضافه کنید.

سوالات متداول

 


1: Sitemap
2: Extensible Markup Language
3: Crawl
4: Index
5: CMS: Content management system
6: Search Appearance

منبع Ahrefs
ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.