تغییرات اخیر

در اینجا اطلاعیه‌ها، نسخه‌ها و تغییرات جدید لیارا فهرست می‌شوند.

آنچه در این مقاله می‌خوانید

راهنمای جامع بودجه خزش (Crawl Budget) و نقش آن در بهینه‌ سازی سایت


۲۷ فروردین ۱۴۰۴

بودجه خزش Crawl Budget به تعداد صفحاتی گفته می‌شود که موتورهای جست و جو در یک بازه زمانی مشخص شده، یک وب سایت را بازدید و بررسی می‌کنند.

موتورهای جست و جو این بودجه را بر اساس دو عامل تعیین می‌کنند:

  1. محدودیت خزش: به این معنی است که کاربر چقدر می‌تواند بدون آنکه به سایت فشار بیاورد، از آن بازدید کند.
  2. تقاضای خزش: به این معنی است که کاربر چقدر تمایل دارد که صفحات یک سایت را بررسی کند.

اگر ساختار سایت به شکلی باشد که این دو عامل بودجه را رعایت نکند. به عنوان مثال صفحات کم ارزش، تکراری یا دچار خطاهای زیادی باشد. موتور جست و جو نمی‌تواند در تایم درستی به سراغ صفحات مهم تر برود. این موضوع در نهایت می‌تواند به کاهش عملکرد سایت در نتایج جست و جو منجر شود.

برای بهبود سئو، بهتر است که از بودجه خزش سایت به روشی هوشمندانه استفاده کنید تا موتورهای جست و جو منابعش را صرف صفحاتی کند که ارزش ایندکس کردن را داشته باشد.

همین الان، بدون کمترین پیچیدگی، سرور مجازی خودتون رو در کمتر از ۳۰ ثانیه، راه‌اندازی کنید.
✅ عملکرد پایدار ✅ ترافیک نامحدود ✅ هزینه به‌صرفه
خرید سرور مجازی ابری

بودجه خزش (Crawl Budget)

آنچه در ادامه خواهید خواند:

  • بودجه خزش چیست؟
  • چرا موتور های جست و جو بودجه از خزش استفاده می‌ کنند؟
  • موتور های جست و جو چگونه بودجه خزش را مشخص می‌ کنند؟
  • آیا بودجه خزش فقط به صفحات سایت مربوط می شود؟
  • محدودیت خزش یا Host Load چگونه کار می کند؟
  • تقاضای خزش Crawl Demand چگونه کار می کند؟
  • ظرفیت خزش سیستم موتور جست و جو
  • دلیل اهمیت بودجه خزش
  • بودجه خزش در Google Search Console
  • چگونه می‌ توان بودجه خزش سایت را بهینه کرد؟
  • آدرس های URL قابل دسترسی با پارامترها
  • چگونه می‌توان دسترسی موتورهای جست و جو را محدود کرد؟
  • بررسی گزارش های XML Sitemap در Google Search Console
  • بررسی گزارش‌ های XML Sitemap در Bing Webmaster Tools
  • بررسی گزارش‌ های XML Sitemap در ContentKing
  • نکته طلایی برای بهینه‌ سازی بودجه خزش
  • تأثیر سرعت بارگذاری و صفحات غیر قابل ایندکس بر بودجه خزش
  • ابزار بررسی سرعت بارگذاری سایت
  • ابزار بررسی سرعت بارگذاری سایت در گوگل
  • صفحات رایج غیر قابل ایندکس در موتور های جست و جو
  • ساختار لینک دهی داخلی و نقش آن در بودجه خزش
  • نحوه افزایش بودجه خزش سایت
  • سوالات متداول
  • جمع بندی

بیشتر بخوانید: 5 اشتباه رایج در انتخاب هاست + راهکار موثر برای جلوگیری از این اشتباهات

بودجه خزش چیست؟

بودجه خزش صفحاتی است که موتورهای جست و جو در یک بازه زمانی معین صفحات یک سایت را بررسی و آن را ایندکس می‌کند. این فرآیند برای موتورهای جست و جو بسیار حائز اهمیت است به این دلیل که می‌تواند محتواهای سایت را شناسایی کند و آن را در نتایج جست و جو نمایش می‌دهد. موتورهای جست و جو برای هر سایت محدودیتی را در نظر می‌گیرد و مشخص می‌کند که چه مقدار از صفحات سایت می‌تواند در دوره های زمانی خاص بررسی شود.

در بعضی از مواقع بودجه خزش با عنوان هایی مانند فضای خزش یا زمان خزش هم نام برده می‌شود. اما هدف نهایی استفاده بهینه از ظرفیت های خزش برای نمایش هر چه بهتر و بیشتر صفحات مهم سایت در نتایج جست و جو است.

عوامل متعددی می‌تواند بر بودجه خزش تاثیرات بسزایی بگذارد. عواملی مانند ساختار سایت، سرعت بارگذاری صفحات، کیفیت و ارزش محتوا صفحات، مشکلات فنی مانند لینک های خراب یا ریدایرکت ها اتفاق بی‌افتد موتور های جست و جو نمی‌تواند بودجه خزش را به درستی اعمال کنند و در این زمان امکان دارد که تعدادی از صفحات مهم سایت نادیده گرفته بشود و ایندکس نشود.

بنابراین مدیریت و بهینه سازی بودجه خزش برای سایت های بزرگ که تعداد صفحات زیادی دارند، از اهمیت بسیاری برخوردار است به این دلیل که موتور های جست و جو قادر به شناسایی و ایندکس کردن صفحات مهم و کاربردی سایت هستند.

چرا موتور های جست و جو از بودجه خزش استفاده می‌ کنند؟

به این دلیل که منابع محدودی را در اختیار دارد و باید آن را بین میلیون ها سایت تقسیم کند. بنابراین لازم است که در اولویت بندی صفحات برای بازدید، یک برنامه ریزی دقیقی را داشته باشد. اعمال بودجه خزش به آن ها کمک می‌کند که این فعالیت به روشی کار آمد انجام شود و تقسیم بندی درستی شکل بگیرد.

مطالعه بیشتر: مزایای هاست ایمیل، چرا استفاده از هاست ایمیل برای کسب و کار شما ضروری است؟

موتور های جست و جو چگونه بودجه خزش را مشخص می‌ کنند؟

همان طور که در مطالب بالا به آن کوتاه اشاره کردیم، موتورهای جست و جو دو عامل اصلی را برای این معیار انتخاب کرده و با توجه به آن بودجه خزش را بر سایت ها اعمال می‌کنند. در ادامه کامل تر این موضوع را شرح خواهیم داد.

محدودیت خزش (Crawl Limit یا Host Load):

به این معنی است که سایت مورد نظر چه مقدار ظرفیت دارد که کاربران آن را مورد بازدید قرار بدهند، بدون آنکه دچار کوچک ترین اختلال یا کندی در عملکرد سایت شود. البته باید در نظر داشت که تنظیماتی که مدیر سایت برای میزان دسترسی خزش ها تعیین کرده است هم یکی از معیار های شناسایی محدودیت خزش است و موتور های جست و جو آن را مورد بررسی قرار خواهند داد.

تقاضای خزش (Crawl Demand یا Crawl Scheduling):

این معیار به این معنی است که چه صفحاتی از سایت ارزش بیشتری برای ایندکس شدن و بازدید زیاد را دارد. به عنوان مثال صفحاتی که محبوب تر هستند و بیشتر به روز رسانی در آن انجام می‌شود، اولویت بیشتری برای این معیار دارند.

آیا بودجه خزش فقط به صفحات سایت مربوط می شود؟

در جواب باید به شما گفت که خیر. اگر چه برای ساده سازی گفتاری این مورد به صفحات اشاره می‌شود، اما واقعیت امر این است که بودجه خزش تنها مربوط به صفحات نیست و هر نوع فایلی که جست و جو گر های موتور جست و جو بتوانند آن را بررسی کند شامل می‌شود. علاوه بر صفحات HTML، فایل هایی مانند CSS , JavaScript , نسخه های موبایلی صفحات، فایل های PDF و نسخه های مختلف مانند تگ hreflang هم این بودجه را به خود اختصاص می‌دهد.

محدودیت خزش یا Host Load چگونه کار می کند؟

محدودیت خزش یکی از مولفه هایی است که در تعیین بودجه خزش نقس بسیار زیای را دارد. جست و جو گر های موتور جست و جو به صورتی طراحی شده‌اند که به سرور سایت فشاری را وارد نکنند. بنابراین اگر احساس کند که سایت در شرایط مناسبی نیست یا منابع سرور محدود است، سرعت و تعداد خزش ها را تا حد زیادی بر آن سایت کاهش می‌دهد.

موتور های جست و جو عوامل مختلفی را برای تعیین این محدودیت ها در نظر می‌گیرد که در ادامه به صورت کامل به آن خواهیم پرداخت.

وضعیت فنی سایت:

اگر آدرس های سایت، دفعات زیادی را دچار ارور یا تایم اوت شود، نشان دهنده این است که سرور در وضعیت مناسبی نخواهد بود و همین دلیل باعث کاهش بودجه خزش می‌شود.

نوع هاست انتخابی:

اگر سایت شما بر روی هاست اشتراکی قرار گرفته باشد و در کنار سایت های دیگر فعالیت کند به طبع سهم بودجه خزش آن نیز محدود خواهد شد. در این حالت همه سایت ها باید این بودجه را در بین خود تقسیم کنند. سایت های نسبتا بزرگ، اگر از سرور های اختصاصی استفاده کنند، می‌تواند تفاوت های چشم گیری را در خزش موتور های جست و جو و کاهش زمان بارگذاری سایت ایجاد کند.

زیر ساخت های مختلف سایت:

اگر سایت نسخه جداگانه ای را برای موبایل طراحی کرده باشد و هر دو نسخه بر روی یک سرور میزبانی شوند، باید به آن توجه داشت که بودجه خزش قطعا بر هر دو آن ها تقسیم خواهد شد، پس این نکته مهم را باید در طراحی و ساخت سایت مد نظر گرفت.

تقاضای خزش Crawl Demand چگونه کار می کند؟

تقاضای خزش به این معنی است که موتور جست و جو تصمیم گرفته است که کدام یک از URL ها ارزش خزش مجدد را دارد و هر چند وقت یک بار باید آن را بررسی کند. این تصمیم گیری بر اساس مجموعه ای از فاکتور ها انجام می‌شود که در ادامه شرح داده شده است.

میزان محبوبیت URL ها:

هر چقدر یک صفحه لینک های (داخلی و خارجی) بیشتری داشته باشد، یا در نتایج موتور های جست و جو با عبارت های دیگر نمایش داده شود، احتمال اینکه خزش بیشتری بر روی آن ها انجام بشود، بیشتر است.

محتواهای تازه منتشر شده:

صفحاتی که مرتبا به روز رسانی می‌شوند، معمولا تقاضای بیشتری را برای خزش دارند، به این دلیل که اطلاعات آن ها تغییر کرده است و موتور های جست و جو نیاز دارند که نسخه جدیدی را در نتایج جست و جو برای آن صفحه نمایش دهند.

نوع صفحات:

بسیاری از صفحات نیازی به خزش نخواهند داشت. به عنوان مثال صفحه شرایط و ظوابط یا حریم خصوصی معمولا ثابت هستند و به ندرت تغییر خواهند کرد. اما در مقابل، صفحاتی مانند دسته بندی محصولات یا مقالات و وبلاگ ها باید مرتبا به روز رسانی شوند و محتوای جدیدی به آن اضافه شود. طبیعیتا این صفحات نیز باید بیشتر توسط جست و جو گر ها بررسی شود.

در واقع موتورهای جست و جو سعی بر این دارند که منابع خود را صرف صفحاتی کنند که هم ارزش بیشتری را داشته و هم احتمال تغییر محتوای آن ها بسیار بالا است. بنابراین، ساختار و محتوای سایت هم باید به گونه ای طراحی شود که این صفحات ارزشمند، بیشترین سهم از بودجه خزش را به خود اختصاص دهند. این موضوع می‌تواند تاثیر مستقیمی بر سرعت ایندکس شدن و رتبه صفحات در جست و جو داشته باشد.

برای ادامه مطالعه و یادگیری: تفاوت هاست ابری با هاست اشتراکی | کدام گزینه برای سایت شما بهتر است؟

ظرفیت خزش سیستم موتور جست و جو

با اینکه سیستم های خزش موتور های جست و جو ظرفیت بسیار بالایی دارند. اما در انتها این ظرفیت محدود خواهد شد. به عنوان مثال اگر، 80 درصد دیتاسنتر های گوگل به صورت همزمان از دسترس خارج شوند، ظرفیت خزش آن ها به شدت کاهش پیدا می‌کند و در نتیجه، بودجه خزش تمام وب سایت ها تحت تاثیر قرار خواهند گرفت.

دلیل اهمیت بودجه خزش

هدف اصلی هر دارنده سایتی این است که بتواند به سرعت و به صورت موثر تمامی صفحاتی که ایندکس می‌شوند را پیدا و آن ها را بررسی کند. هر زمانی که صفحات جدیدی را به سایت خود اضافه می‌کنید یا محتوای صفحات موجود را بررسی می‌کنید، به این معنی است که می‌خواهید موتور های جست و جو این تغییرات را به سرعت بشناسند و هرچه زودتر آن را ایندکس کنند.

اگر بودجه خزش به درستی و اصولی اعمال نشود، موتورهای جست و جو امکان دارد نتوانند سایت شما را به صورت کامل بررسی کنند و ممکن است که زمان خود را صرف بخش های بی اهمیت سایت کند؛ در نتیجه صفحات شما دست نخورده باقی می‌ماند. اگر موتور های جست و جو از وجود این صفحات مطلع نشوند، به آن ها مراجعه تخواهند کرد و در انتها صفحات ایندکس نخواهد شد. این موضوع می‌تواند به کاهش تعداد کاربران از طریق موتور های جست و جو منجر شود.

نکته: معمولا بودجه خزش زمانی استفاده می‌شود که سایت شما حجم زیادی از صفحات را داشته باشد. به عنوان مثال اگر سایتی با 10 هزار صفحه دارید. در این حالت، مدیریت درست بودجه خزش اهمیت بیشتری را پیدا می‌کند.

بودجه خزش در Google Search Console

اگر سایت شما در Google Search Console باشد، می‌توانید اطلاعاتی را در مورد بودجه خزش گوگل برای سایت خود به دست بیاورید.

برای مشاهده این اطلاعات، مراحل زیر را دنبال کنید:

وارد حساب کاری Google Search Console شوید.

به بخش Crawl رفته و گزینه Crawl Stats را انتخاب کنید. در این بخش می‌توانید تهداد صفحاتی که گوگل هر روز آن را مورد بررسی قرار می‌دهد را مشاهده کنید.

با رفتن به این بخش می‌توانید مشاهده کنید که چه تعدادی از سایت شما به صورت روزانه توسط گوگل جست و جو می‌شود. تمامی این داده ها به شما کمک می‌کند که مدیریت بهتری داشته باشید و بودجه خزش سایت خود را بالاتر ببرید.

به عنوان مثال: 27 صفحه × 30 روز = 810 صفحه

طبق این محسابه، در طول یک ماه گوگل می‌تواند 810 صفحه از سایت شما را بررسی و ایندکس کند.

چگونه می‌ توان بودجه خزش سایت را بهینه کرد؟

بهینه سازی بودجه خزش به این معنی است که از هدر رفت آن جلوگیری می‌کند. در واقع باید عواملی که باعث هدر رفت بودجه خزش می‌شود را شناسایی و رفع کرد. دلایل رایج هدر رفتن بودجه خزش عبارتند از:

محتواهای تکراری

صفحاتی که مشابه به هم هستند و مطالب با محتواهای یکسانی را در اختیار دارند، به عنوان محتواهای تکراری شناخته می‌شوند و بودجه خزش به آن ها تعلق نخواهد گرفت. بسیاری از صفحات کپی شده یا صفحات تگ ها می‌توانند باعث ایجاد مشکلاتی در بودجه خزش شوند.

محتواهای بی کیفیت

صفحاتی که محتوای آن کم یا بی کیفیت هستند، ارزشی برای مخاطب و گوگل را نخواهد داشت، به دلیل نداشتن محتواهای مفید برای موتور جست و جو، می‌تواند منابع خزش را هدر بدهد و باعث افت سایت شود.

لینک های خراب و ریدایرکت شده

لینک های خراب شده به صفحاتی گفته می‌شود که وجود ندارد؛ ریدایرکت به صفحاتی گفته می‌شود که به URL های دیگر هدایت می‌شوند. باید در نظر داشت که هر دوی آن ها تاثیر منفی را بر روی بودجه خزش سایت به همراه خواهند داشت.

URL های اشتباه در سایت

URL هایی که قابلیت ایندکس شدن را ندارند، مانند صفحات خطای 4xx , 3xx یا 5xx، نباید در نقشه سایت XML گنجانده شود. این عمل باعث می‌شود که موتورهای جست و جو منابع خود را بر روی صفحاتی که ارزش ایندکس شدن را ندارند، صرف کند و بودجه خزش به درستی اعمال نشود.

صفحات با تایم اوت بالا

صفحاتی که زمان زیادی را برای بارگذاری استفاده می‌‌کنند یا بارگذاری نمی‌شوند، می‌تواند تاثیرات منفی بر روی بودجه خزش داشته باشد. موتور جست و جو امکان دارد که این موضوع را به عنوان نشانه ضعف عملکردی سایت در نظر بگیرد و محدودیت های خزش را کاهش دهد.

زیاد بودن صفحات غیر قابل ایندکس

اگر سایت شما هم تعداد زیادی صفحات غیر قابل ایندکس را داشته باشد، تمامی این صفحات خزش را هدر می‌دهد و در نتیجه رتبه مناسبی را نخواهید گرفت.

لینک های داخلی ضعیف

اگر ساختار اصلی لینک داخلی سایت به درستی تنظیم نشود، موتور های جست و جو به تعدادی از صفحات توجه کافی را نمی‌کند و از ایندکس کردن آن ها جلوگیری می‌کند.

بیشتر بخوانید: هاست اختصاصی، بهترین گزینه برای بهبود عملکرد سایت و افزایش امنیت

هاست ایمیل خود را همین حالا راه‌اندازی کنید و از امنیت و سرعت بالا بهره‌مند شوید.
✅ امنیت بالا ✅ پشتیبانی ۲۴ ساعته ✅ ایمیل اختصاصی
خرید هاست ایمیل

آدرس های URL قابل دسترسی با پارامترها

در اکثر اوقات، آدرس های URL با پارامترها نباید برای موتور های جست و جو قابل دسترس باشد، زیرا این مدل از آدرس می‌تواند تعداد زیادی از URL هایی را بسازد. معمولا از این مدل URL ها برای اعمل فیلتر های محصولات در سایت های تجارت الکترونیک استفاده می‌شود. استفاده از این پارامترها مشکلی ندارد، اما باید مطمئن شوید که موتورهای جست و جو نتوانند به آن ها دسترسی پیدا کنند.

چگونه می‌توان دسترسی موتورهای جست و جو را محدود کرد؟

برای اینکه بتوانید دسترسی های موتور جست و جو را محدود کنید از روش های زیر استفاده کنید.

  • از فایل robots.txt برای دستور دادن به موتورهای جست و جو استفاده کنید تا از دسترسی به این چنین URL هایی جلوگیری کنید.
  • اگر این روش برای شما به هر دلیلی امکان پذیر نیست، از تنظیمات مدیریت پارامترهای URL در Google Search Console و Bing Webmaster Tools استفاده کنید تا در گوگل و بینگ مشخص کنید که کدام صفحات نباید خزش شوند.
  • اضافه کردن قابلیت nofollow به لینک های فیلترها، توجه داشته باشید که از مارس 2020، شرکت گوگل امکان دارد که قابلیت nofollow را نادیده بگیرد. بنابراین، مرحله اول بسیار حائز اهمیت بوده است.

برای بررسی مشکلات مربوط به فایل های XML Sitemap و بهینه سازی بودجه خزش Crawl Budget ابزار های زیر می‌تواند اطلاعات ارزشمندی را در اختیار شما قرار بدهد.

  • Google Search Console
  • Bing Webmaster Tools
  • ContentKing

در ادامه نحوه دسترسی به اطلاعات را در هر ابزار را به زبان ساده توضیح خواهیم داد.

بررسی گزارش های XML Sitemap در Google Search Console

  1. وارد حساب کاربری Google Search Console خود شوید.
  2. از منوی سمت چپ، بخش Indexing را انتخاب کنید و بر روی گزینه Sitemaps کلیک کنید.
  3. بر روی XML sitemap کلیک کنید.
  4. سپس بر روی See Page Indexing کلیک کنید تا وضعیت ایندکس شدن صفحات شما بررسی شود.

بررسی گزارش‌ های XML Sitemap در Bing Webmaster Tools

  1. وارد حساب Bing Webmaster Tools خود شوید.
  2. به بخش Configure My Site بروید.
  3. بر روی Sitemaps کلیک کنید تا بتوانید گزارش‌ های مربوط به نقشه‌ های سایت را مشاهده کنید.

بررسی گزارش‌ های XML Sitemap در ContentKing

  1. وارد حساب ContentKing خود شوید.
  2. بر روی گزینه Issues کلیک کنید.
  3. سپس XML Sitemap را انتخاب کنید.
  4. در صورتی که مشکلی وجود داشته باشد، پیام‌ هایی مانند (Page is incorrectly included in XML sitemap) را دریافت خواهید کرد، که نشان می‌دهد یک URL اشتباه در نقشه سایت گنجانده شده است.

نکته طلایی برای بهینه‌ سازی بودجه خزش

یکی از روش هایی که می‌تواند برای بهینه سازی بودجه خزش از آن استفاده کنید، تقسیم کردن نقشه سایت به بخش های کوچک تر است. به عنوان مثال می‌توانید برای هر بخش از سایت، یک فایل XML Sitemap جداگانه ای را داشته باشید.

  • به عنوان مثال: sitemap برای بلاگ، فروشگاه، صفحات دسته‌ بندی.

این کار باعث می‌شود در صورت بروز مشکل در یکی از بخش های سایت، سریع تر از حالت عادی متوجه آن شوید. به عنوان مثال:

  • اگر Sitemap بخش A شامل 500 لینک باشد و 480 آن ایندکس شده باشد، این وضعیت مناسب است.
  • اما اگر Sitemap بخش B هم 500 لینک داشته باشد و فقط 120 صفحه ایندکس شده باشد، احتمالا تعداد زیادی از URL های غیراستاندارد یا غیر قابل ایندکس در آن قرار گرفته است که باید بررسی شود.

این مدل دسته بندی، هم نظارت بر عمکلرد سایت را ساده تر می‌کند و هم کمک می‌‎کند که موتور های جست و جو بودجه خزش را بر روی صفحات مهم تری صرف کند.

مطالعه بیشتر: هاست اشتراکی چیست؟ + نکات مهم در انتخاب هاست اشتراکی

تأثیر سرعت بارگذاری و صفحات غیر قابل ایندکس بر بودجه خزش

در فرآیند بیهنه سازی بودجه خزش، دو عامل اصلی و مهم در اکثر اوقات نادیده گرفته می‌شود.

  • زمان بارگذاری صفحات
  • تعداد صفحات غیر قابل ایندکس

این دو مورد می‌تواند تاثیر چشمگیری را بر نحوه عملکرد موتورهای جست و جو با وب سایت ها را داشته باشد.

زمان زیاد لود شدن صفحات

وقتی صفحات سایت دیر بارگذاری می‌شوند و مدت زمان زیادی برای بارگذاری شان مصرف می‌شود، موتورهای جست و جو مجبور است که زمان محدودی را برای آن ها در نظر بگیرد و آن ها را کمتر بررسی کند. علاوه بر اسیب رسیدن به روند خزش، این مشکل تجربه کاربران را هم به شدت تحت تاثیر قرار می‌دهد و باعث کاهش نرخ تبدیل می‌شود.

نکته مهم: زمان بارگذاری بیشتر از 2 ثانیه، مخصوصا در موبایل، یک زنگ خطر است که باید به آن توجه بشود. در حالت ایده آل باید این زمان به 1 ثانیه برسد.

ابزار بررسی سرعت بارگذاری سایت

برای بررسی سرعت بارگذاری سایت می‌توانید از ابزارهای زیر استفاده کنید.

  • Pingdom
  • WebPageTest
  • GTmetrix

ابزار بررسی سرعت بارگذاری سایت در گوگل

گوگل هم در دو بخش مختلف اطلاعات مرتبط با بودجه خزش را گزارش می‌دهد:

  • Google Analytics: از مسیر Behavior > Site Speed
  • Google Search Console: از مسیر Settings > Crawl Stats
  • Bing Webmaster Tools: از مسیر Reports & Data > Crawl Information مشاهده کرد.

صفحات رایج غیر قابل ایندکس در موتور های جست و جو

  • صفحات ریدایرکت شده (کدهای 3xx)
  • صفحات حذف‌ شده یا نا موجود (کدهای 4xx)
  • صفحات با خطای سرور (کدهای 5xx)
  • صفحاتی که دارای تگ noindex یا کانونیکال به URL دیگری هستند

ساختار لینک دهی داخلی و نقش آن در بودجه خزش

نحوه لینک دهی مناسب صفحات داخلی یک سایت به یکدیگر، نقش بسیار مهمی را در بهینه سازی بودجه خزش دارد. هرچه یک صفحه لینک های داخلی بیشتری را دریافت کند، احتمال جست و جو شدن آن توسط موتورهای جست و جو بسیار بیشتر خواهد بود.

ساختار اصلی و سلسله مراتبی عمیقی که صفحات میانی و پایینی در آن لینک های کمی را دریافت می‌کنند، معمولا باعث می‌شود که جست و جو گرها به آن صفحات دسترسی نداشته باشند. صفحات مهم و ارزشمند باید در نقاط کلیدی و پر تکرار سایت لینک شده باشند تا به تعداد دفعات خزش انجام شود.

به عنوان مثال شما مقاله ای را در سال 2012 منتشر کرده‌اید که هنوز ترافیک مناسبی را جذب می‌کند، پس باید در مقالات جدید تر هم به آن لینک بدهید تا ساختار داخلی سایت همچنان در دست خزش قرار بگیرد.

برای ادامه مطالعه و یادگیری: هاست ابری یا Cloud Host چیست؟ انواع + کاربرد

نحوه افزایش بودجه خزش سایت

اعتبار بین صفحات و بودجه خزش رابطه قوی است و نمی‌توان آن را جدی نگرفت. اگر چه گوگل دیگر PageRank را به روز رسانی نمی‌کند، اما هنوز هم از الگوریتم های مشابه آن برای تعیین اعتبار صفحات استفاده می‌شود. پس در نتیجه برای افزایش بودجه خزش سایت، باید بر روی افزایش اعتبار دامنه و صفحات کار، که مهم ترین راه آن لینک سازی خارجی اصولی است کار شود. هر چه اعتبار صفحات سایت بیشتر شود، به طبع سهم بیشتری را از بودجه خزش گوگل به دست می‌آورد و شانس دیده شدن و ایندکس شدن مطالب به مراتب بیشتر می‌شود.

همین حالا، فایل‌های خودتون رو در فضایی سریع، پایدار و مقیاس‌پذیر ذخیره کنید.
✅ سازگار با Amazon S3 ✅ عملکرد بالا ✅۲.۵ گیگ فضای رایگان
خرید فضای ذخیره‌سازی ابری

سوالات متداول:

در ادامه به سوالاتی که امکان دارد در این زمینه برای شما بدون پاسخ بماند، جواب‌های کوتاه اما مفیدی داده‌ایم که با استفاده از آن می‌توانید به سوال خود پاسخ صحیحی را بدهید.

بودجه خزش چیست؟

بودجه خزش به تعداد صفحاتی گفته می‌شود که موتورهای جست‌وجو در یک بازه زمانی مشخص از یک وب‌سایت بازدید و آن‌ها را بررسی می‌کنند. این بودجه محدود است و اگر به‌درستی مدیریت نشود، ممکن است صفحات مهم سایت اصلاً دیده نشوند.

چطور می‌توان بودجه خزش را افزایش داد؟

گوگل در گذشته اعلام کرده که بین اعتبار صفحات (Page Authority) و میزان بودجه خزیدن ارتباط مستقیم وجود دارد. به زبان ساده، هرچه یک صفحه اعتبار بالاتری داشته باشد (به عنوان مثال از طریق لینک‌سازی خارجی)، سهم بیشتری از بودجه خزش به آن اختصاص می‌یابد. بنابراین، یکی از موثرترین راه‌ها برای افزایش بودجه خزش، افزایش اعتبار دامنه و صفحات از طریق لینک‌سازی اصولی است.

چه عواملی بودجه خزش را محدود می‌کنند؟

بودجه خزش می‌تواند تحت تأثیر عواملی مانند وضعیت سرور و زیرساخت میزبانی قرار بگیرد. برای مثال:

  • اگر سایت خطا بدهد (مثل ارورهای ۵۰۰ یا ۵۰۴)
  • اگر سرعت بارگذاری صفحات پایین باشد یا آدرس‌ها به مکرر تایم‌اوت شوند.
  • اگر سایت روی هاست اشتراکی قرار گرفته باشد، خزنده‌ها با احتیاط بیشتری عمل می‌کنند تا به سایر وب‌سایت‌های روی آن سرور آسیبی نزنند

آیا استفاده از تگ canonical و meta robots لازم است؟

بله، استفاده از این تگ‌ها بسیار مهم است، اما باید کاربرد دقیق آن‌ها را دانست. تگ‌های canonical و meta robots به موتور جست‌وجو اعلام می‌کنند که کدام نسخه از یک صفحه باید در نتایج نمایش داده شود، اما جلوی خزیدن صفحات دیگر را نمی‌گیرند. برای جلوگیری از خزش صفحاتی خاص، باید از فایل robots.txt و ویژگی nofollow در لینک‌ها استفاده کرد.

جمع بندی

بودجه خزش به تعداد صفحاتی اشاره دارد که موتور های جست و جو در یک بازه زمانی مشخص از سایت شما بازدید می‌کنند. برای بهینه سازی این بودجه، باید به عواملی مانند سرعت بارگذاری، جلوگیری از محتوای تکراری، بهینه سازی لینک های داخلی و رفع مشکلات فنی توجه کرد. با مدیریت صحیحی این موارد، می‌توان از هدر رفت بودجه خزش جلوگیری کرده و صفحات مهم سایت را بیشتر در نتایج جست و جو نمایش داد.

مطالعه بیشتر: 8 اشتباه رایج در میزبانی ایمیل و روش های جلوگیری از آن

به اشتراک بگذارید