14 مورد ضروری تکنیکال سئو پیشرفته

Q: ۱. آیا تکنیکال برای سایتهای کوچک هم به همین اندازه مهمه؟

بله، ولی اولویتها فرق میکنن. سایتهای بزرگ بیشتر درگیر مشکلاتی مثل فضاهای بینهایت، صفحات قالبی تکراری، و زنجیرههای ریدایرکت پیچیده هستن. ولی سایتهای کوچک اغلب با مشکلات سادهتری دست و پنجه نرم میکنن که تأثیر بزرگتری دارن. مثل ایندکس شدن سایت staging، نرمالسازی نشدن URL ها، یا Schema ای که ماههاست بهروز نشده. در واقع روی سایتهای کوچک این اشتباهات سریعتر به چشم گوگل میان، چون صفحات کمتری دارن که خطاها رو «پنهان» کنن.

Q: ۲. از کجا بفهمم کرالرهای هوش مصنوعی به سایتم دسترسی دارن یا نه؟

بهترین راه اینه که لاگهای سرورت رو بررسی کنی. User Agent هایی مثل GPTBot ، ClaudeBot ، PerplexityBot ، و Applebot-Extended رو دنبال بگرد. اگه اصلاً درخواستی از این رباتها نمیبینی، احتمالاً یا در robots.txt بلاک شدن یا محتوای اصلیت داخل جاوااسکریپت هست که اونها نمیتونن ببیننش. علاوه بر این، مطمئن شو که در robots.txt هیچ Disallow کلی برای * تعریف نشده که ناخواسته این رباتها رو هم شامل بشه.

Q: ۳. چند بار در سال باید یه آدیت کامل تکنیکال انجام بدم؟

یه آدیت جامع هر سه ماه یه بار ایدهآله. مخصوصاً برای Schema، ریدایرکتها، و وضعیت ایندکساسیون. ولی بعضی چیزها نیاز به مانیتورینگ مداوم دارن، نه فصلی. مثلاً هر بار که یه صفحهی جدید منتشر میکنی باید ایندکس شدنش رو چک کنی، یا هر بار که یه ریدایرکت اضافه میشه باید توی نقشهی ریدایرکت ثبت بشه. قانون کلی: هر چیزی که میتونه «بیسروصدا» خراب بشه، باید روتین بررسی داشته باشه.

Q: ۵. وقتی صفحات مهم سایتم ایندکس نمیشن، اولین جایی که باید چک کنم کجاست؟

یه چکلیست سه مرحلهای سریع داری: اول، URL رو در Google Search Console با ابزار «بررسی URL» چک کن و ببین گوگل چه دلیلی برای عدم ایندکس دادن. دوم، مطمئن شو که صفحه حداقل یه لینک داخلی از یه صفحهی دیگهی سایت داره. صفحات کاملاً ایزوله معمولاً ایندکس نمیشن. سوم، محتوای صفحه رو با نگاه انتقادی بررسی کن: آیا چیزی میگه که گوگل جای دیگهای پیدا نمیکنه؟ اگه جواب نهست، مشکل فنی نیست. مشکل ارزش محتواست.

فکر می‌کنی سئو تکنیکال سایتت رو کامل پیاده‌سازی کردی؟ دوباره فکر کن! این راهنما پر از نکات پیشرفته‌ایه که شاید ازشون غافل شده باشی.

تکنیکال پیشرفته فقط درباره‌ی رفع لینک‌های شکسته نیست. بلکه درباره‌ی کنترل و بهبود رفتار کرال، کیفیت ایندکساسیون، برابری رندرینگ، و وضوح موجودیت (Entity) در موتورهای جستجوی سنتی و سیستم‌های هوش مصنوعیه.

بیشتر تیم‌های باتجربه‌ی سئو نه به خاطر فراموش کردن سایت‌مپ XML رتبه از دست می‌دن، بلکه به خاطر ناکارآمدی‌های معماری کوچیکیه که آروم‌آروم روی هم انباشته می‌شن.

💡 یه نکته برای شروع: سئو تکنیکال پیشرفته مثل نگهداری یه ماشین حرفه‌ایه. اگه فقط وقتی روشن نمی‌شه سراغش بری، خیلی دیر شده. باید روتین داشته باشی.

در این راهنما، ۱۴ مشکل پیشرفته‌ی تکنیکال رو بررسی می‌کنیم که اغلب نادیده گرفته می‌شن، به همراه چارچوب‌های تشخیصی برای ارزیابی و رفع اون‌ها. بدون اینکه سایتت رو بی‌ثبات کنی.

🟠 اگر به خدمات سئو سایت نیاز دارید به تلگرام یا واتس اپ شماره 09210180593 پیام دهید.

اشتباهات رایج در سئو تکنیکال

بعضی از مشکل‌هایی که در ادامه می‌بینی تازه‌ان. بعضی‌ها هم سال‌هاست وجود دارن، ولی سئوکارها (مخصوصاً روی سایت‌های بزرگ) هنوز ازشون غافل می‌شن. سایت‌های بزرگ به خاطر حجم بالای صفحات، بیشتر در معرض این نشت‌های فنی هستن که در پس‌زمینه رشد می‌کنن و بزرگ می‌شن.

۱. پیش‌بارگذاری لینک‌های داخلی برای بهبود سرعت درک‌شده

بهبود سرعت سایت می‌تونه پیچیده باشه. اغلب نیاز به تنظیم کش، بهینه‌سازی CSS و جاوااسکریپت، مینیفای کردن، لِیزی لودینگ، DNS prefetching، و حذف کدهای بلااستفاده داره، که معمولاً یعنی وقت و هزینه‌ی توسعه‌دهنده.

سرعت مهمه.

یه تحقیق از Google/Soasta نشون داده که با افزایش زمان بارگذاری صفحه از یک ثانیه به سه ثانیه، احتمال باونس (خروج سریع) ۳۲٪ افزایش پیدا می‌کنه. در پنج ثانیه، این عدد به ۹۰٪ می‌رسه.

ولی هر بهبود سرعتی در ابزارهایی مثل Lighthouse نمایش داده نمی‌شه.

اینجاست که سرعت درک‌شده (Perceived Load Time) وارد میدان می‌شه.

💡 تفاوت سرعت واقعی و درک‌شده: سرعت واقعی یعنی چقدر طول می‌کشه صفحه لود بشه. سرعت درک‌شده یعنی چقدر حس می‌کنی سریع لود شده. کاربران اغلب به حس‌شون بیشتر اعتماد می‌کنن تا اعداد!

سرعت اندازه‌گیری‌شده مهمه. سرعت درک‌شده اغلب مهم‌تره.

وقتی درست پیکربندی بشه، قابلیت Preload Links سرعت درک‌شده رو در هنگام ناوبری بهبود می‌ده. اگه کاربر روی یه لینک ۱۰۰ میلی‌ثانیه یا بیشتر هاور کنه یا لمسش کنه، HTML اون صفحه در پس‌زمینه فچ می‌شه. وقتی کلیک می‌کنه، صفحه تقریباً فوری لود به نظر می‌رسه.

این قابلیت باعث بهبود اینا می‌شه:

عمق تعامل
جریان ناوبری
کیفیت درک‌شده‌ی سایت

نکته حرفه‌ای: پیش‌بارگذاری لینک‌ها سرعت درک‌شده رو بهبود می‌ده، نه امتیاز PageSpeed شما رو. در Core Web Vitals، Lighthouse، Pingdom، یا GTmetrix تفاوت معناداری نمی‌بینی. صفحه فقط وقتی کاربر به اون ناوبری می‌کنه سریع‌تر حس می‌شه.

پیش‌بارگذاری لینک‌ها وقتی منطقیه که:

نمی‌تونی فوری استک پرفورمنست رو بازنویسی کنی
روی وردپرس یا CMS مشابه هستی
سایتت کاربر رو به کاوش داخلی تشویق می‌کنه

یادت باشه این یه بهینه‌سازی UX هست، نه میانبر رتبه‌بندی.

برای مطالعه بیشتر: گوگل به‌روزرسانی اسپم ژوئن ۲۰۲۶ را منتشر کرد

۲. استفاده‌ی ناهماهنگ از فرمت‌های مدرن تصویر

بهینه‌سازی تصویر جدید نیست. حاکمیت تصویر (Image Governance) جدیده.

با گذر زمان، اکثر سایت‌ها انباشته می‌شن از:

JPEGهای قدیمی
PNGهای بیش از حد بزرگ
تصاویر هیرو فشرده‌نشده
پذیرش ناقص WebP

این ناهماهنگی، حجم غیرضروری ایجاد می‌کنه.

دو فرمت مدرن تصویر می‌تونن حجم فایل رو کاهش بدن و در عین حال کیفیت رو حفظ کنن:

WebP (ساخته‌ی گوگل)
AVIF (ساخته‌ی Alliance for Open Media)

هر دو طراحی شدن تا وزن فایل رو بدون کاهش محسوس کیفیت کم کنن، ولی یکسان نیستن:

💡 AVIF در مقابل WebP: AVIF جدیدتره و اغلب فشرده‌سازی کارآمدتری داره (فایل‌های کوچک‌تر با کیفیت مشابه). WebP پشتیبانی گسترده‌تری داره و گزینه‌ی امن‌تری برای سازگاری با مرورگرهای مختلفه. برای اکثر سایت‌ها، WebP شروع بهتریه.

نکته حرفه‌ای: اگه از وردپرس استفاده می‌کنی، می‌تونی از ShortPixel برای تبدیل و مدیریت فرمت‌های تصویر در مقیاس بزرگ استفاده کنی.

برای مطالعه بیشتر: بهترین فرمت تصاویر وب سایت (JPEG, PNG, WEBP, AVIF)

۳. شکاف‌های قابلیت کرال هوش مصنوعی در آدیت‌های فنی

از اونجایی که سئو هوش مصنوعی الان یه ملاحظه‌ی ضروری شده، باید مطمئن بشی کرالرهای هوش مصنوعی می‌تونن سایتت رو کرال کنن. اگه نتونن به محتوات دسترسی داشته باشن، در نتایج جستجوی هوش مصنوعی یا پاسخ‌های تولیدشده توسط AI ظاهر نمی‌شه.

آدیت‌های سنتی تکنیکال روی Googlebot تمرکز دارن. این دیگه کافی نیست.

💡 GEO یا همان Generative Engine Optimization: این مفهوم جدید یعنی بهینه‌سازی محتوا نه فقط برای گوگل، بلکه برای موتورهای جستجوی مبتنی بر هوش مصنوعی مثل ChatGPT، Perplexity، و Claude. کرالرهای این سیستم‌ها با Googlebot رفتار متفاوتی دارن.

برای مطالعه بیشتر: GEO چیست؟ چک لیست عملی جئو

کرالرهای هوش مصنوعی مثل GPTBot، ClaudeBot، و PerplexityBot رفتار متفاوتی از ربات‌های جستجوی سنتی دارن. اگه گوگل بتونه چیزی رو کرال کنه، لزوماً کرالرهای AI هم نمی‌تونن.

بسیاری از کرالرهای هوش مصنوعی:

جاوااسکریپت رو فچ می‌کنن ولی اجراش نمی‌کنن
محتوای داینامیک رو به طور کامل رندر نمی‌کنن
قوانین robots رو متفاوت رعایت می‌کنن

حداقل مطمئن شو کرالرهای هوش مصنوعی می‌تونن از طریق این‌ها به محتوات دسترسی داشته باشن:

فایل robots.txt سایت
دستورالعمل‌های meta robots

چک‌لیست آدیت:

robots.txt رو بررسی کن برای مسدود کردن ناخواسته‌ی ربات‌های AI
meta robots رو برای دستورالعمل noindex یا محدودکننده بررسی کن
لاگ‌های سرور رو برای دسترسی کرالر هوش مصنوعی تحلیل کن
مطمئن شو محتوای حیاتی در HTML اولیه وجود داره

قابلیت کرال هوش مصنوعی الان یه لایه‌ی حیاتی تکنیکال هست، نه یه آزمایش.

برای مطالعه بیشتر: محتوای سئو شده مورد علاقه گوگل و ChatGPT

۴. فرض کردن اینکه رندرینگ جاوااسکریپت «حل شده»

کرالرهای موتورهای جستجو عموماً دیگه مشکلی با کرال کردن جاوااسکریپت ندارن. این مشکلی بود که قبلاً فکر می‌کردیم حل شده ولی برگشته.

کرالرهای هوش مصنوعی رفتار متفاوتی از ربات‌های سنتی موتور جستجو دارن. در حالی که بیشتر اون‌ها می‌تونن فایل‌های جاوااسکریپت رو فچ کنن، معمولاً کدهای لازم برای رندر کردن عناصر داینامیک رو اجرا نمی‌کنن.

💡 هایدریشن (Hydration) چیه؟ هایدریشن لحظه‌ایه که جاوااسکریپت HTML استاتیک رو تحویل می‌گیره و اون رو به محتوای تعاملی تبدیل می‌کنه. مشکل اینجاست که اگه محتوای اصلی سایتت فقط بعد از این مرحله نمایش داده بشه، کرالرهای هوش مصنوعی ممکنه اصلاً اون رو نبینن.

تحقیقات صنعتی این رو تأیید می‌کنه: یه مطالعه از Vercel نشون داد که بیشتر کرالرهای هوش مصنوعی می‌تونن فایل‌های جاوااسکریپت رو فچ کنن (بین ۱۰ تا ۲۵٪)، ولی اون رو اجرا نمی‌کنن. GPTBot، ClaudeBot، PerplexityBot، و بقیه در حال حاضر محتوای جاوااسکریپت رو به طور کامل رندر نمی‌کنن.

Vercel کشف کرد که Googlebot در رندر کردن جاوااسکریپت بهترینه، چون Gemini می‌تونه از زیرساخت موجود گوگل برای اجرای JS استفاده کنه. این یه مزیت فنی عظیم برای گوگل نسبت به سایر موتورهای جستجوی مبتنی بر هوش مصنوعیه.

در عمل، اگه اینا داری در خطری:

توضیحات محصول بعد از هایدریشن لود می‌شن
فیلترها کاملاً سمت کلاینت هستن
داده‌های ساختاریافته به صورت داینامیک اینجکت می‌شن
ناوبری کاملاً به جاوااسکریپت وابسته‌ست

راه‌حل حذف جاوااسکریپت نیست. انتخاب استراتژی رندرینگ درسته:

رندرینگ سمت سرور (SSR)
تولید سایت استاتیک (SSG)
رویکردهای هایبرید

۵. صفحات قالبی که ریسک رو مقیاس می‌دن نه رتبه‌بندی رو

در سئو، صفحات وب قالبی چارچوب‌های صفحه‌ی مقیاس‌پذیری هستن که لی‌اوت، تنظیمات فنی، و اجزای اصلی ثابت می‌مونن در حالی که فیلدهای داده‌ی خاص تغییر می‌کنن. معمولاً در سئو برنامه‌نویسی شده (Programmatic SEO) استفاده می‌شن تا حجم زیادی از صفحات رو کارآمد تولید کنن.

💡 Programmatic SEO یعنی چی؟ یعنی ساختن صدها یا هزاران صفحه به صورت خودکار از یه دیتابیس یا ساختار داده. مثلاً یه سایت املاک که برای هر شهر یه صفحه جداگانه داره. اگه درست اجرا بشه، قدرتمنده. اگه نه، می‌تونه سایت رو از توی گوگل بپرونه.

مشکل قالب‌بندی خودش نیست. مشکل مقیاس‌بندی صفحات تقریباً یکسان با حداقل تمایزه.

وقتی صفحات قالبی خیلی شبیه هم هستن چه مشکلی پیش میاد:

محتوای تکراری و تقریباً تکراری: جریمه‌ی خودکار «محتوای تکراری» وجود نداره (گوگل این رو روشن کرده)، ولی صفحات تقریباً تکراری می‌تونن عملکرد ضعیف‌تری داشته باشن. سیگنال‌ها تقسیم می‌شن، ایندکساسیون انتخابی می‌شه، و Google تلاش می‌کنه قوی‌ترین نتیجه رو تشخیص بده.

محتوای نازک یا کم‌کیفیت در مقیاس بزرگ: وقتی صفحات ارزانی تولید می‌شن، اغلب چیز خیلی کمی می‌گن. این باعث تمایز کم، تعامل کم، و کیفیت درک‌شده‌ی پایین می‌شه.

تجربه‌ی کاربری ضعیف: اگه صفحات لوکیشن همه یه چیز می‌گن، نمی‌تونن به سوالات خاص لوکیشن جواب بدن. کاربران می‌خوان بدونن آیا این شعبه استخر داره؟ چه کلاس‌هایی ارائه می‌ده؟ پارکینگ داره؟ اگه هر صفحه فقط اسم شهر رو عوض می‌کنه، هدف محلی رو برآورده نمی‌کنه.

عدم لینک‌سازی داخلی: صفحات تولیدشده به صورت گسترده اغلب هرگز درست در بقیه‌ی وبسایت یکپارچه نمی‌شن. ممکنه در سایت‌مپ ظاهر بشن در حالی که عملاً고립(ارفن) هستن.

عدم تطابق هدف جستجو: قالب‌ها قابل تعویض نیستن. یه قالب لوکیشن که به عنوان قالب صفحه‌ی سرویس استفاده می‌شه احتمالاً عناصر لازم رو نداره.

راه‌حل: چطور بدون مقیاس‌بندی ریسک مقیاس کنیم:

۱. از متغیرهای عمیق‌تر استفاده کن (نه فقط جایگزینی شهر) بد: دنبال خدمات حیوانات خانگی در {{شهر}} هستی؟ بهتر: دنبال {{نوع-خدمات}} مطمئن برای {{نوع-حیوان}} در {{شهر}} هستی؟

💡 متغیرهای بیشتر = تمایز معنایی بیشتر = کمتر شبیه به هم به نظر رسیدن از دید گوگل.

۲. از تنوع کنترل‌شده استفاده کن، نه بازنویسی تصادفی: AI می‌تونه کمک کنه، ولی فقط اگه کنترل بشه. یه روش عملی: پنج قالب تأییدشده رو ارائه بده و به AI دستور بده یکی رو به صورت تصادفی انتخاب کنه.

۳. پس از تولید، پاس بهینه‌سازی انجام بده: تولید فاز اوله. فاز دو جاییه که کیفیت اعمال می‌شه. ساختار URL، عنوان صفحه، توضیحات متا، ساختار H1/H2، لینک‌سازی داخلی، داده‌های ساختاریافته‌ی منحصربه‌فرد.

۴. داده‌های ساختاریافته باید تفاوت‌های واقعی رو منعکس کنه: اگه هر صفحه‌ی قالبی از schema یکسانی استفاده کنه، یکسانی رو تقویت می‌کنی. Schema باید تمایز رو تقویت کنه، نه هموارش کنه.

۶. آدیت Schema

محتوا دائماً تغییر می‌کنه. Schema اغلب تغییر نمی‌کنه.

SEO کارها تمایل دارن داده‌های ساختاریافته رو هنگام راه‌اندازی پیاده‌سازی کنن و بعد فراموشش کنن. ولی اگه محتوای قابل مشاهده‌ات تغییر کرد، Schema ات هم باید اون تغییرات رو منعکس کنه.

💡 Schema drift چیه؟ یعنی وقتی Schema ات دیگه با محتوای واقعی صفحه مطابقت نداره. این می‌تونه باعث بشه گوگل اطلاعات غلط رو نمایش بده یا اصلاً rich snippet ات رو از بین ببره.

نمونه‌های رایج schema drift:

Schema نقد و بررسی در حالی که ثابت می‌مونه نظرات صفحه تغییر می‌کنن
Schema سازمان یا LocalBusiness آدرس قدیمی رو نشون می‌ده
Schema محصول قیمت‌گذاری قدیمی یا وضعیت موجودی نادرست رو نشون می‌ده
Schema Breadcrumb با ساختار به‌روزشده‌ی سایتت مطابقت نداره

داده‌های ساختاریافته باید واقعیت رو آینه‌وار نشون بده. Schema رو مثل بدهی فنی ببین. هر سه ماه یه بار آدیتش کن.

۷. Schema و پنل‌های دانش

Schema اغلب به عنوان یه تاکتیک CTR برای نتایج غنی (Rich Results) استفاده می‌شه. ولی schema می‌تونه از وضوح موجودیت هم حمایت کنه، که می‌تونه به Knowledge Panel منجر بشه.

💡 Knowledge Panel چیه؟ اون باکس اطلاعاتیه که وقتی اسم یه برند، شخص یا مکان معروف رو سرچ می‌کنی، در سمت راست نتایج گوگل ظاهر می‌شه. داشتنش یعنی گوگل شما رو به عنوان یه موجودیت واقعی شناخته.

مهم: Schema به تنهایی یه Knowledge Panel ایجاد نمی‌کنه. این یه پایه‌ست، نه کل سیستم.

همونطور که Jason از Kalicube توضیح می‌ده: «Schema Markup به تنهایی کافی نیست. گوگل به یه توضیح واضح از اینکه شما چه کسی هستید و چه کاری انجام می‌دید در قالب متن نیاز داره. نیاز داره این اطلاعات در منابع معتبر و مرتبط متعدد در سراسر وب تأیید بشه و Entity Home شما رو شناسایی کنه.»

Schema هویت رو تقویت می‌کنه. ولی ادغام موجودیت نیاز به توضیحات متنی یکپارچه، تأیید خارجی، و یه Entity Home کاملاً تعریف‌شده داره.

💡 Entity Home چیه؟ صفحه‌ایه که گوگل اون رو به عنوان منبع اصلی اطلاعات درباره‌ی موجودیت شما در نظر می‌گیره (معمولاً صفحه‌ی “درباره ما” یا صفحه‌ی اصلی سایت).

۸. نقشه‌برداری ریدایرکت

همه می‌دونن چرا ریدایرکت‌ها مهمن و چطور راه‌اندازی‌شون کنن. ولی آیا ریدایرکت‌های سایتت رو ردیابی می‌کنی؟

بدون حاکمیت، سایت‌ها آروم‌آروم انباشته می‌شن از:

زنجیره‌های ریدایرکت
حلقه‌های ریدایرکت
قوانین ریدایرکت متضاد در سراسر CMS و سرور

💡 زنجیره ریدایرکت چیه؟ وقتی URL A به URL B ریدایرکت می‌شه، URL B به URL C، و URL C به URL D. هر ریدایرکت اضافه یعنی یه درخواست HTTP اضافه، یعنی کند شدن سایت و هدر رفتن Crawl Budget.

اینجاست که خطاهای «تعداد ریدایرکت زیاد» و ناکارآمدی‌های کرال رو می‌بینی.

ساده‌ترین راه‌حل همونیه که بیشتر نادیده گرفته می‌شه: یه نقشه‌ی ریدایرکت مشترک نگه دار.

هر ریدایرکت رو در یه Google Sheet مستند کن که شامل اینا باشه:

URL مبدأ
URL مقصد
تاریخ اضافه شدن
دلیل ریدایرکت
مالک

هر بار که کسی یه ریدایرکت جدید اضافه می‌کنه، ابتدا باید این شیت رو چک کنه تا از تضادها یا زنجیره‌ها جلوگیری کنه. این شیت باید بین سئوکارها، توسعه‌دهنده‌ها، و کلاینت‌ها به اشتراک گذاشته بشه.

۹. فضاهای بی‌نهایت

یه «فضای بی‌نهایت» چیزیه که گوگل بهش می‌گه یعنی تعداد زیادی URL که محتوای جدید کم یا بدون محتوایی ارائه می‌دن. کرال کردن اون‌ها پهنای باند رو هدر می‌ده و می‌تونه مانع از ایندکس کامل محتوای واقعی توسط Googlebot بشه.

💡 Crawl Budget چیه؟ هر سایت یه بودجه‌ی محدود کرال از گوگل داره. یعنی تعداد صفحاتی که گوگل در یه بازه‌ی زمانی حاضره کرال کنه. اگه این بودجه رو با صفحات بی‌ارزش هدر بدی، صفحات مهمت ممکنه کرال نشن.

روی سایت‌های بزرگ، این ریسک سریع بالا می‌ره. فضاهای بی‌نهایت می‌تونن ایندکس رو با واریانت‌های کم‌کیفیت پر کنن و منابع کرال رو هدر بدن.

علل رایج فضاهای بی‌نهایت:

URL های تولیدشده خودکار بر اساس نتایج جستجوی سایت
فیلتر کردن افزودنی آیتم‌ها
پارامترهای بی‌ربط (پارامترهای ارجاع، پارامترهای مرتب‌سازی خرید، Session ID ها)
مشکلات تقویم
لینک‌های نسبی شکسته

این مشکلات اغلب نادیده گرفته می‌شن چون چیزی «خراب» نمی‌شه. سایت هنوز لود می‌شه ولی کارایی کرال آروم‌آروم خراب می‌شه.

چطور فضاهای بی‌نهایت رو رفع کنیم: ۱. تا جایی که ممکنه URL های مشکل‌دار رو de-index کن ۲. با تغییر اونچه که URL ها رو تولید می‌کنه از تکرار جلوگیری کن ۳. به صورت استراتژیک از robots.txt استفاده کن، ولی نه خیلی زود

نکته حرفه‌ای مهم: اگه برنامه داری با noindex یا خطاهای ۴۱۰/۴۰۴ de-index کنی، ابتدا کرال رو مسدود نکن. اگه Googlebot نتونه صفحات رو کرال کنه، noindex یا کد پاسخ رو نمی‌بینه. بذار گوگل اون‌ها رو کرال کنه تا بتونه حذفشون کنه. بعداً در صورت نیاز مسدود کن.

۱۰. تنظیم نادرست تگ canonical برای صفحه‌بندی و پارامترهای مرتب‌سازی

صفحه‌بندی در چند فرم وجود داره:

Pagination: جایی که کاربر می‌تونه از لینک‌های «بعدی»، «قبلی» و شماره صفحات برای ناوبری بین صفحاتی که یک مجموعه از نتایج رو نمایش می‌دن استفاده کنه
Load More: دکمه‌هایی که مجموعه اولیه نتایج نمایش داده شده رو گسترش می‌دن
Infinite Scroll: جایی که اسکرول بارگذاری محتوای اضافی رو فعال می‌کنه

Canonicals اغلب وقتی پارامترهایی مثل فیلترهای مرتب‌سازی معرفی می‌شن خراب می‌شن.

وقتی درست انجام نشه، صفحه‌بندی می‌تونه:

equity صفحه رو له کنه
ایندکساسیون رو گیج کنه
سیگنال‌های تکراری ایجاد کنه
مسیرهای کرال رو خراب کنه

💡 قانون مهم برای pagination: هر صفحه در دنقه باید canonical به خودش اشاره کنه (self-referencing)، نه به صفحه‌ی اول. یعنی canonical صفحه‌ی ۳ باید به صفحه‌ی ۳ اشاره کنه، نه صفحه‌ی ۱. این یه اشتباه رایجه!

تنظیم درست canonical برای صفحات بدون مرتب‌سازی:

صفحه اول: canonical = خودش (بدون پارامتر)، rel next = صفحه ۲
صفحه ۲: rel prev = صفحه ۱، rel next = صفحه ۳، canonical = خودش (با پارامتر ?page=2)
صفحه آخر: rel prev = صفحه قبل، بدون rel next، canonical = خودش

تنظیم درست canonical برای pagination با مرتب‌سازی: در این حالت پارامتر مرتب‌سازی (مثل ?price=high) وارد می‌شه. نکته‌ی کلیدی:

canonical نباید پارامترهای مرتب‌سازی/فیلتر رو شامل بشه
rel prev/next باید پارامترهای مرتب‌سازی/فیلتر رو شامل بشه

این تضمین می‌کنه:

توالی کرال درست
سیگنال‌های رتبه‌بندی کنترل‌شده
وضوح پارامتر

۱۱. ایندکس نشدن محتوای جدید

انتشار پایان خط نیست. ایندکساسیون پایان خطه. وقتی صفحات جدید منتشر می‌کنی، آیا تأیید می‌کنی که واقعاً ایندکس می‌شن؟

Sitemaps و ابزار بررسی URL در Google Search Console با Discovery کمک می‌کنن، ولی ایندکساسیون رو تضمین نمی‌کنن.

گوگل در ایندکس کردن انتخابی‌تر شده. صفحاتی که چند سال پیش به طور خودکار ایندکس می‌شدن، الان اغلب بیشتر طول می‌کشن یا اصلاً ایندکس نمی‌شن.

💡 چرا گوگل انتخابی‌تر شده؟ چون حجم محتوای وب به‌شدت افزایش پیدا کرده. به خصوص با رشد AI content generation. گوگل ترجیح می‌ده محتوایی رو ایندکس کنه که واقعاً ارزش داره. اگه E-E-A-T سایتت قوی نباشه، ایندکس شدن سخت‌تر می‌شه.

اگه صفحات ایندکس نمی‌شن، سعی کن برجستگی‌شون رو افزایش بدی. اگه این هم کار نکرد، مشکل ممکنه کیفیت و تمایز باشه. تقویت سیگنال‌های E-E-A-T می‌تونه کمک کنه.

نکته حرفه‌ای: اگه بعضی صفحات ایندکس نمی‌شن، اضافه کردن لینک به اون‌ها از ناوبری اصلی می‌تونه کمک کنه. به نظر می‌رسه به گوگل سیگنال می‌ده که این صفحات مهم‌ترن.

۱۲. ایندکس شدن سایت‌های Staging

سایت‌های Staging به اشتباه در نتایج موتورهای جستجو ایندکس می‌شن. خیلی بیشتر از چیزی که فکر می‌کنی.

یه سایت Staging معمولاً یه کپی توسعه از وبسایتته که برای تست تغییرات استفاده می‌شه. اگه درست پیکربندی نشه، ممکنه به موتورهای جستجو نگه که بیرون بمونن.

💡 چرا این مهمه؟ تصور کن گوگل نسخه‌ی ناقص یا آزمایشی محتوایت رو ایندکس کنه. هم محتوای تکراری ایجاد می‌کنه، هم رتبه‌هات رو تضعیف می‌کنه، هم ممکنه اطلاعات ناقص یا غلط به کاربران نشون داده بشه.

این می‌تونه منجر بشه به:

محتوای تکراری
کاهش رتبه‌بندی موتور جستجو
سردرگمی درباره‌ی اینکه کدام نسخه باید رتبه‌بندی بشه

گوگل رو جستجو کن و می‌بینی این چقدر رایجه:

site:staging.*.com
site:.kinsta.cloud
site:wpenginepowered.com

اگه سایت staging ات ایندکس شده، مشکلیه که باید بهش رسیدگی کنی.

تمام محیط‌های Staging باید قبل از آنلاین شدن روی noindex تنظیم بشن و از کرال شدن محافظت بشن.

۱۳. ایندکس شدن صفحات تبدیل و تشکر

صفحات «تشکر» و صفحات تبدیل بیشتر از اونچه تیم‌ها فکر می‌کنن در SERPها ایندکس می‌شن. بعضی از tracking تبدیل بر اساس بازدید از صفحه‌ی تشکر هستن (نه همه‌ی tracking ها، ولی تنظیمات رایج). GA4 این رو با ساختن یه event از page_view آسون می‌کنه.

اگه این صفحات قابل ایندکس باشن:

کاربران می‌تونن مستقیم از جستجو روشون برسن
تبدیل‌ها به طور مصنوعی تورم پیدا می‌کنن
Attribution غیرقابل اعتماد می‌شه

💡 مثال عملی: یه کاربر خریدش رو کامل می‌کنه و روی /order-confirmation/ می‌رسه. این page_view یه تبدیل در GA4 رو trigger می‌کنه. ولی اگه کسی دیگه‌ای این صفحه رو در نتایج گوگل پیدا کنه و مستقیم برسه، analytics هنوزش به عنوان تبدیل حساب می‌کنه. یه تبدیل جعلی!

می‌تونی چقدر رایجه این خطا رو چک کنی:

site:.com/thank-you/
site:.com/order-confirmation/

راه‌حل:

noindex اضافه کن
این صفحات رو از sitemap حذف کن
بهشون لینک عمومی نده

اگه تبدیل‌ها رو از طریق page view صفحه‌ی تشکر ردیابی می‌کنی، این صفحات هرگز نباید قابل ایندکس باشن.

۱۴. واریانت‌های URL و نرمال‌سازی

این یه مشکل رایج تکنیکال هست که تیم‌ها هنوز توش اشتباه می‌کنن:

www در مقابل بدون www
http در مقابل https
اسلش انتهایی در مقابل بدون اسلش انتهایی

گوگل تنظیم Preferred Domain رو حذف کرد، و الان باید دامنه‌ی ترجیحیت رو از طریق تگ‌های canonical، سایت‌مپ‌های XML، و ریدایرکت‌ها منتقل کنی.

برای یه مسیر تنها مثل /services می‌تونه اینا به نظر برسه:

http://domain.com/services
http://www.domain.com/services
https://domain.com/services
https://www.domain.com/services
http://domain.com/services/
http://www.domain.com/services/
https://domain.com/services/
https://www.domain.com/services/

💡 چرا ۸ نسخه از یه صفحه مشکل‌سازه؟ از دید گوگل این‌ها می‌تونن ۸ صفحه‌ی متفاوت باشن. یعنی بک‌لینک‌هایی که سایت‌های مختلف بهت داده‌ان ممکنه به نسخه‌های مختلف اشاره کنن. authority ات تقسیم می‌شه به جای اینکه جمع بشه.

اگه اینا رو مدیریت نکنی، می‌تونه ایجاد کنه:

لینک‌های داخلی که به چند نسخه از یه صفحه اشاره می‌کنن
تقسیم شدن اعتبار بک‌لینک در بین واریانت‌ها
سیگنال‌های محتوای تکراری
زنجیره‌های ریدایرکت که بودجه‌ی کرال رو هدر می‌دن و کاربران رو کند می‌کنن

چطور واریانت‌های URL رو رفع کنیم:

اول، استاندارد ترجیحیت رو تصمیم بگیر:

HTTPS (اجباری)
www یا بدون www (یکی رو انتخاب کن)
اسلش انتهایی یا بدون اسلش انتهایی (یکی رو انتخاب کن)

بعد، این رو اجرا کن:

۱. تگ‌های canonical باید با نسخه‌ی ترجیحی مطابقت داشته باشن

۲. URL های سایت‌مپ XML باید با نسخه‌ی ترجیحی مطابقت داشته باشن

۳. هر واریانت دیگه باید مستقیماً به نسخه‌ی ترجیحی ۳۰۱ ریدایرکت بشه

این بخشیه که تیم‌ها بیشتر اشتباه می‌کنن. ریدایرکت‌ها باید مستقیم باشن (بدون زنجیره)، و هر واریانت باید در یه URL canonical جمع بشه.

نکته حرفه‌ای: اگه می‌خوای میانبری برای تولید قوانین ریدایرکت داشته باشی، ابزار Aleyda Solis می‌تونه این فرآیند رو سرعت ببخشه.

قبل از مقیاس‌بندی زیرساخت تکنیکال رو محکم کن

تکنیکال پیشرفته درباره‌ی تاکتیک‌های جدید نیست، بلکه درباره‌ی حذف اصطکاک ساختاریه.

قبل از مقیاس‌بندی محتوا یا سرمایه‌گذاری در لینک‌سازی، آدیت کن:

خطاها و هدررفت کرال
منطق Canonical
برابری رندرینگ
تمایز قالب
وضوح موجودیت

💡 جمع‌بندی نهایی: هیچ‌کدام از این ۱۴ مورد به تنهایی سایت رو نابود نمی‌کنه. ولی وقتی با هم جمع می‌شن، می‌تونن به یه سقف نامرئی تبدیل بشن که مانع رشد سایتت می‌شه. بهترین رویکرد اینه که هر سه ماه یه بار یه آدیت سیستماتیک از این موارد داشته باشی.

ناکارآمدی‌های پنهان رو اول رفع کن. اون‌ها معمولاً همونایی هستن که عقبت نگه داشتن.

بله، ولی اولویت‌ها فرق می‌کنن. سایت‌های بزرگ بیشتر درگیر مشکلاتی مثل فضاهای بی‌نهایت، صفحات قالبی تکراری، و زنجیره‌های ریدایرکت پیچیده هستن. ولی سایت‌های کوچک اغلب با مشکلات ساده‌تری دست و پنجه نرم می‌کنن که تأثیر بزرگ‌تری دارن — مثل ایندکس شدن سایت staging، نرمال‌سازی نشدن URL ها، یا Schema ای که ماه‌هاست به‌روز نشده. در واقع روی سایت‌های کوچک این اشتباهات سریع‌تر به چشم گوگل میان، چون صفحات کمتری دارن که خطاها رو «پنهان» کنن.

سوالات متداول

۱. آیا تکنیکال برای سایت‌های کوچک هم به همین اندازه مهمه؟

›

بله، ولی اولویت‌ها فرق می‌کنن. سایت‌های بزرگ بیشتر درگیر مشکلاتی مثل فضاهای بی‌نهایت، صفحات قالبی تکراری، و زنجیره‌های ریدایرکت پیچیده هستن. ولی سایت‌های کوچک اغلب با مشکلات ساده‌تری دست و پنجه نرم می‌کنن که تأثیر بزرگ‌تری دارن. مثل ایندکس شدن سایت staging، نرمال‌سازی نشدن URL ها، یا Schema ای که ماه‌هاست به‌روز نشده. در واقع روی سایت‌های کوچک این اشتباهات سریع‌تر به چشم گوگل میان، چون صفحات کمتری دارن که خطاها رو «پنهان» کنن.

۲. از کجا بفهمم کرالرهای هوش مصنوعی به سایتم دسترسی دارن یا نه؟

›

بهترین راه اینه که لاگ‌های سرورت رو بررسی کنی. User Agent هایی مثل GPTBot، ClaudeBot، PerplexityBot، و Applebot-Extended رو دنبال بگرد. اگه اصلاً درخواستی از این ربات‌ها نمی‌بینی، احتمالاً یا در robots.txt بلاک شدن یا محتوای اصلیت داخل جاوااسکریپت هست که اون‌ها نمی‌تونن ببیننش. علاوه بر این، مطمئن شو که در robots.txt هیچ Disallow کلی برای * تعریف نشده که ناخواسته این ربات‌ها رو هم شامل بشه.

۳. چند بار در سال باید یه آدیت کامل تکنیکال انجام بدم؟

›

یه آدیت جامع هر سه ماه یه بار ایده‌آله. مخصوصاً برای Schema، ریدایرکت‌ها، و وضعیت ایندکساسیون. ولی بعضی چیزها نیاز به مانیتورینگ مداوم دارن، نه فصلی. مثلاً هر بار که یه صفحه‌ی جدید منتشر می‌کنی باید ایندکس شدنش رو چک کنی، یا هر بار که یه ریدایرکت اضافه می‌شه باید توی نقشه‌ی ریدایرکت ثبت بشه. قانون کلی: هر چیزی که می‌تونه «بی‌سروصدا» خراب بشه، باید روتین بررسی داشته باشه.

۴. آیا استفاده از هوش مصنوعی برای تولید محتوا روی تکنیکال تأثیر منفی داره؟

›

مستقیماً نه ولی غیرمستقیم بله. محتوای تولیدشده با AI اگه کنترل نشه، اغلب صفحات تقریباً یکسانی تولید می‌کنه که گوگل نمی‌تونه بینشون تفاوت بذاره. این مشکل تکنیکال نیست، مشکل کیفیت و تمایزه. از طرفی، حجم بالای محتوای AI باعث شده گوگل در ایندکس کردن محتاط‌تر بشه. پس اگه از AI برای تولید محتوا استفاده می‌کنی، باید روی E-E-A-T و تمایز بیشتری سرمایه‌گذاری کنی تا گوگل صفحاتت رو ارزشمند تشخیص بده.

۵. وقتی صفحات مهم سایتم ایندکس نمی‌شن، اولین جایی که باید چک کنم کجاست؟

›

یه چک‌لیست سه مرحله‌ای سریع داری: اول، URL رو در Google Search Console با ابزار «بررسی URL» چک کن و ببین گوگل چه دلیلی برای عدم ایندکس دادن. دوم، مطمئن شو که صفحه حداقل یه لینک داخلی از یه صفحه‌ی دیگه‌ی سایت داره. صفحات کاملاً ایزوله معمولاً ایندکس نمی‌شن. سوم، محتوای صفحه رو با نگاه انتقادی بررسی کن: آیا چیزی می‌گه که گوگل جای دیگه‌ای پیدا نمی‌کنه؟ اگه جواب نه‌ست، مشکل فنی نیست. مشکل ارزش محتواست.

منبع

تعداد بازدیدها: 6

بلاگ