در سالهای اخیر، قطعی یا اختلال اینترنت بینالملل بارها نشان داده است که همه کسبوکارها به یک اندازه تحت تأثیر قرار نمیگیرند. در حالی که برخی وبسایتها، سامانههای آنلاین و سرویسهای سازمانی تنها چند دقیقه با اختلال مواجه میشوند، برخی دیگر حتی برای چند ساعت یا چند روز از دسترس خارج میشوند. این تفاوت معمولاً به نوع فعالیت کسبوکار مربوط نیست، بلکه ریشه آن را باید در پایداری زیرساخت اینترنت جستوجو کرد.

امروزه زیرساخت فناوری اطلاعات تنها به خرید یک سرور یا استفاده از اینترنت پرسرعت محدود نمیشود. محل میزبانی سرویسها، معماری شبکه، مسیرهای ارتباطی، طراحی مراکز داده و نحوه مدیریت ترافیک، همگی تعیین میکنند که یک سازمان در شرایط بحرانی تا چه اندازه قادر به ادامه فعالیت خواهد بود.
در ادامه بررسی میکنیم چرا برخی کسبوکارها در زمان قطعی اینترنت بینالملل تقریباً بدون وقفه به فعالیت خود ادامه دادند، دیتاسنترها چه نقشی در این شرایط دارند و برای افزایش تابآوری زیرساخت چه اقداماتی باید انجام شود.
چرا بعضی کسبوکارها حتی یک ساعت هم از دسترس خارج نشدند؟
قطعی اینترنت معمولاً اولین چیزی نیست که باعث از کار افتادن یک سرویس میشود. بسیاری از مشکلات زمانی آغاز میشوند که زیرساخت یک سازمان برای چنین شرایطی طراحی نشده باشد.
کسبوکارهایی که از ابتدا معماری مناسبی برای سرویسهای خود در نظر گرفتهاند، معمولاً وابستگی کمتری به یک مسیر ارتباطی یا یک ارائهدهنده اینترنت دارند. در چنین شرایطی، حتی اگر ارتباط با اینترنت بینالملل محدود شود، بخش قابل توجهی از خدمات داخلی همچنان قابل استفاده باقی میماند.
یکی از مهمترین عوامل در این زمینه، استفاده از زیرساختی است که بتواند ارتباط میان کاربران، سرورها و منابع اطلاعاتی را با حداقل وابستگی به نقاط آسیبپذیر حفظ کند. همچنین طراحی صحیح شبکه داخلی، استفاده از تجهیزات استاندارد و پیشبینی سناریوهای بحران باعث میشود اختلالات با سرعت بیشتری مدیریت شوند.
از سوی دیگر، بسیاری از سازمانها طی سالهای اخیر بخشی از سرویسهای خود را بهگونهای توسعه دادهاند که در صورت بروز اختلال، امکان ادامه فعالیت حداقل برای کاربران داخلی فراهم باشد. این رویکرد میزان توقف خدمات را به شکل محسوسی کاهش میدهد.

نقش دیتاسنتر در زمان بحران چیست؟
یکی از مهمترین عوامل تأثیرگذار بر پایداری زیرساخت اینترنت، محل استقرار تجهیزات و کیفیت دیتاسنتری است که سرویسها در آن میزبانی میشوند.
دیتاسنتر تنها محلی برای نگهداری سرورها نیست. یک مرکز داده استاندارد مجموعهای از زیرساختهای ارتباطی، سامانههای برق اضطراری، سیستمهای سرمایش، تجهیزات امنیتی و مسیرهای ارتباطی متعدد را در اختیار کسبوکارها قرار میدهد. این امکانات باعث میشوند حتی در شرایط بحرانی نیز احتمال از دسترس خارج شدن سرویسها کاهش پیدا کند.
برای مثال، اگر یک دیتاسنتر به چندین اپراتور ارتباطی متصل باشد، قطع شدن یکی از مسیرها الزاماً به معنای قطع کامل ارتباط نخواهد بود. همچنین وجود تجهیزات پشتیبان، برق بدون وقفه (UPS)، ژنراتورهای اضطراری و سامانههای مانیتورینگ دائمی، امکان ادامه فعالیت سرویسها را در شرایط مختلف فراهم میکند.
عامل مهم دیگر، موقعیت جغرافیایی و طراحی شبکه مرکز داده است. هرچه مسیرهای ارتباطی متنوعتر و تجهیزات شبکه مقاومتر باشند، احتمال بروز اختلال گسترده کاهش پیدا میکند.
به همین دلیل، انتخاب محل مناسب برای میزبانی سرویسهای سازمانی تنها یک تصمیم فنی نیست؛ بلکه بخشی از راهبرد مدیریت ریسک محسوب میشود.

پایداری زیرساخت اینترنت فقط به اینترنت وابسته نیست
یکی از برداشتهای نادرست این است که کیفیت سرویس تنها به سرعت اینترنت بستگی دارد. در عمل، عوامل متعددی در تابآوری زیرساخت نقش دارند که گاهی اهمیت بیشتری نسبت به پهنای باند دارند.
از جمله این عوامل میتوان به موارد زیر اشاره کرد:
- معماری مناسب شبکه
- استفاده از تجهیزات استاندارد
- مسیرهای ارتباطی جایگزین
- سامانههای ذخیرهسازی و پشتیبانگیری
- مانیتورینگ مداوم زیرساخت
- مدیریت صحیح ترافیک شبکه
- برنامهریزی برای بازیابی خدمات پس از بحران
اگر هر یک از این بخشها به درستی طراحی نشده باشند، حتی یک اختلال محدود نیز میتواند باعث توقف کامل سرویسها شود.
در مقابل، سازمانهایی که از ابتدا زیرساخت خود را بر اساس اصول تابآوری طراحی کردهاند، معمولاً در مواجهه با بحران عملکرد پایدارتری دارند.
برای جلوگیری از تکرار این اتفاق چه باید کرد؟
هیچ زیرساختی نمیتواند احتمال وقوع اختلال را به صفر برساند، اما میتوان اثر آن را تا حد زیادی کاهش داد.
اولین گام، ارزیابی دقیق وضعیت فعلی زیرساخت است. بسیاری از سازمانها تنها زمانی متوجه نقاط ضعف خود میشوند که سرویسهایشان از دسترس خارج شده است. بررسی دورهای تجهیزات، مسیرهای ارتباطی و سناریوهای بحران میتواند از بروز چنین مشکلاتی جلوگیری کند.
گام بعدی، حذف وابستگی به یک نقطه شکست (Single Point of Failure) است. اگر تمام سرویسها به یک لینک ارتباطی، یک سرور یا یک مسیر شبکه وابسته باشند، احتمال توقف کامل خدمات افزایش پیدا میکند. استفاده از تجهیزات افزونه و مسیرهای جایگزین، ریسک از کار افتادن سرویسها را کاهش میدهد.
تهیه نسخههای پشتیبان از دادهها نیز بخش مهمی از این فرآیند است. پشتیبانگیری منظم، امکان بازیابی سریع اطلاعات و ادامه فعالیت سازمان را در شرایط بحرانی فراهم میکند.
همچنین استفاده از سامانههای مانیتورینگ هوشمند باعث میشود بسیاری از مشکلات پیش از آنکه به اختلال گسترده تبدیل شوند، شناسایی و برطرف شوند.
در نهایت، تدوین برنامه مدیریت بحران اهمیت زیادی دارد. این برنامه باید مشخص کند در صورت بروز اختلال، هر بخش از سازمان چه مسئولیتی بر عهده دارد، سرویسها چگونه بازیابی میشوند و اولویت راهاندازی مجدد کدام سامانههاست.
آینده زیرساختهای پایدار
با افزایش وابستگی کسبوکارها به خدمات آنلاین، اهمیت طراحی زیرساختهای مقاوم بیش از گذشته شده است. سازمانها دیگر تنها به دنبال افزایش سرعت یا ظرفیت شبکه نیستند، بلکه تلاش میکنند زیرساختی ایجاد کنند که در شرایط بحرانی نیز بتواند خدمات حیاتی را بدون وقفه ادامه دهد.
در این مسیر، استفاده از معماریهای توزیعشده، مراکز داده استاندارد، تجهیزات شبکه پیشرفته و سامانههای مانیتورینگ لحظهای، به بخش جداییناپذیر زیرساخت فناوری اطلاعات تبدیل شده است.
کسبوکارهایی که امروز برای افزایش تابآوری زیرساخت خود سرمایهگذاری میکنند، در آینده با ریسک کمتری در برابر اختلالات ارتباطی، قطعی اینترنت و سایر بحرانهای فناوری مواجه خواهند شد.
جمعبندی
تجربه قطعی اینترنت بینالملل نشان داد که تفاوت میان سازمانهای پایدار و آسیبپذیر، بیش از هر چیز به کیفیت زیرساخت آنها بازمیگردد. پایداری زیرساخت اینترنت نتیجه مجموعهای از تصمیمهای فنی و مدیریتی است؛ از انتخاب محل میزبانی سرویسها گرفته تا طراحی شبکه، استفاده از تجهیزات استاندارد، مسیرهای ارتباطی جایگزین و برنامهریزی برای مدیریت بحران.
هرچه این زیرساختها با نگاه بلندمدت و بر اساس اصول تابآوری طراحی شوند، احتمال توقف خدمات در شرایط بحرانی کاهش پیدا میکند. به همین دلیل، سرمایهگذاری روی زیرساخت تنها یک هزینه فنی نیست، بلکه بخشی از راهبرد حفظ تداوم کسبوکار و ارائه خدمات پایدار به کاربران محسوب میشود.