בשעת מעבר - רגל אחת או שתיים? One foot or two

בעקבות פנייה של אחד הלקוחות בצענו בחינה בסוגיה של מעבר חדר מחשב.
לקוח עובד כיום בשני אתרים – ראשי + DRP. הלקוח מתכנן להעביר את האתר הראשי ממקום אחד למיקום שני.
הסוגיה היא – עד כמה מסוכן להעביר את האחסון במשאיות מאתר אחד לאתר השני כשבזמן ההעברה אתר ה- DR עובד כאתר ראשי (ללא רפליקציה)? או שאולי שווה להתאמץ ורכוש אחסון חדש לאתר החדש ולבצע את ההעברה ברפליקציה? האם האלטרנטיבה הראשונה מסוכנת באופן בלתי סביר? מדובר על ארגון פיננסי שעובד (במידה מופחתת) בלילות.




בגדול התגובות שקיבלנו מתחלקות פחות או יותר באופן שווה. מדובר בסקר מדגמי ולא סטטסטי.
כ- 50% מהלקוחות מוכן לקחת סיכון ולהעביר את האחסון כשהמשמעות היא שבזמן זה רק אתר ה- DR פעיל (במידה וצריך אותו).
כ- 50% מהלקוחות לא מוכן לקחת סיכון ומבחינתו "תמיד נמצאים עם 2 רגליים על הקרקע" כלומר תמיד יש שכפול של נתונים בשני אתרים. המשמעות היא שיש לרכוש אחסון נוסף לעותק שלישי.

יש לציין שחלק מהלקוחות שאמרו שכן מוכנים לקחת סיכון אמרו שיבחרו לעשות זאת רק כשאין ברירה ממש.





אולם כאשר מסתכלים על הלקוחות מהמגזר הפיננסי, כאן בולטת המגמה לחייב הימצאותו של אתר נוסף:







אחת התגובות המעניינות דיברה על אפשרות לשכור אחסון מהיצרן. והמוצר הועמד בהשכרה על פי חודשים כשהמחיר מתחיל מעלות של 50% מערך הציוד (כולל רישוי) לכ-9 חודשי השאלה וככל שעובר הזמן זה עובר למתווה של רכש – כלומר: לאחר 9 חודשים עומדת בפנינו האפשרות להמשיך ולשכור חודשית ולאחר 15 חודש אנו מוסיפים סכום מסוים (אם נרצה) והציוד הופך להיות שלנו – מעין ליסינג.
כלומר במידה ועומדים במעבר של 9 חודשים (במקרה זה ) התשלום הוא 50% מרכש המארז. בהחלט חסכון משמעותי.

אופציה אחרת שהוצעה היא של מצב ביניים – יתכן ואפשר לממש העברה בחלקים ע"י רכש חלקי של מערך אחסון שיהווה יעד באתר החדש ובתהליך מתגלגל לפנות את האתר הראשי הישן. ואכן אחד הארגונים תאר מעבר בקונספט כזה: בתחום הOPEN נרכש מארז אחד חדש ששימש כbuffer להגירה. לקח יותר זמן ויותר העברות, אבל מנע את הצורך בהעברה פיזית של המארזים.
לכל אורך ההגירה שמרנו על שיכפול של הנתונים.

לגבי ארגונים שלא מוכנים לקחת סיכון של "השענות" על רגל אחת, דובר על כך שלהבנתם אין לקחת את הסיכון הזה. אם מכמתים אותו – במקרה הגרוע יכול להיות אובדן של כל החומר (נניח תאונה). הבאת מארז חדש תקח תקופה לא קצרה, לא בטוח שיהיה תואם לשרתים ועד אז תקועים בלי גיבוי ובלי שרידות.
הערה נוספת- נניח שלארגון יש חלון השבתה אפילו של יומיים. האם במקרה כזה כן ניתן להעביר את אתר הראשי ממיקום אחד לשני?  מצד אחד לא אמורים לגעת במידע זמן חלון ההשבתה. אולם מצד שני אם יש תקלה חמורה – איבוד מידע במשאיות שמעבירות את הציוד – האם תוך יומיים ניתן יהיה לבנות סביבת אחסון חדשה באתר החדש?!

כאשר בכל זאת דיברו על הסתמכות על אתר DR בלבד דובר על:
  • הארגון שלי עשה את אותו הדבר בדיוק (רק ההפך). העברנו את אתר ה-DR ועבדנו בלי רפליקציה.
  • IBM ניהלו את הפרויקט ודאגו לניהול סיכונים מאוד מפורט עם פתרונות יצירתיים במקרה של תקלה.
  • ארגון נוסף נתן המלצות לפני ביצוע תהליך כזה – שבוצע אצלהם בפועל:
  • יש לבצע רפליקציה מלאה מהאתר הראשי לאתר המשני.
  • יש לוודא הגעת מומחי אחסון (של היצרן) ע"מ לבצע כיבוי מסודר ,ופיקוח על פרוק הציוד.
  • הזמנת חברת הובלה אשר מתמחה בהובלת חדר מחשב ו\או מערכי אחסון
  • התקנת הציוד מחדש וביצוע בדיקות באתר הראשי (החדש)
  • ביצוע רפליקציה הפוכה ( משני לראשי חדש)
  • ביצוע בדיקות
  • ארגון נוסף המליץ שלא להעביר את כל המערכות במשאית אחת ולחלק מערכות האחסון במספר רכבים או מספר העברות.
  • פידבק נוסף - לגבי עבודת אתר ה-DR - זה צריך לראות עד כמה הוא מוכן? האם הם עושים תרגילי DRP? האם הם מנטרים כשירות DRP? האם יש מספיק capacity וקו תקשורת קיימים ומספקים לעבודה מאתר ה-DR? האם יש דברים שמראש ידוע שלא יעבדו מה-DR? הכי חשוב לעשות תרגילים אמיתיים של DR, כך ידעו הכי טוב מה עובד ומה לא.
  • לגבי העברת מדפים במשאית (tender-processing) - עשינו את זה כמה וכמה פעמים, בהצלחה רבה. וגם עדיף לבקש מהספק לשנע את החומרה שלו, כך שגם יקחו אחריות. אבל אני לא הייתי חושש מזה יותר מידי.
לסיכום, ההמלצה של STKI היא לפעול בתצורה של "שתי רגליים על הקרקע" למערכות הקריטיות גם בשעת מעבר בין מתקנים. עם זאת יש לקוחות שכנראה מחוסר תקציב בוחרים להסתמך על "רגל אחת" בלבד בשעת המעבר.

אין תגובות: