211652_close_icon
views-count2162 դիտում article-date 19:36 13-10-2014

Մի քանի խոսք տվյալների վերականգնման ռազամավարության պլանավորման մասին (backup)

Մի պահ կտրվեք ամեն ինչից և պաստասխանեք հետևյալ հարցին՝ որքա՞ն ծայրահեղ հետևանքներ կունենար Ձեր նախագծի աշխատանքի դադարը 1 րոպեով: Պատասխանեցի՞ք: Կարծում եմ, որ ձեզանից եթե ոչ բոլորը, ապա մեծամասնությունը մտածեցին՝ խնդիր չէ: Իսկ հիմա պատասխանեք՝ որքա՞ն ծայրահեղ կլիներ աշխատանքի 5 րոպե դադարը, իսկ 30՞, 1 ժա՞մ, օրե՞ր: Մի պահ կմտածեք. «Ոչ, դա արդեն բավականին շատ կլինի»: Հենց նոր Դուք տվեցիք ՏՏ նախագծի անդադար աշխատանքի ապահովման պլանի կազմման անհրաժեշտ պարամետրերից մեկը: Իսկ թե ինչ է դա իրենից ներկայացնում, ընթերցեք ներքևում: [img]/ups/images/0939934001413214538575126.jpg[/img] Ամեն ինչ վաղ թե ուշ շարքից դուրս է գալիս: Մենք՝ MAXARTS ընկերությունը լինելով անհատական սերվերների տրամադրման մատակարար, կանոնավոր կերպով հետևում ենք, թե ինչպես են տարբեր օգտատերեր լուծում իրենց ծառայությունների աշխատունակության և վերականգնման ապահովման հետ կապված խնդիրները: Եվ մենք եկանք տխուր եզրահանգման՝ չնայայած այն հանգամանքին, թե որքան է խոսվել տվյալների և սարքավորումների պահուստավորման մասին, որոշ ռեսուրսներ դեռևս չունեն վերականգնման մշակված ռազմավարություն: Երբ ինչ-որ բան է պատահում, նրանք ուղղակի սկսում են տանջվել, հայտնվում են խուճապի մեջ և երբեմն էլ մեղադրում են բոլորին ինչ-որ բանի համար: [img]/ups/images/0217396001413214559734423.jpg[/img] «Գործունեության անխափանության պլանավորումը որոշում է, թե որքան է կազմակերպությունը ենթարկվում ներքին և արտաքին սպառնալիքների, և առաջարկում է անհրաժեշտ սարքավորումային և ծրագրային գործիքներ, որոնք թույլ կտան ապահովել արդյունավետ հակահարված և կազմակերպության նորմալ գործարկման վերականգնում՝ պահպանելով մրցակցային առավելությունը և համակարգի ամբողջականությունը»: Այս տերմինը ի սկզբանե ներմուծվել էր ավելի «ծանր» դեպքերի համար՝ գրասենյակներում կամ տվյալների կենտրոններում աշխատանքի խափանում՝ առաջացած հրդեհների, բնական աղետների, երրորդ անձանց կողմից իրականացված հանցագործությունների և այլ պատճառներով, որոնք հաճախ ավելի հազվադեպ են պատահում, քան,օրինակ, երբ կոշտ սկավառակն է շարքից դուրս գալիս: Ստանդարտների բրիտանական ինստիտուտը անգամ թողարկել է հատուկ ստանդարտ՝ BS 25999՝ բիզնես գործընթացների անխափան ղեկավարման համար: Սակայն մենք այդքան չենք խորանա, այլ ուղղակի կփորձենք օգնել Ձեզ հասկանալու՝ ինչպես և որքան հիմնավորված է Ձեզ անհրաժեշտ պատրաստվել հնարավոր ընդհատումների: [img]/ups/images/0511592001413214575864972.png[/img] [b]Ի՞նչ եք Դուք պատրաստ կորցնել[/b] Ցանկացած գործունեություն կապված է որոշակի ռիսկերի հետ: Եվ որպեսզի գործունեությունը լինի հաջող, ռիսկերը չպետք է լինեն մի ինչ-որ ինքնուրույն բան, դրանց պետք է կառավարել: Ցանցում տեղակայված ՏՏ նախագծերի և սերվիսների համար կա բնորոշ ռիսկերի մի որոշակի փաթեթ, որոնք կարող են հանգեցնել նախագծի ժամանակավոր անհասանելիության, դրանցից յուրաքանչյուրին կարելի է բնութագրել մաթեմատիկական այնպիսի պարամետրերով, ինչպիսիք են առաջացման հավանականությունը, ազդեցության շարունակականությունը, գործողության մասնակի կամ ամբողջական հեռացումը: Արտակարգ դեպքերի պարագաներում կան երեք հիմնական պարամետրեր, որոնք կարող ենք կորչել՝ տվյալներ, ժամանակ, գումար: Ընթացիկ խնդիրներն, ինչպիսիք են համբավի կորուստ, կորցրած եկամուտ և այլ, ի վերջո կարելի է վերագրել վերոհիշյալ երեքին: Պարամետրերի միջև գոյություն ունի շատ նուրբ կապ: Օրինակ, որքան քիչ եք Դուք պատրաստ կորցնել ժամանակ և տվյալներ, այնքան շատ գումար պետք է ներդնեք տեղեկատվության և հզորության պահուստավորման համար: Նախքան առաջ անցնելը, Դուք, հուսով եմ՝ կարողացաք որոշել՝ որքան է ձեր նախագծի աշխատանքի դադարի առավելագույն թույլատրելի տևողությունը: Դիմադրության պլանավորման բառապաշարում այս պարամետրը կոչվում է վերականգնման նպատակային ժամանակահատված(recovery time objective, RTO): Սա այն ժամանակահատվածն է, որի ընթացքում պետք է վերականգնվի սերվիսի կամ բիզնես գործընթացի նորմալ գործարկումը՝ ծանր հետևանքներից խուսափելու համար: Իսկ թե Ձեզ համար ինչն է հանդիսանում ծանր հետևանք, Դուք դա ևս պետք է պարզեք: Երկրորդ կարևոր պարամետրը, որը Դուք պետք է գնահատեք պլանավորման ընթացքում, վերականգնման նպատակային կետն է (recovery time objective, RTO): Սա ևս ժամանակային դադար է: Այն բնորոշում է այն խելամիտ առավելագույն ժամանակահատվածը, որի ընթացքում ՏՏ ծառայության տվյլաները կարող են կորչել: Այս պարամետրը փոքր ինչ դժվար է բացատրել: Չի կարելի ուղղակի ասել, որ սա կորչելու ենթակա տվյալների թույլատրելի ծավալն է, չնայած զրոյական մոտեցման դեպքում նրան հենց այդպես էլ բնութագրում են: Կոպիտ ասած՝ սա մինչ վթարային կետ հասնելու վերջին պահուստային պատճենի ստեղծման ժամանակահատվածն է: Խոշոր ընկերություններում նպատակային ցուցիչները որոշում են հատուկ վերլուծաբանները, որոնք հետո խնդիրը ուղարկում են տեխնիկական ապահովման մասնագետների խմբին: Նրանք էլ իրենց հերթին որոշում են՝ որտեղ, ինչ և ինչ քանակությամբ պետք է պահպանել: Բայց եթե Ձեր նախագիծը կազմված է Ձեզնից, ծրագրավորողից կամ համակարգի ղեկավարից, ապա դա պատճառ չէ ասելու, որ այսպիսի վերլուծությունը Ձեզ համար չէ: Մեր գործունեության ընթացքում մեկ անգամ չէ, որ աշխատունակության և վերականգնման մշակված ռազմավարության բացակայության պատճառով մարդկանց մոտ առաջացել են խնդիրներ՝ սկսած որոնման համակարգերում անշարժ մնալուց մինչև որոշ ժամանակահատված անհասանելի լինելը, քանի որ բոլոր տվյալները պահվել էին մեկ սերվերում, և ոչ մի ընթացիկ գործառական վերարտադրություն չի եղել: [b]Ո՞վ է մեղավոր[/b] Նախ և առաջ նախագծի ղեկավարը և պատասխանատու մասնագետները: Մատակարարները անում են այն ամենը, ինչ կարող են՝ առավելագույն անխափան աշխատանքի համար, բայց գործնականում ցանկացած պայմանագրի մեջ գրվում է, որ մատակարարը ոչ մի պատասխանատվություն չի կրում ցանկացած ընդհատումների և տվյալների կորուստի համար: Նույնիսկ եթե հարբած ճարտարագետը անզգուշաբար սխալ սերվերի կարգավորումներ տա, ապա, ամենայն հավանականությամբ, Ձեզ անկեղծ ներողություններ լսելուց բացի ուրիշ ոչինչ չի մնում: Բացի դրանից, հիշեցնեմ տեսություննը՝ ցանկացած բան վաղ թե ուշ շարքից դուրս է գալիս: [u]Ձեր տվյալների ապահովությունը և աշխատունակությունը պետք է առաջին հերթին հուզի հենց Ձեզ: Հենց Դուք պետք է տաք հաջորդ հարցի պատասխանը:[/u] [b]Ի՞նչ անել[/b] Որքան հնարավոր է՝ սովորել ուրիշների սխալների վրա: Ժամանակակից տեղեկատվական տիրույթը հնարավորություն է տալիս վերլուծել շատ խափանումների պատճառներ և գնահատել Ձեր ծրագրի թույլ մասերը: Առաջինը, ինչ պետք է անել անխափան աշխատունակության պլանի կազմման ճանապարհին՝ ազատվել խաբկանքներից: Մեր գործունեության ընթացքում պատահել է դեպք, երբ օգտատերը ուղղակի արհհամարհել է պահուստավորում անելու անհրաժեշտությունը: Ղեկավարման վահանակում ավտոմատ պահուսավորումը չաշխատե՞ց՝ պետք էլ չէ: Նա անկեղծորեն հավատում էր, որ RAID 1 համակարգը նրան կփրկի և որքան էր նրա զարմանքը, երբ առաջին սկավառակը զգալիորեն քայքայվում էր, իսկ երկրորդի ֆայլերի աղյուսակում կային բազմաթիվ սխալներ: Առաջին սկավառակի փոփոխման և մասսիվի վերահավաքման փորձը ոչ մի դրական բանի չհանգեցրեց: Մեր մասնագետները ստիպված եղան լիովին շարքից դուրս գալու եզրին հայտնված սկավառակը վերադարձնել և դրանից բավականին երկար ժամանակահատվածում բայտ առ բայտ հանել տվյալները: Մեզ զարմացրեց փաստարկը, թե ինչու օգտատերը չի արել պահուստավորում. «Իմ վեց տարվա աշխատանքի ընթացքում նման բան դեռ չէր պատահել»: Փաստորեն՝ ինչքան շուտ է տվյալների մեծ կորուստ լինում, այնքան ավելի լավ նրա հետագա նախագծերի համար: Երկրորդ՝ որոշեք հավանական սպառնալիքները, դրանց հավանականությունը և ազդեցության տևողությունը: Ինչքա՞ն ժամանակ կպահանջվի DDoS-ի դեմ պայքարի ֆիլտրացիայի սերվիսին կապվելու համար: Ինչքա՞ն ժամանակ կպահանջվի սկավառակի կամ ամբողջական սերվերի փոփոխման համար: Ինչքա՞ն ժամանակ կպահանջվի այլ տվյալների կենտրոն նախագծի տեղափոխման համար, եթե Ձեր կենտրոնում լինի հրդեհ, ջրհեղեղ կամ մատակարարը ուղղակի դադարի գույություն ունենալ: Որտե՞ղ նրան տեղակայել, ինչքա՞ն ժամանակահատվածում կտրամադրվեն նոր սարքավորումները և այլն: Եթե ստացված թվերը չեն տեղավորվում Ձեր ակնկալած RTO-ի մեջ, նախապես փնտրեք այլ մատակարարներ, որոնց ենթակառուցվածքները կօգնեն Ձեզ վերականգնվել: Ինչպես նաև որոշեք, թե ինչ քանակությամբ տվյալներ եք Դուք պատրաստ կորցնել և ընտրեք պահուստավորման համապատասխան եղանակը: Երրորդ՝ հաշվարկեք: Գնահատեք միանգամյա և կանոնավոր ծախսերը՝ Ձեզ համար անհրաժեշտ անխափանության ցուցիչների նշանակության ապահովման համար: Դուք պատրա՞ստ եք վճարել ստացված գումարը: Եթե ոչ, ապա Ձեզ համար տվյալներն այնքան էլ կարևոր չէին, ինչպես մտածում էիք նախկինում: Եվս մեկ անգամ կատարեք հաշվարկ, բայց այս անգամ արդեն հաշվի առնելով վերականգնման համար նախատեսված Ձեր բյուջեն: Չորրորդ՝ իրագործեք: Ուղղակի հաշվարկը և գնահատումը բավական չեն: Պետք է գործնականում կիրառել անհրաժեշտ միջոցառումները: Պատվիրեք անհրաժեշտ պահուստային սարքավորումներ և ծառայություններ, կնքեք անհրաժեշտ պայմանագրեր, իրականացրեք մոնիտորինգ: Ձեզ համար տեքստային փաստաթղթում գրանցեք, թե որ դեպքերում ինչ սերվիսների պետք է դիմել, ինչպիսի գործողություն պետք է կատարել այս կամ այն դեպքում: Անգամ կարելի է մեկ անգամ իրականացնել համակարգում ինչ-որ կեղծ մերժում: Երբ ինչ-որ բան պատահի, դուք դեռ ինքներդ Ձեզ շնորհակալություն կհայտնեք հստակ և հետևողական ցուցումների առկայության համար: Վերականգնման պլանի առկայությունը թույլ կտա Ձեզ էականորեն խնայել Ձեր ժամանակը և նյարդերը: Ինչ-որ բանի կարևորությունը մեր կյանքում պայմանավորվում է նրանով, թե ինչքան ենք մենք պատրաստ տալ՝ դա պահպանելու համար: Եթե Դուք իսկապես գնահատում եք Ձեր աշխատանքի արդյունքները, մի մոռացեք հոգալ նաև դրանց պահպանման մասին: [b][u]Ո՞վ, եթե ոչ դուք, կանի դա:[/u][/b] Նյութի աղբյուրը՝ [url=http://maxarts.am/hy/b_item/1/]MAXARTS LLC[/url]

Նմանատիպ նյութեր