روش RAID یک گروه از G دیسک داده به اضافه یک دیسک توازن که به کنترلر دیسک عادی متصل است می باشد. بلاک توازن ، exclusive-or G بلاک داده¬ی متناظرش را ذخیره می¬کند. خواندن یک بلاک داده از RAID به خواندن بلاک از یک دیسک داده مناسب برگردانده می¬شود. نوشتن یک بلاک داده به دیسک شامل نوشتن بلاک داده به دیسک به علاوه تغییر بلاک توازن متناظر آن است. روش RAID می تواند عمل خود را با وجود رخ دادن یک خرابی دیسک ادامه دهد. عمومی ترین روش RAID سطح ۵ نامیده می¬شود. در این روش بلاک¬های داده و بلاک¬های توازن بین دیسک¬هایی که بار کار را به صورت مساوی پخش کرده و تنگراه¬ها به دیسک توازن را برداشته¬اند تقسیم می¬شوند. هم دیسک منعکس شده و هم RAID در مقابل فجایع (disaster) قابل ترمیم نیستند.
روش دیسک منعکس شده دور یک بسط از روش دیسک منعکس شده است. تغییرات به دیسک منعکس شده¬ای که در سایتی دور در طول یک شبکه قرار دارند به صورت غیر همزمان اعمال می¬شوند. این روش در مقابل حادثه¬ای که در سایت اولیه رخ می دهد قابل ترمیم است هر چند که داده¬های منتشر نشده به سایت دور از بین می¬روند. روش دیسک منعکس شده دور می-تواند با استفاده از بیش از یک نسخه پشتیبان به روش سایت اولیه تعمیم پیدا کند. تغییرات در سایت اولیه انجام شده و سپس به سایت ثانویه به صورت غیر همزمان منتشر می¬شوند. برای ترمیم خطای رخ داده شده در سایت اولیه، یکی از سایت¬های ثانویه به عنوان اولیه جدید انتخاب می¬شود.
در روش تکرار داده فعال ، سایت¬های پشتیبان به اندازه کافی قدرت پردازشی و منابع مورد نیاز برای تسهیم بار کاری سایت اولیه را دارا هستند. در روش توافق اکثریت ، یک عمل تنها وقتی که اکثریت سایت ها با انجام آن موافق باشند قابل انجام است. بازده این روش بالاتر است ولی هزینه عمل خواندن و نیز نوشتن متوسط است. توافق اکثریت می تواند به روش توافق حد نصاب تعمیم پیدا کند . به جای گرفتن رضایت اکثریت سایت ها برای یک عمل خاص ، فقط رضایت یکسری سایت مرتبط که به نام حد نصاب یا quorum هستند نیاز است . پروتکل های توافق حد نصاب در سایز quorum ها ،overhead و تحمل پذیری خطا متفاوت هستند.
روش RAID توزیع شده تعمیمی از روش RAID انفعالی به یک روش فعال است.سیستم شامل G+2 سایت است . G/G+2 از کل بلاک ها برای داده ها مورد استفاده قرار می گیرد ، ۱/G+2 از کل بلاک ها برای ذخیره سازی parity و ۱/G+2 از کل بلاک ها برای ذخیره سازی به عنوان یدکی استفاده می شوند. این بلاک ها در سر تا سر G+2 سایت توزیع شده اند. در هر مورد یک خطای رخ داده در دیسک یا هر مورد از یک خرابی رخ داده در یک سایت ، نوسازی داده های از بین رفته با استفاده از دیسک های در دسترس امکان پذیر است . اطلاعات ساخته شده همچنین می توانند در بلاک های یدکی در دیسک های موجود ذخیره شوند.[۱]
مانند پروتکل توافق حد نصاب ، روش RAID توزیع شده هزینه همزمانی زیای بین تمام سایت هایی که بخش هایی از داده تکرار شده را شامل می شوند را باید متحمل شود. برتری روش RAID توزیع شده به پروتکل توافق حد نصاب کم بودن میزان افزونگی داده است ولی قبل از آن معایبی دارد که از آن جمله الگوریتم های پیچیده تر قرار دادن داده و ترمیم پذیری کمتر سایت ها در برابر خرابی هاست.
خوشه بندی واحد های عملیات می تواند به دو صورت بر اساس عملیات و بر اساس تراکنش تقسیم شود.یک سیستم بر اساس عملیات ، عملیات های اتمیک پایه مانند خواندن و نوشتن و نیز عملیات های سطح بالاتر مانند افزایش و en queue را پشتیبانی می کند. بسیاری از این سیستم ها مانند سیستم دیسک منعکس شده ، Lok-step هستند و واحد های حافظه در سایت های اولیه و پشتیبان با لینک های سرعت بالا که معمولا با سنجش زمان ، همزمان هستند به یکدیگر متصل هستند.هر تغییری در واحد حافظه اولیه بلافاصله به واحد حافظ پشتیبان اعمال می شود.در سیستم های دیگر، لینک ها بین سایت ها سست تر و غیر همزمان هستند.یک مورد از این سیستم ها ، سیستم فایل توزیع یافته است که تغییرات رخ داده در سرور اولیه کلا به صورت غیرهمزمان به سرور پشتیبان منتقل می شوند.
سیستم های بر اساس تراکنش ، تراکنش هایی را پشتیبانی می کنند که اجرای برنامه هایی را که به اشیاء پایگاه داده دسترسی می یابند ، شامل می شوند. پی در پی پذیری پذیرفته شده ترین معیار صحت در پردازش تراکنش هاست. یک جدول همزمانی تراکنش های همروند زمانی پی در پی پذیر است که معادل با یک جدول هزمانی سریال اجرای آن تراکنش ها باشد .[۳]هنگامی که یک تراکنش در سایت اولیه اجرا می شود ، عملیات های تغییر به سایت پشتیبان منتشر می شوند. کمترین انشعاب به بهترین تلاش صرف شده در نگهداری پشتیبانی که شامل بیشترین تغییرات قانونی ممکن است اشاره دارد. این عمل معمولا با حداقل کردن تفاوت بین تراکنش های سایت های اولیه و پشتیبان حاصل می شود.
سیستم های ۱- ایمن و ۲- ایمن سطوح مختلفی از انشعاب را پشتیبانی می کنند. یک سیستم پردازش تراکنش زمانی ۲- ایمن است که تمام تراکنش ها موجود در سیستم اتمیک باشند : چه تراکنش هایی که تغییرات شان به سایت های اولیه و پشتیبان منعکس می شود و چه تراکنش هایی که در هیچ یک از این سایت ها اجرا نمی شوند. با در نظر گرفتن سایت پشتیبان به عنوان بخشی از تراکنش های تویع شده ، پروتکل تثبیت دو فازی ممکن است برای پیاده سازی سیستم ۲- ایمن مورد استفاده قرار گیرد. ولی حداقل یک تاخیر round-trip اولیه – پشتیبان در تثبیت شدن تراکنش ها اجتناب نا پذیر است. این تاخیر طولانی تراکنش ها را وادار می سازد که قفل خود را به مدت طولانی تری نگهداری کنند و در نتیجه درگیری افزایش و توان عملیاتی کاهش می یابد.
برای اجتناب از این مساله ، اکثر سیستم ها یک روش ۱- ایمن را اتخاذ می کنند که در آن به تراکنش ها اجازه داده می شود قبل از اینکه تغییرات به پشتیبان منتشر شوند تثبیت شده و قفل خود را آزاد کنند. بنابراین تاخیر ارتباطی در تثبیت شدن وجود ندارد ولی اگر خطا قبل از انتشار یک تراکنش به پشتیبان رخ دهد ممکن است تراکنش تثبیت شده در سایت اولیه از بین رود. با این وجود ، روش بالا به عنوان یک روش به اندازه کافی خوب برای سیستم های عملی در نظر گرفته می شود.[۳] برای بدست آوردن حداقل انشعاب در این روش نیاز است که تراکنش های از بین رفته در طول رخ دادن یک خطا در سایت اولیه به صورت مینیمم نگهداری شود.
تقریبا تمام محصولات بازرگانی از یک روش ۱- ایمنی به منظور کارایی استفاده می کنند ولی در عین حال روش ۲- ایمنی را برای تراکنش های بحرانی و با ارزش پشتیبانی می کنند.
عملیات های تغییر در سایت اولیه معمولا در یک رکورد ذخیره شده و به صورت دوره ای به سایت پشتیبان فرستاده می شوند. رکورد های ثبت معمولا به همان ترتیبی که در فایل ثبت, ثبت شده اند به سایت پشتیبان منتشر می شوند.
رکوردهای ثبت بر اساس سطح اطلاعاتی که ذخیره می کنند می توانند به سه دسته مختلف تقسیم بندی شوند. رکوردهای ثبت, سطح تراکنش، نوع تراکنش و تمام ورودی ها کاربر را ذخیره کرده و به این ترتیب می توانند در سایت پشتبان دوباره اجرا شوند.از آنجایی که نیازی نیست که پشتیبان بدون تاخیر باشد و نیز حجم اطلاعات مورد نیاز برای ذخیره نسبتا پایین است ، این نوع log ها برای سیستم های ترمیم داده مناسب هستند.[۱]
رکوردهای ثبت سطح عملیات ، نوع عملیات ، شاخصه شئ داده و مقدار جدید شئ داده را ذخیره می کنند.این ساختار ثبت که شبیه ساختارهای مورد استفاده برای مقابله با خرابی¬های crash و بی¬نتیجه ماندن تراکنش هاست به مینیمم سازی هزینه تولید فایل ثبت در ترمیم فاجعه کمک می¬کند.
هر رکورد ثبت سطح فیزیکی یا I/O شامل تصویر یا آدرسی از صفحه یا بلاک مربوط به دستیابی دیسک است .پشتیبان نیاز دارد که تصاویر بدون پردازش درون دیسک ذخیره شوند.هر چند توان محاسباتی در سایت پشتیبان باید حداقل باشد ولی از آنجا که هر تغییر ویژگی شئ ممکن است نیازمند انتقال یک بلاک باشد ، حجم نسبتا عظیمی از اطلاعات باید منتقل شوند.
در رویه های ترمیم crash تقلیدی ، سیستم گاهی اوقات بر اینکه سایت اولیه رکوردهای ثبت خاصی را با سایت پشتیبان تراز کند اصرار می ورزند. تراز رکورد های ثبت و نصب تغییرات در سایت پشتیبان باید به دقت با عملیات در سایت اولیه هماهنگ باشد به طوری که پایگاه داده پشتیبان با پایگاه داده اولیه سازگار باشد.