موصى به, 2024

اختيار المحرر

كيف تقوم البيانات الكبيرة بتغيير اللعبة للنسخ الاحتياطي والاسترداد

بنتنا يا بنتنا

بنتنا يا بنتنا
Anonim

إنها حقيقة معروفة في عالم تكنولوجيا المعلومات: قم بتغيير جزء واحد من حزمة البرامج ، وهناك فرصة جيدة أن تضطر إلى تغيير أخرى. للحصول على مثال ساطع ، لا تنظر إلى أبعد من البيانات الكبيرة.

أولاً ، هزَّت البيانات الضخمة ساحة قاعدة البيانات ، ودخلت فئة جديدة من تقنيات "التدرج". هذا هو النموذج الذي تمثله منتجات مثل Hadoop ، MongoDB ، و Cassandra ، حيث يتم توزيع البيانات عبر خوادم سلعة متعددة بدلاً من حزمها في واحد كبير. الجمال بالطبع ، هو المرونة: لاستيعاب المزيد من البيتابايت ، يمكنك فقط إضافة آلة أخرى رخيصة الثمن أو اثنين بدلا من "زيادة" ودفع مبالغ كبيرة مقابل ماموث أكبر.

هذا كل شيء عظيم ، ولكن الآن هناك نقطة الخلاف الجديدة: النسخ الاحتياطي والاسترداد.

"منتجات النسخ الاحتياطي التقليدية تواجه تحديات مع كميات كبيرة جدا من البيانات" ، وقال ديف راسيل ، نائب الرئيس مع جارتنر. "من الممكن أيضًا أن تكون طبيعة بنية المقياس شديدة الصعوبة في التعامل مع تطبيقات النسخ الاحتياطي التقليدية."

تتضمن قواعد البيانات القابلة للتوسع أفقياً اليوم بعض الإمكانيات للتوفر والاسترداد ، ولكنها عادة لا تكون قوية مثل تلك التي لدى مستخدمي تقنية المعلومات واعتاد راسل على ذلك. ولكنه أيضًا حيث بدأت فئة جديدة من منتجات حماية البيانات في إدخال الصورة.

Dartos IO's RecoverX هي واحدة من تلك.

"إذا كان لديك قاعدة بيانات تقليدية مثل Oracle أو MySQL ، فستكون الزيادة في الحجم ، يقول تارون ثاكور ، المؤسس المشارك والرئيس التنفيذي لشركة Datos IO: "هناك دائمًا فكرة وجود سجل دائم"

في مثل هذه السيناريوهات ، فإن نسخة من هذا السجل هي ما يشكل نسخة احتياطية عند حدوث مشكلات.

في العالم من قواعد بيانات الجيل التالي اليوم - حيث يتم توزيع البيانات عبر الأجهزة الصغيرة - ليست بسيطة للغاية.

"لا يوجد مفهوم لسجل دائم لأنه لا يوجد رئيسي - كل عقدة تعمل على الأشياء الخاصة بها "، وأوضح Thakur. "يمكن للعُقد المختلفة الحصول على حقوق مختلفة ، ولكل عقدة وجهة نظر مختلفة لعملية ما."

هذا جزئيا بسبب مفاضلة كان مطلوبًا لاستيعاب ما يشار إليه عادة باسم "الثلاثة V's" للبيانات الكبيرة - حجم وسرعة وتنوع. وعلى وجه التحديد ، من أجل توفير قابلية التوسع مع استيعاب الكم الهائل من البيانات المتنوعة التي تطير علينا بسرعات أكثر إثارة للقلق ، فقد غادرت قواعد البيانات الموزعة اليوم معايير "ACID" التي وعدت بها قواعد البيانات التقليدية. بدلا من ذلك ، لقد اعتمدوا ما يعرف باسم مبادئ "القاعدة".

إنه تمييز حاسم. والأمر الأكثر أهمية هو أنه في الأماكن التي تعد فيها قواعد البيانات التقليدية بالاتساق القوي في جميع أنحاء العالم - وهذا هو الحرف "C" في ACID - تسعى الجهات الموزعة جاهدة بدلاً من ذلك إلى ما يسمى "الاتساق النهائي". سوف تنعكس التحديثات في جميع العقد في قاعدة البيانات عاجلا أم آجلا ، ولكن هناك تأخر زمني.

"إذا كنت بحاجة إلى قابلية التوسع ، فإنك تحتاج إلى التخلي عن الاتساق - يجب عليك التخلي عن واحد أو آخر" ، قال ثاكور

وهذا يجعل من الصعب الحصول على لقطة موثوق بها للصورة الكبيرة لاستعادة النقطة في الوقت المناسب. ليس فقط من الصعب تعقب البيانات التي ربما تكون قد انتقلت إلى مكان في قاعدة البيانات الموزعة في أي لحظة ، ولكن ميزات المرونة التي غالباً ما تأتي "مخبوزة" إلى قواعد بيانات جديدة موزعة - النسخ المتماثل ، على سبيل المثال - لن تحميك يقول سايمون روبنسون ، نائب رئيس الأبحاث في شركة 451 Research: "إنك تتعطل البيانات".

"لقد قمت فقط بتكرار تلك البيانات المعطوبة."

في وقت سابق من هذا الشهر ، أطلقت Datos IO برنامج RecoverX لمعالجة هذه المخاوف من خلال ميزات تتضمن ما يسميه الإصدار القابل للتطوير وإلغاء البيانات المكررة الدلالية. والنتيجة هي النسخ الاحتياطية المتناسقة في المجموعة والتي تكون فعالة من حيث المساحة ومتوفرة في التنسيقات الأصلية ، كما تقول الشركة

وقد شعر سوففيك داس ، الذي كان حتى وقت قريب كان CTO ونائب رئيس الهندسة مع CapitalOne تمويل السيارات ، وأزمة احتياطية عن طريق البريد المباشر.

بعد سنوات من استخدام قواعد البيانات التقليدية ، خضع CapitalOne "تحول هائل" قبل بضع سنوات ذلك شملت طرح تقنيات جديدة موزعة مثل كاساندرا ، قال داس ، الذي يشغل الآن منصب نائب الرئيس الأول للهندسة في Grand Rounds التي تركز على الرعاية الصحية.

وهذا يعني البحث عن استراتيجية جديدة للنسخ الاحتياطي والتعافي.

"معظم ويضيف: "عادة ما يتم ضبط الموردين والبائعين الاحتياطيين على نوع الأنظمة التي يدعمونها."

إن استخدام نسخة احتياطية من الطراز القديم مع قاعدة بيانات جديدة موزعة قد يسبب مشاكل.

" وقال داس: إما أن تفشل هذه البرامج تمامًا لأنها لا تعرف كيفية عمل نسخة احتياطية من مخازن البيانات الجديدة ، أو أنها ستعمل بطريقة غير مثالية. "نحن نعلم أننا سنكون بحاجة إلى حلول نسخ احتياطي مختلفة."

وقد قام CapitalOne بتقييم Datos IO بالإضافة إلى Talena ، وهو لاعب رئيسي آخر في الفضاء ، قال داس.

البائعين من منتجات النسخ الاحتياطي الأكثر تقليدية وقال روبنسون من شركة 451 ريسيرش: "عادة ما نقوم بتعديل تكنولوجياتهم الخاصة للبيانات الضخمة.

" عادة ما يستغرق البائعون الاحتياطيون الاحتياطيون بعض الوقت لدعم التقنيات الحديثة. " بسهولة القيام بنسخ احتياطية لأجهزة افتراضية VMware "، وأضاف. "هذا فتح الباب أمام لاعبين مثل فييم لدخول وسرقة سوق النسخ الاحتياطي VM من تحت أنوف أصحاب المناصب."

Top