08:54 هندسة موثوقية الموقع SRE وأهميتها - مدونة SPOTO - مواد دراسية مفيدة لدراسة شهادة تكنولوجيا المعلومات
preloader

هندسة موثوقية الموقع SRE وأهميتها

كم منا يتذكر الأيام التي لم يكن الناس فيها على دراية بهندسة البرمجيات؟ كان هناك قدر كبير من العمل اليدوي في تلك الأيام. حتى النظام لم يكن موثوقاً به. كان مطلوباً من مسؤولي النظام إنشاء تقارير الحوادث، وإدارة التغيير، وإدارة الإنتاج.
وكان لا بد أن تحتوي هذه التقارير على أخطاء عند إنشائها يدوياً. لم تكن المؤسسات قادرة على تقديم المنتج المثالي للجمهور المستهدف. لقد قضت الحوسبة على المشكلة. تم إدخال بُعد يُعرف باسم هندسة موثوقية الموقع SRE في عالم الهندسة.
ضمنت هندسة موثوقية الموقع SRE تقارير خالية من الأخطاء. فهي تضمن أن هندسة البرمجيات تجعل مهام تشغيل تكنولوجيا المعلومات خالية من الأخطاء. هندسة موثوقية الموقع مهمة لعدة أسباب. يطبّق مهندسو موثوقية الموقع عقلية هندسة البرمجيات على مواضيع إدارة النظام.
كما ذكر بن تراينور، مؤسس Google SRE، أنه من خلال هندسة موثوقية الموقع، فإنهم يجمعون بين العمليات والتطوير. واليوم استخدمت علامات تجارية مثل نتفليكس وأمازون هندسة موثوقية الموقع.
كان هناك وقت لم تكن فيه العمالة الماهرة شيئًا متاحًا بسهولة. وكان الناس بحاجة إلى قناة لجعل الإدارة أكثر فعالية، ولم يكونوا بحاجة إلى الاعتماد على مهاراتهم في تقييم المخاطر وتحليل الأعطال. خلال تلك الفترة، كان وقت الإصلاح في أعلى مستوياته على الإطلاق. وقد أثر ذلك على رضا العملاء.
ومع ذلك، أراد المهندسون المهرة إعطاء الأولوية لرضا العملاء. وكان تركيزهم الرئيسي هو بناء تفاعلات موثوقة مع العملاء. لذا، بدأ مهندسو البرمجيات يؤمنون بأن التكنولوجيا ديناميكية. أراد مهندسو البرمجيات إنشاء أنظمة برمجيات موثوقة.
واستخدموا في البداية البرمجيات كوسيلة لحل جميع مشاكلهم التي كانت تُحل يدوياً في السابق. لذا، في اللحظة التي تم فيها إنشاء فريق لحل المشاكل، اتبعوا نهجاً مفاده أن كل شيء يمكن التعامل معه كمشكلة برمجية
في الوقت الحاضر، اكتسبت هندسة موثوقية الموقع شعبية للأسباب التالية-
1- هندسة موثوقية الموقع DevOps SRE هندسة موثوقية الموقع SRE هي تطبيق لـ DevOps. يعمل كل من SRE و DevOps على سد الفجوة بين فرق العمليات والتطوير لتقديم خدمات سريعة. لا تعتبر DevOps منافسًا لهندسة SRE في مجال تطوير البرمجيات. السمات المميزة لـ DevOps هي كما يلي-
تساعد SRE مهندسي DevOps. وترتبط SRE و DevOps بالطرق التالية-
2- لتحسين الاستجابة للحوادث مهندس SRE قادر على بناء عمليات فعالة عند الطلب. كما أنهم يعرفون كيفية تبسيط سير عمل التنبيهات. فهم قادرون على إرسال التنبيهات مباشرةً إلى الشخص المسؤول لمعالجة المشكلة. يضع مهندسو موثوقية الموقع عتبات مستوى الخدمة التي تساعد في تحديد ما إذا كان إصدار تنبيهات مستوى الخدمة سيحصل على الإشارة الخضراء. يتبع مهندسو موثوقية الموقع قاعدة الخمس تسعات أي 99.999 مرة.
يعرف مهندس موثوقية الموقع كيفية مراقبة الأنظمة. كما أنهم يعرفون كيفية التصرف عندما تسوء الأمور. يعد تشريح ما بعد الوفاة جزءًا مهمًا من إدارة موثوقية الموقع. إن مرحلة ما بعد الوفاة هي تجربة التعلم للشركة بأكملها وفقًا للمعلومات الواردة في كتاب هندسة موثوقية الموقع لجون لوني وسو لودر.
3- هندسة موثوقية الخدمة هي مجموعة مهارات وفلسفة هندسة موثوقية الخدمة هي كل ما يتعلق بالعقلية. إن عملية تفكير مهندسي موثوقية الخدمة لا تقل أهمية عن مهاراتهم التقنية.
يحتاج مهندسو موثوقية الخدمة إلى مزيج من المهارات التشغيلية والتطوير. يجب أن يكون مهندس موثوقية الخدمة على دراية أكثر من مطور برامج لقراءة كتاب جوجل لهندسة موثوقية الخدمة. يضع كبير مهندسي موثوقية الموقع في المهارات التقنية بقدر ما يضع مدير موثوقية الموقع في عملية التفكير. يمكن لفريق موثوقية الخدمة SRE إدارة وتنفيذ مبادئ موثوقية الخدمة SRE بطريقة خالية من المتاعب.
4- لا توجد مجموعة موحدة من الأدوات العالمية لا توجد مجموعة موحدة وعالمية من أدوات هندسة موثوقية الموقع SRE. تحتاج هندسة موثوقية موقع SRE إلى تحديد الأدوات اللازمة. في حالة كتاب هندسة موثوقية الموقع من Google، يعد التوحيد القياسي أهم استراتيجية.
فهو يساعد فرق هندسة موثوقية الموقع SRE الأصغر نسبياً على دعم فرق المنتجات الأكبر حجماً. فهم يستخدمون بعض الأدوات القياسية مثل تحليل المخاطر الأولية (PHA)، و FMEA (تحليل أوضاع الفشل وتأثيراته)، و CA (تحليل الحرجية)، و FTA (تحليل شجرة الأخطاء).
5- محفز التغيير يعمل كبار مهندسي الموثوقية في الموقع كمحفز لأعضاء الفريق الذين يقومون بإدخال تغييرات على الفريق. ويسمح كبار مهندسي الموثوقية في الموقع لبعض الفرق بتضمين مهندسي الموثوقية في الموقع. وقد يقومون بنشر ثقافة وفكرة الموثوقية لتطبيق مبادئ SRE.
6. لبناء مركز عمليات الشبكة الحديثة عندما تكون مهندس موثوقية الموقع، يجب أن تكون قادرًا على الجمع بين الفهم العميق لعمليات تكنولوجيا المعلومات والعمليات. نظرًا لأن مهندس موثوقية الخدمة هو مطور، فمن المتوقع أن يقدم حلولاً لإزالة العقبات بين فريق العمليات وفريق التطوير.
7. تقليل الاحتكاك إن هندسة موثوقية الخدمة قادرة على تقليل أو إزالة قدر كبير من الاحتكاك بين فرق التطوير. ترغب الفرق في إصدار برامج محدثة في السوق بانتظام. على العكس من ذلك، لا يرغب فريق العمليات في إصدار أي نوع من البرامج المحدثة في السوق، دون التأكد من أنها ستمنع الانقطاعات.
8- إيجاد توازن يساعد قادة فريق هندسة موثوقية الموقع أعضاء الفريق على إيجاد توازن بين إصدار ميزات جديدة وضمان موثوقية المنتجات. يمكن لمهندسي موثوقية الموقع قضاء خمسين بالمائة فقط من وقتهم في العمليات. فهم بحاجة إلى تقسيم وقتهم بين عمل المشروع والعمليات.
تتم مراقبة الساعات التي يقضونها وراء العمليات، لضمان عدم إنفاقهم أكثر من الوقت المخصص لهم. ومن المتوقع أن يخصصوا بقية وقتهم للمهام التطويرية. وتشمل هذه المهام التطويرية تنفيذ الأتمتة وتوسيع نطاق الأنظمة. ويعتبر تحقيق التوازن بين العمليات وأعمال التطوير هو المفتاح الأساسي لميزانية الأتمتة والتطوير، ويسمح لفريق التطوير باستخدام ميزانية الأخطاء وميزانية الأخطاء في تحديد ما إذا كان يمكن إطلاق المنتج الجديد بناءً على ميزانية الأخطاء المتاحة.
9- الأتمتة تلعب الأتمتة دورًا رئيسيًا في مهنة مهندس مسؤولية الخدمة. فهم بحاجة إلى أتمتة الحلول للمشاكل التي يواجهونها بشكل متكرر. ويثبتون أن أتمتة أي مشروع يقلل من عبء العمل وساعات العمل على الفريق التشغيلي. يعتمد مهندسو موثوقية الخدمة على أتمتة مهام التشغيل الروتينية طوال دورة حياة التطبيق.
10. تحليل الأصول يتعاون مهندس موثوقية الخدمة مع الإنتاج لتحليل الأصول. ويقومون بالتحقق من العمر الإنتاجي المتبقي للأصول، والفعالية الإجمالية للمعدات، وغيرها من المعايير التي تحدد العمليات.
كما أنهم يضمنون موثوقية جميع المنتجات. يطبق مهندس موثوقية الموقع تحليل القيمة للتفكير في قراراتهم المتعلقة بالدفع. وأخيراً وليس آخراً، يقدمون الدعم الفني لموظفي الإنتاج والصيانة والموظفين الفنيين. ويتحققون من مدى فعالية أي منتج معين على أساس شامل.
11- مراقبة الشيفرات البرمجية تتولى فرق مراقبة موثوقية الخدمة مسؤولية نشر وتهيئة ومراقبة الشيفرات البرمجية وإدارة سعة الخدمة والاستجابة للطوارئ. وفي نهاية المطاف، يستكمل مهندسو موثوقية الخدمة بعض الممارسات الأساسية في DevOps مثل أتمتة البنية التحتية والتسليم المستمر.
12- إدارة المخاطر تتمثل المسؤولية الأساسية لمهندس موثوقية الخدمة في التخفيف من مخاطر الموثوقية التي يمكن أن يكون لها تأثير سلبي على العمليات التجارية. من أجل ذلك، تحتاج فرق SRE إلى القضاء على الخسارة أو على الأقل تقليلها. لذلك، يحتاجون إلى تحديد خسائر الإنتاج في البداية. ثم يضعون خطة لتقليل الخسائر. لذلك، قد يتبعون تحليل الأسباب الجذرية. في البداية، يحتاجون إلى الحصول على الموافقة على الخطة ثم تسهيل التنفيذ.
13- تطوير التصميم يقوم مسؤولو SRE بالمشاركة في تطوير التصاميم. كما يشاركون في تقييم المعدات والفحص النهائي للمنتجات المركبة. كما أنهم يضعون معايير مختلفة للفحص. ويضمن فريق الفحص الفني للمعدات والمرافق والعمليات بفعالية إمكانية الاستفادة من المعدات والمرافق والعمليات، ومن واجبهم استخدام مختلف الأساليب غير المدمرة والتنبؤية بفعالية للاستفادة من مشاكل الموثوقية الكامنة وعزلها.
هدفهم الرئيسي هو تطوير وتصميم البرمجيات التي تزيد من الأداء والموثوقية. يعمل مهندسو موثوقية البرمجيات بشكل وثيق مع مطوري المنتجات لضمان استجابة الحل المصمم للمتطلبات غير الوظيفية مثل الأمان والأداء.
تشترك SRE و DevOps في نفس المبادئ الأساسية. إن DevOps هي فلسفة التعاطف بين الفرق ومواءمة الأعمال.
يقدم مهندسو موثوقية الخدمة حلولاً لجميع المشاكل التي لها تأثير سلبي على جميع عمليات المصنع. هدفهم هو تطوير حلول هندسية للمشاكل المستمرة مثل مشاكل الامتثال التنظيمي والقدرة والتكلفة. وهم يطبقون تقنيات تحليل البيانات، مثل طريقة سيجما الستة، ونمذجة الموثوقية والتنبؤ بها، والتحكم في العمليات الإحصائية، وتحليل السبب الجذري للفشل، وتحليل ويبول، ويتمتع مهندسو موثوقية الموقع بالقدرة على استبدال العمالة البشرية بالأتمتة.
لذلك، يقوم مهندسو الموثوقية في الموقع بأعمال فريق العمليات. يتم توظيف مهندسي البرمجيات ذوي المعرفة المصرفية ليكونوا أعضاء في فرق SRE لأنهم يعرفون كيفية استبدال العمل البشري بالأتمتة. وتتمثل مهمتهم الرئيسية في أتمتة عملهم. ولتسهيل الأتمتة، يحتاجون إلى بناء أدوات خدمة ذاتية مختلفة لمجموعات المستخدمين التي تعتمد على هذه الخدمات. تقلل الأتمتة من عبء العمل. ونتيجة لذلك، قد يركزون على المهمة التالية في متناول اليد لأتمتة المهمة التالية.
قد يكتسب أعضاء فريق SRE الذين يظهرون اتجاهاً للتحسين المستمر رؤية على مستوى النظام. وتدريجياً، يتوصلون تدريجياً إلى فهم أن سلاسل تسليم قيمة البرمجيات تعمل. كما أن اكتساب المزيد من المعرفة العملية يجعل أعضاء فريق SRE أكثر مرونة للمستقبل. كما توفر لهم هذه المعرفة ميزة تنافسية. قد يكتشف مهندسو موثوقية الخدمة ممارسات Google حول إدارة المخاطر واستكشاف الأخطاء وإصلاحها وبناء معالجة الحوادث القابلة للتطوير في كتاب Google SRE.
يلعب مهندسو موثوقية الموقع دورًا فريدًا. يجب أن يكون لديهم خلفية كمطوّري برمجيات، كما أن الخبرة الإضافية في مسؤول النظام مفيدة. يجب أن يتمتعوا بمهارات مختلفة بعضها مذكور أدناه
يتحمل مهندسو هندسة موثوقية الموقع العديد من المسؤوليات. بعض المسؤوليات القليلة هي كما يلي-
الاستنتاج
تتطلب المنظمات المختلفة مؤهلات مختلفة لمهندسي موثوقية الموقع. ومع ذلك، فإن جميع مهندسي موثوقية الموقع يفضلون القيام بتدريب في مجال هندسة موثوقية الموقع. كما يجب أن يكون مهندسو موثوقية الموقع SRE خبراء في الأجزاء الداخلية لنظام Unix والشبكات. مهارات إدارة البنية التحتية أمر لا بد منه بالنسبة لهم.
SPOTO هي مزود معترف به عالميًا لمجموعة واسعة من الخدمات الاحترافية المصممة لتلبية الاحتياجات المتنوعة للمؤسسات في جميع أنحاء العالم. نحن متخصصون في التدريب التقني والتدريب على الأعمال، وتطوير تكنولوجيا المعلومات وحلول البرمجيات، وخدمات اللغات الأجنبية، والتعلم الرقمي، وتوفير الموارد والتوظيف، والاستشارات. يتجلى التزامنا الثابت بالتميز من خلال شهادات الأيزو 9001 و27001 وCMMIDEV/3، التي تؤكد على معاييرنا الاستثنائية. وبفضل سجلنا الحافل بالنجاح الذي يمتد لأكثر من عقدين من الزمن، فقد قدمنا خدماتنا بفعالية لأكثر من 4000 مؤسسة في جميع أنحاء العالم.

About the Author

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

Related Posts