في عالم هندسة البرمجيات، نمذجة البيانات هي عملية إنشاء نموذج بيانات لنظام معلومات. يتم تطبيق بعض التقنيات الرسمية لإنشاء نماذج البيانات. يمكن شرح مقدمة لنمذجة البيانات على أنها تقنية لتحديد وتنظيم العمليات التجارية.
يستخدم الناس نمذجة البيانات لتحليل وفهم وتوضيح متطلبات البيانات للمستخدمين. بعد ذلك، وعلى هذا الأساس، يتم إنشاء وصف مرئي للأعمال.
وتستخدمها المؤسسات كأداة حيوية لإطلاق العنان لقيمة بياناتها. كما أنها تعتبر نمذجة البيانات مهمة لتسريع عملية تطوير تطبيقاتها. تُظهر الأبحاث أن المؤسسات التي تستخدم ذلك تقدم المنتجات إلى الأسواق بسرعة أكبر. كما يتم تقليل وقت الإنتاج وخفض التكلفة.
وبالتالي، هناك طلب كبير في سوق العمل على الأشخاص الذين يعرفون كيفية القيام بنمذجة البيانات. يشعر المبتدئون أحيانًا بالتوتر بشأن نوع الأسئلة التي ستطرحها عليهم لجنة المقابلة الشخصية. وبالتالي، تساعدهم قائمة شاملة بالأسئلة وإجاباتها كثيرًا. فيما يلي بعض الأسئلة الأساسية وإجاباتها:
نمذجة البيانات هي تمثيل تخطيطي. فهو يوضح كيفية ارتباط الكيانات ببعضها البعض. يعتبرها الناس الخطوة الأولى نحو تصميم قاعدة البيانات. في البداية، يقوم الناس بإنشاء نموذج مفاهيمي. ثم يصنعون النموذج المنطقي. وأخيراً، ينتقلون إلى النموذج المادي. يتم إنشاؤها في مرحلة تحليل البيانات ومرحلة التصميم في دورة حياة تطوير البرمجيات.
يمكن وصفها أيضًا بأنها عملية إنشاء نموذج. قد تخزن البيانات هذا النموذج في قاعدة بيانات. يصفها مهندسو الكمبيوتر المخضرمون بأنها تمثيل مفاهيمي لكائنات البيانات المختلفة.
هناك نوعان مختلفان من مخططات التصميم. وهما كالتالي:
في الأساس، هناك ثلاثة أنواع من نماذج البيانات. وهي كالتالي:
كنت أعمل في شركة تأمين صحي في وقت سابق. وهناك، لدينا واجهات مدمجة في إنفورماتيكا. في البداية، يتم جلب البيانات من قاعدة بيانات الواجهات. تقوم واجهات Informatica ببناء عمليات وتحويل هذه البيانات. يرسلون معلومات قيمة إلى البائعين أيضًا
كان لدينا كيانات مختلفة. جميعها مرتبطة ببعضها البعض. شكل المشتركون والأعضاء والتسجيل والفواتير ومقدمو الرعاية الصحية والعمولة الكيانات. كل كيان بيانات له سمة البيانات الخاصة به. على سبيل المثال، سيكون رقم تعريف المزود سمة بيانات للمزود.
يعتمد اختيار مخطط معين دائمًا على السيناريو ومتطلبات المشروع.
مخطط النجمة في شكل غير طبيعي. وبالتالي، يحتاج المستخدمون إلى عدد أقل من الوصلات للاستعلام. من ناحية أخرى، يكون مخطط ندفة الثلج في شكل طبيعي. لذلك، سيحتاج إلى عدد أكبر من الوصلات مقارنةً بمخطط نجمة. لذا، فإن الاستعلام معقد.
سيكون تنفيذ مخطط ندفة الثلج أبطأ من المخطط النجمي. في المخطط النجمي، يكون الاستعلام أكثر وضوحًا. لذا، فإنه يعمل بشكل أسرع.
أيضًا، يحتوي المخطط النجمي على مستوى عالٍ من البيانات الزائدة عن الحاجة. لذلك، ليس من السهل صيانته.nلا تحتوي بيانات ندفة الثلج على معلومات زائدة عن الحاجة. لذلك، من السهل صيانتها.
من الأفضل اختيار مخطط ندفة الثلج إذا كان الغرض من المشروع هو إجراء المزيد من التحليل البعدي. من ناحية أخرى، إذا كان من الأفضل اختيار المخطط النجمي في حال كان الهدف من المشروع هو إجراء المزيد من التحليل القياسي.
عملية تصميم قاعدة البيانات بطريقة تقلل من تكرار البيانات، دون المساس بالتكامل.
هناك أغراض متعددة وراء استخدام التطبيع لمصممي البيانات. وهي كالتالي:
يتكون الجدول من البيانات المخزنة في أعمدة وصفوف. تعرض الأعمدة البيانات في محاذاة رأسية.
تُعرف الأعمدة أيضًا باسم الحقول. تمثل الصفوف المحاذاة الأفقية للبيانات. وتُعرف أيضًا باسم السجلات أو التوابع.
تُعرف التقنية التي يتم فيها إضافة بيانات زائدة عن الحاجة إلى قاعدة بيانات منسقة بالفعل باسم إزالة التطبيع.
تضحي عملية إلغاء التطبيع بأداء الكتابة لتحسين أداء القراءة.
توجد ثلاثة أنواع رئيسية من العلاقات وهي كالتالي:
يمكن أن نواجه بعض الأخطاء الشائعة في نموذج البيانات. الأخطاء القياسية هي كما يلي:
يُعرف مستوى المعلومات المخزنة في جدول ما باسم التفصيل. وهي نوعان – عالية أو منخفضة. تحتوي الحبيبية المنخفضة على معلومات منخفضة المستوى فقط مثل تلك الموجودة في جداول الحقائق. تحتوي الحبيبية عالية المستوى على بيانات على مستوى المعاملات.
البيانات الوصفية هي نوع البيانات التي تغطي أنواع البيانات الموجودة في النظام ومن يستخدمها ولأي غرض. بالتناوب، يمكن تعريفها على أنها “بيانات حول البيانات”.
يحتوي المخطط النجمي على جدول حقائق في المركز. تحيط به جداول أبعاد متعددة. مخطط ندفة الثلج مشابه له.
والفرق الوحيد هو أن مخطط ندفة الثلج لديه مستوى أعلى من التطبيع. ونتيجة لذلك، يشبه المخطط ندفة الثلج.
يتكون نموذج بيانات المؤسسة من جميع الإدخالات التي تتطلبها المؤسسة. يتم تقسيم نماذج البيانات إلى مجالات موضوعية مختلفة لفهم أوضح. وهو يساعد على عرض وتفسير قياسي ومتسق لعناصر البيانات وعلاقاتها عبر المؤسسة.
في تخزين البيانات، يتم استخدام أبعاد مختلفة لإدارة البيانات التاريخية وكذلك البيانات الحالية. وتتوفر أربعة أنواع مختلفة من الأحجام المتغيرة ببطء: من نوع SCD Type 0 إلى نوع SCD Type 3.
تُعرف العملية التي يتم فيها إنشاء برامج نصية بلغة تعريف البيانات (DDL) من نموذج البيانات نفسه باسم الهندسة الأمامية. يمكن استخدام البرامج النصية للغة تعريف البيانات (DDL) لإنشاء قواعد البيانات.
من ناحية أخرى، تقوم الهندسة العكسية بإنشاء نماذج بيانات من برنامج نصي أو قاعدة بيانات.
تشير نمذجة البيانات العلائقية إلى تمثيل مرئي للكائنات في قاعدة بيانات علائقية.
OLTP هو اختصار، والصيغة الكاملة له هي معالجة المعاملات عبر الإنترنت. وهو نهج يتم من خلاله إنشاء نماذج بيانات للمعاملات. جميع المعاملات عبر الإنترنت والمعاملات المصرفية هي أمثلة على نمذجة بيانات OLTP.
يُعرف نموذج البيانات وبياناته الأساسية، مثل تعريف السمة وتعريف الكيان وأنواع البيانات والأعمدة باسم مستودع نموذج البيانات. يمكن الوصول إلى المستودع من قبل مصممي نماذج البيانات وفريقهم بالكامل.
في الأساس، نماذج البيانات هي أدوات تستخدم لتحليل ووصف متطلبات البيانات. كما أنها تصف الافتراضات وشروط البيانات في النظام. بعد ذلك، تلعب ERD دورًا حيويًا. يرمز ERD إلى مخطط علاقة الكيانات. وهو تمثيل منطقي للهويات. الغرض من ERD هو تحديد العلاقة بين الكيانات. تم العثور على الكيانات في صندوق الوارد. ترمز الأسهم إلى العلاقات.
تحدد ندرة البيانات مقدار البيانات الموجودة للبعد أو الكيان المحدد للنموذج. في حالة عدم كفاية المعلومات المخزنة في الأحجام، يلزم توفير مساحة أكبر لحجز التجميعات. ونتيجة لذلك، تكون النتيجة قاعدة بيانات واسعة النطاق. تساعدنا ندرة البيانات في التغلب على هذه المشكلة.
البُعد غير الهام هو عبارة عن تجميع للسمات منخفضة الحيز مثل الأعلام أو المؤشرات. يتم إزالتها من جداول أخرى و”تجميعها” في جدول أبعاد مجردة. يتم استخدامها بشكل متكرر لبدء أبعاد سريعة التغير داخل مستودعات البيانات.
تتمتع قواعد بيانات NoSQL بالعديد من المزايا مقارنة بقواعد البيانات العلائقية. المزايا هي كما يلي:
لن يولد العمود خطأ لأن قيم الخطأ الفارغة لا تتساوى أبدًا. يمكن للمستخدمين وضع أكبر عدد ممكن من القيم الفارغة في قائمة الانتظار كما يحلو لهم، ولكن لن يتم توليد أي خطأ.
يرتبط نموذج البيانات المنطقية بمتطلبات العمل. يتم استخدام نمذجة البيانات التحليلية لإنشاء نموذج بيانات منطقي.
القيد هو قاعدة يتم فرضها على البيانات. تتضمن الأنواع المختلفة من التقدير المفاتيح المركبة أو القيم الفارغة أو المفاتيح الخارجية.
يقوم المستخدمون بإضافة محتوى فريد لتجنب تكرار القيم داخل العمود.
يستخدم المستخدمون قيد الاختيار لتحديد نطاق القيم داخل العمود.
جدول الحقائق بدون حقائق هو جدول حقائق يحتوي فقط على مفاتيح الأبعاد. ولا يتضمن أي مقياس حقائق فيه.
وهو ضروري لحالات عمل محددة. على سبيل المثال: قد يحتاج المستخدم للحفاظ على نظام سجل حضور الموظفين. هنا، قد يكون لديهم جدول حقائق بدون حقائق، ن مع ثلاثة مفاتيح. قد يوفر جدول الحقائق بدون حقائق مرونة في التصميم هنا.
العبارة خاطئة. لا يلزم أن تكون جميع قواعد البيانات في 3Nf. يمكن للمستخدمين أيضًا إنشاء قاعدة بيانات بدون تطبيع. لذلك، لا يلزم أن تكون قاعدة البيانات في 3NF.
عدد الحقول أو الأعمدة الموجودة في الجدول الرئيسي يساوي عدد الجداول الفرعية التي يمكن إنشاؤها من جدول رئيسي واحد.
جدول الحقائق عبارة عن جدول مركزي يحتوي على قيم رقمية، تُعرف أيضًا بالقياسات. وهو محاط بجداول الأبعاد ويوجد أيضًا في المخطط النجمي أو مخطط رقاقات الثلج.
وتقنية نمذجة البيانات هي تمثيل نموذج البيانات المنطقية ونموذج البيانات المادية، وفقًا لمتطلبات العمل.
تتوفر ثلاثة أنواع من جداول الحقائق. وهي كالتالي:
تتمثل الاختلافات بين نموذج البيانات المنطقية ونموذج البيانات المادية فيما يلي:
إذا كنت معجبًا بما قرأته عن نمذجة البيانات وترغب في معرفة المزيد، فعليك مراجعة SPOTO الذي يوضح لك كيف تصبح واحدًا منهم.
أما إذا كنت مستعداً لتسريع مسيرتك المهنية في علم البيانات. ستكتسب خبرة عملية في التقنيات الرئيسية، بما في ذلك R وSAS وPython وTableau وHadoop وSpark. اختبر تدريباً على مستوى عالمي على يد أحد رواد الصناعة على مهارات علوم البيانات والتعلم الآلي الأكثر طلباً.
الخلاصة: نمذجة البيانات هي تقنية تُستخدم لتصميم قاعدة البيانات. وهي تساعد المستخدمين على جلب أنواع مختلفة من استعلامات SQL المعقدة في بيئة DWL. ومن ثم، يحرص مطورو البرامج على التعلم.
SPOTO هي مزود معترف به عالميًا لمجموعة واسعة من الخدمات الاحترافية المصممة لتلبية الاحتياجات المتنوعة للمؤسسات في جميع أنحاء العالم. نحن متخصصون في التدريب التقني والتجاري، وتطوير تكنولوجيا المعلومات وحلول البرمجيات، وخدمات اللغات الأجنبية، والتعلم الرقمي، وتوفير الموارد والتوظيف، والاستشارات. يتجلى التزامنا الثابت بالتميز من خلال شهادات الأيزو 9001 و27001 وCMMIDEV/3، التي تؤكد على معاييرنا الاستثنائية. وبفضل سجلنا الحافل بالنجاح الذي يمتد لأكثر من عقدين من الزمن، فقد قدمنا خدماتنا بفعالية لأكثر من 4000 مؤسسة في جميع أنحاء العالم.
