استراتيجيات تنقيب البيانات وإدارتها

معلومات الدورة

المدة : 2 أسابيع

النوع: أونلاين

التواريخ المتاحة

الرسوم

    لا يوجد مواعيد متاحة

تفاصيل الدورة

مخطط الدورة

دورة 10 أيام

قاعدة بيانات المؤسسة ونماذج البيانات

  •  الاختلافات الرئيسية بين البيانات والمعلومات.
  •  فهم بيئات قاعدة بيانات المؤسسة.
  •  تحديد تحديات معينة مع تنقية البيانات.
  •  العناصر التي يتكون منها نموذج البيانات.

استخراج البيانات من قاعدة بيانات

  •  دور الاستعلامات في استخراج البيانات من قاعدة البيانات.
  •  كيفية تنفيذ الاستعلامات المتقدمة في Microsoft® Access (أو بيئة قاعدة بيانات أخرى) باستخدام لغة الاستعلام المرئية.
  •  كيفية كتابة الاستعلامات باستخدام لغة الاستعلام الهيكلية (SQL).
  •  التعرف على الطريقة التي تدعم بها لغة الاستعلام الهيكلية SQL وتستخلص وتحول وتحمل البيانات لإعداد البيانات لتطوير نموذج التحليلات. 
  • تنفيذ Hadoop® MR على نطاق واسع
  •  فهم ومعرفة الاختلافات بين هجوم القوة العمياء brute force والنهج الموازية.
  •  المفاهيم الأساسية والمزايا والبرامج الداعمة لـ ApacheTM Hadoop®.
  •  تحديد مكونات MapReduce.

الحصول على البيانات: الشبكات الاجتماعية وتحديد الموقع الجغرافي

  •  هيكل صفحة الويب وكيفية الحصول على ملفات HTML.
  •  مزايا برامج زحف الويب وكيفية الحصول على البيانات صفحة تلو الأخرى.
  •  كيفية إجراء تحليل النص: تحديد human text، والقضايا المشتركة، ومكتبات الموارد.
  •  الآثار الأخلاقية لاستخدام البيانات المتاحة للجمهور.

البيانات غير المهيكلة والرسوم البيانية والشبكات

  •  كيفية تطبيق بنية البيانات الصحيحة لمشكلة ما.
  •  الفروق بين خصائص الرسم البياني والعقدة والحافة.
  •  تحديد ما تعنيه الدرجة وتحليل وتفسير توزيع الدرجة.
  •  مفهوم معامل التجمع وما يمكن أن يعنيه لبياناتك.

التجميع: فهم علاقة الأشياء

  •  الفكرة وراء تجميع البيانات.
  •  أنواع التجميع.
  •  المسافات بين النقاط.
  •  تجميع K-Means .
  •  ما مدى جودة التجميع؟
  •  التجمعات الهرمية.
  •  الحد الأدنى، والحد الأقصى، والمتوسط.

التصنيفات: وضع الأشياء في مكانها

  •  الفكرة من وراء التصنيف.
  •  قراءة وتفسير شجرة التصنيف.
  •  صنع شجرة القرار.

تدابير الشائبة البديلة

  •  التوسع إلى 2D.
  •  ما مدى جودة المصنِف الخاص بك.
  •  نظرة موجزة على رابطة قواعد التنقيب.

التصنيفات: طرق متقدمة

  •  المصنِف القائم على القواعد.
  •  استخراج القواعد.
  •  أقرب الجيران.
  •  المصنِفات - حدود محددة.

الشبكات العصبية الاصطناعية

  •  الحدود وشروط الحدود واختيار المصنِف الصحيح.
  •  التجميع مقابل التصنيف.
  •  الكشف عن الانحرافات والشذوذ.