تصميم وتنفيذ خط أنابيب Apache Spark ETL
تعلم بناء وتحسين وإدارة خطوط أنابيب البيانات القابلة للتطوير باستخدام PySpark و Hadoop لبدء رحلتك في هندسة البيانات.
حول هذه الدورة
تنتج المؤسسات الحديثة كميات هائلة من البيانات، مما يجعل تكامل البيانات وتحويلها بكفاءة مهارة حاسمة لأي متخصص بيانات طموح. Apache Spark هو المعيار الصناعي لمعالجة مجموعات البيانات الكبيرة بسرعة وموثوقية.
يرشدك هذا المساق المكتوب خلال المفاهيم الأساسية والخطوات العملية اللازمة لتصميم وتنفيذ ومراقبة خطوط أنابيب قوية للاستخراج والتحويل والتحميل (ETL). ستنتقل من فهم مصطلحات هندسة البيانات الأساسية إلى بناء خطوط أنابيب منظمة تقوم بتنظيف وتجميع وتحميل البيانات في أنظمة التخزين الحديثة.
ما ستتعلمه:
- فهم بنية Apache Spark الأساسية و DataFrames ومكونات النظام البيئي.
- استخراج البيانات من مصادر متنوعة بما في ذلك قواعد البيانات العلائقية مثل MySQL والملفات المسطحة.
- تحويل مجموعات البيانات باستخدام وظائف PySpark للتصفية والربط والتجميع.
- تحميل البيانات المعالجة بكفاءة في قواعد البيانات المستهدفة وتنسيقات التخزين الحديثة مثل Parquet.
- تطبيق تقنيات التحسين لتحسين أداء خط الأنابيب واستخدام الموارد.
- تكوين وهيكلة بيئة مشروع هندسة بيانات نظيفة وقابلة للصيانة.
تبدأ الرحلة بتعريفات أساسية وإعداد البيئة، مما يضمن أساسًا مفاهيميًا قويًا. ستنتقل بعد ذلك عبر شروحات مكتوبة خطوة بخطوة وتحليل للكود لبناء وتشغيل خط أنابيب ETL وظيفي وشامل.
تم تصميم هذه الدورة للمبتدئين الذين يرغبون في دخول مجال هندسة البيانات؛ لا يلزم وجود خبرة سابقة مع Apache Spark، على الرغم من أن الفهم الأساسي لـ Python مفيد.
ابدأ القراءة اليوم لبناء أول خط أنابيب بيانات قابل للتطوير.
ما الذي ستحصل عليه
-
📜
شهادة إتمام
أضفها إلى ملفك على LinkedIn -
🎧
النسخة الصوتية مضمَّنة
تعلَّم أثناء تنقُّلك — دون شاشة -
♾️
وصول مدى الحياة
عُد متى شئت، بلا انتهاء -
📱
الهاتف أو الكمبيوتر
يعمل في أي مكان وعلى أي جهاز -
💸
استرداد خلال 30 يومًا
دون أسئلة -
⚡
قصير ومركَّز
1 ساعة 54 دقيقة من المحتوى التطبيقي
المراجعات
لا توجد مراجعات بعد — كن أول من يشارك تجربته.
المتعلمون أخذوا أيضًا
تعلم كيفية الفهرسة الفعالة، والاستعلام، والاستفادة المثلى من البيانات داخل Elasticsearch، مما يمكنك من بناء حلول بحث وتحليل قوية.
$4.99$9.99
تعلم تصميم وبناء وإدارة خطوط أنابيب البيانات السحابية والقوالب القابلة للتطوير باستخدام Snowflake SQL ومبادئ مستودعات البيانات الحديثة.
$4.99$9.99
تعلم كيفية تدفق البيانات عبر المنظمات الحديثة عن طريق استكشاف هياكل أنابيب النقل، وحلول التخزين، وعمليات تنظيف البيانات المصممة للمهنيين الطموحين.
$4.99$9.99
تعلم المبادئ الأساسية لتخزين البيانات، والنمذجة الأبعادية، والبنيات السحابية الحديثة لتصميم قواعد بيانات تحليلية فعالة.
$4.99$9.99
الأسئلة الشائعة
ما الذي أحتاجه لأخذ هذه الدورة؟ +
يكفي هاتف أو كمبيوتر متصل بالإنترنت. بدون تثبيتات أو أجهزة خاصة.
كيف يمكنني الدفع؟ +
بالبطاقة عبر Stripe أو بالعملات الرقمية. لا نخزن بيانات البطاقة — يتولى Stripe ذلك بأمان.
هل يمكنني استرداد المال؟ +
نعم — استرداد كامل خلال 30 يومًا، دون أسئلة.
إلى متى يستمر وصولي؟ +
إلى الأبد. بمجرد الشراء، الدورة لك تعود إليها متى شئت.
هل سأحصل على شهادة؟ +
نعم. عند الإتمام ستحصل على شهادة يمكنك إضافتها إلى ملفك في LinkedIn.
مصمَّم للعاملين في
التقنية
التصميم
المالية
التسويق
الرعاية الصحية
التعليم
الضيافة
التصنيع