Feature Engineering with PySpark for Machine Learning

Learn to clean, transform, and prepare large-scale datasets for machine learning models using PySpark's powerful dataframe API and feature transformer tools.

4.8 (284) ⏱ 1 ชม. 9 นาที 📚 5 บทเรียน 🎧 เวอร์ชันเสียง

เกี่ยวกับคอร์สนี้

Real-world datasets are rarely clean or ready for machine learning algorithms, especially when working at scale. Mastering feature engineering with PySpark allows you to transform massive, messy data into high-quality inputs for predictive models. In this course, you will transition from working with small, curated datasets to manipulating big data with confidence. You will explore how to clean, structure, and engineer features using PySpark, ensuring your machine learning models have the best possible data to learn from. What you'll learn: - Understand the foundational concepts of distributed computing and PySpark dataframes. - Clean and preprocess large-scale datasets by handling missing values and outliers. - Transform categorical and numerical data using PySpark's native feature transformers. - Create advanced features using window functions and mathematical transformations. - Assemble features into vectors ready for machine learning pipelines. - Optimize PySpark operations to ensure efficient data processing at scale. You will start by mastering foundational PySpark operations and data cleaning techniques before moving on to advanced feature transformations and building structured preprocessing pipelines. This course is designed for aspiring data scientists, data analysts, and developers who want to learn how to prepare large datasets for machine learning. No prior experience with PySpark is required, though a basic understanding of Python is helpful. Start reading today to unlock the power of big data feature engineering.

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • 🎧 รวมเวอร์ชันเสียง
    เรียนได้ทุกที่ ไม่ต้องดูจอ
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 30 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    1 ชม. 9 นาที เนื้อหาเชิงปฏิบัติ

รีวิว (2)

Sophia Koch AT
★ 4 · 2025-12-26T20:57:23+00:00

เป็นการแนะนำที่ดี โครงสร้างส่วนใหญ่ชัดเจนดี แต่ก็อยากให้มีตัวอย่างในโลกจริงมากกว่านี้หน่อย แต่ก็ได้เรียนรู้อะไรเยอะเลย

Diego Flores CO
★ 4 · 2025-06-09T18:43:23+00:00

เป็นคอร์สที่ดีถ้ามีความรู้พื้นฐานอยู่บ้าง สำหรับผู้เริ่มต้นเลย บางแนวคิดอาจจะท้าทายไปหน่อย แต่โครงสร้างก็เป็นเหตุเป็นผลดีค่ะ

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

ผู้เรียนคนอื่นเรียน

Python Scripting: การสร้างระบบจัดการนายหน้าลูกค้า

พัฒนา ระบบจัดการบนคอนโซลที่ใช้งานได้จริง โดยใช้หลักการเขียนโปรแกรมเชิงวัตถุ (object-oriented principles) และตรรกะทางธุรกิจ (business logic) ของ Python เพื่อจัดการข้อมูลลูกค้าและการคำนวณค่าคอมมิชชั่น
★ 4.9 (14)
$4.99

การเขียนโปรแกรมภาษาไพธอนเชิงวิทยาศาสตร์: เรียนรู้โดยการแก้ไขปัญหาโปรเจคทางปฏิบัติ

สร้างพื้นฐานที่แข็งแกร่งในภาษาไพธอน และเรียนรู้ที่จะแก้ไขปัญหาทางวิทยาศาสตร์และข้อมูลที่ขับเคลื่อนด้วยโลกแห่งความเป็นจริง ใช้วิธีการเขียนโปรแกรมสมัยใหม่และฝึกฝนการเขียน
★ 4.8 (1,559)
$4.99

เขียนโค้ดภาษาไพธอนอย่างมีประสิทธิภาพ: พื้นฐานความเร็วและปรับปรุงประสิทธิภาพ

เรียนรู้วิธีการเขียนโค้ดภาษาไพธอนที่สะอาด เร็ว และประหยัดทรัพยากร โดยการทำโปรไฟล์การประมวลผล การปรับโครงสร้างข้อมูลให้เหมาะสม และใช้ประโยชน์จากการประมวลผลแบบเวกเตอร์
★ 4.8 (2,270)
$4.99

วิศวกรรมข้อมูลขนาดใหญ่ด้วยสกาล่า

สร้างแอพพลิเคชันข้อมูลกระจายโดยใช้ DataFrames, Spark SQL และ RDDs ในขณะที่เรียนรู้พื้นฐานการประมวลผลข้อมูลขนาดใหญ่ด้วย Scala
★ 4.8 (2,299)
$4.99

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe หรือคริปโต เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 30 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม