PySpark Essentials: ประมวลผลและวิเคราะห์ข้อมูลขนาดใหญ่ด้วยภาษาไพธอน

เปลี่ยนทักษะภาษาไพธอนและ SQL ของคุณเป็น PySpark เพื่อทำความสะอาด, รวบรวม และวิเคราะห์ชุดข้อมูลขนาดใหญ่ ด้วยกระบวนการทำงานข้อมูลขนาดใหญ่สมัยใหม่

4.5 (8,727) ⏱ 36 นาที 📚 12 บทเรียน 🎧 เวอร์ชันเสียง

เกี่ยวกับคอร์สนี้

เนื่องจากชุดข้อมูลมีขนาดใหญ่เกินไปสำหรับเครื่องมือแบบดั้งเดิม เช่น Pandas การประมวลผลข้อมูลขนาดใหญ่จึงกลายเป็นทักษะที่จำเป็นสำหรับผู้เชี่ยวชาญด้านข้อมูลใด ๆ PySpark ผสมผสานความเรียบง่ายของ Python กับพลังของ Spark เพื่อจัดการการวิเคราะห์ข้อมูลขนาดใหญ่ได้อย่างราบรื่น หลักสูตรแบบข้อความนี้จะช่วยให้คุณสามารถปรับเปลี่ยนทักษะการจัดการข้อมูลของคุณไปสู่สภาพแวดล้อมการคำนวณแบบกระจายตัวได้ คุณจะมีความมั่นใจในการโหลด ทำความสะอาด เปลี่ยนแปลง และส่งออกข้อมูลขนาดใหญ่ โดยใช้วิธีการทำงานแบบ PySpark สมัยใหม่ คุณจะเรียนรู้อะไร - เข้าใจโครงสร้างพื้นฐานของสปาร์ค และวิธีการทำงานของการกระจายการคำนวณ - อ่านและเขียนข้อมูลจากรูปแบบต่าง ๆ รวมถึง CSV, JSON และแฟ้ม Parquet สมัยใหม่ - ทำความสะอาดและแปลงชุดข้อมูลโดยการจัดการค่าที่ขาดหายไป, การกรองบรรทัด, และเปลี่ยนชื่อคอลัมน์ - รวบรวมและแก้ไขข้อมูลโดยใช้ PySpark DataFrame API และคำถาม Spark SQL - ใช้วิธีการที่ดีที่สุด เช่นการเพิ่มประสิทธิภาพ Pandas API บน Spark สำหรับการเปลี่ยนแปลงอย่างราบรื่น คุณจะเริ่มจากการเรียนรู้หลักการและคำศัพท์ก่อนที่จะลงไปในเทคนิคการจัดการข้อมูลที่ใช้ได้จริง ผ่านการอธิบายเป็นข้อความและโค้ดที่ชัดเจน คุณจะพัฒนาจากการโหลดข้อมูลพื้นฐานไปสู่การรวมข้อมูลที่ซับซ้อนและเขียนผลลัพธ์ที่ปรับปรุงแล้ว หลักสูตรนี้ออกแบบมาสำหรับผู้เริ่มต้นในการทำงานกับข้อมูลขนาดใหญ่ รวมถึงนักวิเคราะห์ข้อมูลและนักพัฒนาภาษาไพธอนที่ต้องการขยายความสามารถในการประมวลผลข้อมูลของตน โดยไม่ต้องมีประสบการณ์ก่อนหน้านี้กับสปาร์ค เริ่มอ่านวันนี้เพื่อปลดล็อคพลังของ big data ด้วย PySpark

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • 🎧 รวมเวอร์ชันเสียง
    เรียนได้ทุกที่ ไม่ต้องดูจอ
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 30 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    36 นาที เนื้อหาเชิงปฏิบัติ

รีวิว (7)

Idris Lawal NG
★ 3 · 2026-04-14T12:53:52+00:00

การออกแบบคอร์สยอดเยี่ยมมาก แนวคิดต่างๆ เชื่อมโยงกันได้อย่างลงตัว ใช้งานได้จริงและอธิบายได้ดีมาก

লায়লা বেগম BD ผู้เรียนที่ยืนยันแล้ว
★ 5 · 2026-02-06T10:35:52+00:00

ว้าว คอร์สนี้เกินความคาดหมายไปมากเลยค่ะ ข้อมูลนำเสนอได้ชัดเจนมาก และนำไปใช้ได้จริงเยอะมาก

مريم الكندري KW ผู้เรียนที่ยืนยันแล้ว
★ 5 · 2025-06-24T16:58:52+00:00

คอร์สนี้เกินความคาดหมายไปมาก! ตัวอย่างเข้าใจง่ายและช่วยให้เห็นภาพรวมของเนื้อหาได้ชัดเจน สนุกมากเลย

Camila Sánchez AR ผู้เรียนที่ยืนยันแล้ว
★ 4 · 2025-06-06T19:02:52+00:00

อันนี้ช่วยให้เข้าใจคอนเซ็ปต์หลักๆ ได้ดีขึ้นจริงๆ การอธิบายยอดเยี่ยม ตัวอย่างก็เห็นภาพชัดเจน ชอบมาก!

Eva Palková SK ผู้เรียนที่ยืนยันแล้ว
★ 3 · 2025-04-10T09:22:52+00:00

เป็นการแนะนำที่ดีค่ะ ชอบขั้นตอนที่ชัดเจน แม้ว่าโมดูลหลังๆ น่าจะมีตัวอย่างมากกว่านี้อีกหน่อย

Hannah Meyer AT
★ 4 · 2025-03-15T17:14:52+00:00

เป็นการแนะนำที่ดีพอสมควรค่ะ น่าจะมีตัวอย่างที่หลากหลายกว่านี้ และการเชื่อมโยงระหว่างบทเรียนน่าจะดีขึ้นนิดหน่อย

Axel Jónasson IS ผู้เรียนที่ยืนยันแล้ว
★ 4 · 2025-01-27T07:50:52+00:00

ดีใจมากที่ได้เรียนคอร์สนี้ การแบ่งย่อยเนื้อหาทำให้เข้าใจง่ายมาก คุ้มค่ากับความพยายามที่ลงไป

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

ผู้เรียนคนอื่นเรียน

Python Scripting: การสร้างระบบจัดการนายหน้าลูกค้า

พัฒนา ระบบจัดการบนคอนโซลที่ใช้งานได้จริง โดยใช้หลักการเขียนโปรแกรมเชิงวัตถุ (object-oriented principles) และตรรกะทางธุรกิจ (business logic) ของ Python เพื่อจัดการข้อมูลลูกค้าและการคำนวณค่าคอมมิชชั่น
★ 4.9 (14)
$4.99

การเขียนโปรแกรมภาษาไพธอนเชิงวิทยาศาสตร์: เรียนรู้โดยการแก้ไขปัญหาโปรเจคทางปฏิบัติ

สร้างพื้นฐานที่แข็งแกร่งในภาษาไพธอน และเรียนรู้ที่จะแก้ไขปัญหาทางวิทยาศาสตร์และข้อมูลที่ขับเคลื่อนด้วยโลกแห่งความเป็นจริง ใช้วิธีการเขียนโปรแกรมสมัยใหม่และฝึกฝนการเขียน
★ 4.8 (1,559)
$4.99

เขียนโค้ดภาษาไพธอนอย่างมีประสิทธิภาพ: พื้นฐานความเร็วและปรับปรุงประสิทธิภาพ

เรียนรู้วิธีการเขียนโค้ดภาษาไพธอนที่สะอาด เร็ว และประหยัดทรัพยากร โดยการทำโปรไฟล์การประมวลผล การปรับโครงสร้างข้อมูลให้เหมาะสม และใช้ประโยชน์จากการประมวลผลแบบเวกเตอร์
★ 4.8 (2,270)
$4.99

วิศวกรรมข้อมูลขนาดใหญ่ด้วยสกาล่า

สร้างแอพพลิเคชันข้อมูลกระจายโดยใช้ DataFrames, Spark SQL และ RDDs ในขณะที่เรียนรู้พื้นฐานการประมวลผลข้อมูลขนาดใหญ่ด้วย Scala
★ 4.8 (2,299)
$4.99

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe หรือคริปโต เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 30 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม