พื้นฐาน PySpark: ประมวลผลข้อมูลขนาดใหญ่ด้วยภาษาไพทอน

เรียนรู้การประมวลผล, ถามคำถาม, และวิเคราะห์ชุดข้อมูลขนาดใหญ่ ด้วยการใช้ PySpark, ปรับเปลี่ยนทักษะภาษาไพทอนและ SQL ของคุณ ไปสู่สภาพแวดล้อมของข้อมูลขนาดใหญ่ที่กระจายอยู่

4.8 (2,385) ⏱ 1 ชม. 1 นาที 📚 10 บทเรียน 🎧 เวอร์ชันเสียง

เกี่ยวกับคอร์สนี้

เนื่องจากชุดข้อมูลมีขนาดใหญ่เกินกว่าที่เครื่องมือแบบดั้งเดิมจะจัดการได้ คอมพิวเตอร์แบบกระจายตัวจึงกลายเป็นสิ่งที่จำเป็นสำหรับผู้เชี่ยวชาญด้านข้อมูลในปัจจุบัน หลักสูตรแบบข้อความนี้จะแนะนำให้คุณรู้จักกับ PySpark ซึ่งเป็น Python API สำหรับ Spark ซึ่งจะช่วยให้คุณสามารถประมวลผลและวิเคราะห์ชุดข้อมูลขนาดใหญ่ได้อย่างรวดเร็วและมีประสิทธิภาพ คุณจะเรียนรู้การเปลี่ยนแปลงจากเครื่องเดียวในการประมวลผลข้อมูลไปสู่กระบวนการทำงานของข้อมูลขนาดใหญ่ที่กระจายออกไป ด้วยการอ่านคำอธิบายที่ชัดเจนและฝึกฝนกับโค้ดสนิทของโลกจริง คุณจะเรียนรู้หลักการพื้นฐานของการจัดเก็บข้อมูลที่กระจายออกไป การประมวลผลคำถาม และการจัดการข้อมูล คุณจะเรียนรู้อะไร - เข้าใจพื้นฐานของการกระจายคอมพิวเตอร์ สถาปัตยกรรมสปาร์ค และการเปลี่ยนแปลงจากห้องสมุดข้อมูลแบบดั้งเดิม - สร้างและจัดการ Resilient Distributed Datasets (RDDs) และ Spark DataFrames ที่มีประสิทธิภาพสูง - ถามข้อมูลขนาดใหญ่โดยใช้ Spark SQL เพื่อเรียกใช้คำถามที่คุ้นเคยกับข้อมูลที่กระจาย - ใช้ Pandas API สมัยใหม่บน Spark เพื่อปรับขนาดกระบวนการทำงาน Pandas ที่มีอยู่ให้เหมาะสมกับ Big Data - ปรับปรุงประสิทธิภาพการประมวลผลข้อมูล ใช้แคช, การแบ่งแยก, และคำจำกัดความของสคีมาที่มีประสิทธิภาพ - สำรวจพื้นฐานของการสตรีมแบบมีโครงสร้าง สำหรับการประมวลผลข้อมูลแบบทันที หลักสูตรนี้เริ่มต้นด้วยคำศัพท์พื้นฐานของ big data และโครงสร้างหลักของ Spark ก่อนที่จะย้ายไปยังการปฏิบัติการ DataFrame และคำถาม SQL อย่างเป็นจริงเป็นจัง จากนั้นคุณจะก้าวไปสู่เทคนิคการปรับปรุงประสิทธิภาพและ API สำหรับการปรับขนาดข้อมูลสมัยใหม่ผ่านการอธิบายแบบเขียนและแบบฝึกหัดโค้ด หลักสูตรนี้ถูกออกแบบมาสำหรับวิศวกรข้อมูลมือใหม่, นักวิเคราะห์ข้อมูล, และนักพัฒนาภาษาไพธอนที่ต้องการเข้าสู่โลกของข้อมูลขนาดใหญ่ ไม่จำเป็นต้องมีประสบการณ์ก่อนหน้านี้กับระบบกระจายข้อมูล, ถึงแม้ว่าความเข้าใจพื้นฐานของภาษาไพธอนและ SQL จะช่วยได้ เริ่มอ่านวันนี้ เพื่อปลดล็อคพลังของการกระจายการคำนวณ และปรับขนาดทักษะการประมวลผลข้อมูลของคุณ

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • 🎧 รวมเวอร์ชันเสียง
    เรียนได้ทุกที่ ไม่ต้องดูจอ
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 30 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    1 ชม. 1 นาที เนื้อหาเชิงปฏิบัติ

รีวิว (4)

Mateo Torres UY ผู้เรียนที่ยืนยันแล้ว
★ 3 · 2026-03-01T20:20:24+00:00

บทนำใช้ได้เลย โครงสร้างสมเหตุสมผลดี แต่แอบอยากให้มีแบบฝึกหัดมากกว่าตัวอย่างพื้นฐานนะ

جميلة بن حسن TN ผู้เรียนที่ยืนยันแล้ว
★ 4 · 2026-03-01T05:16:24+00:00

ค่อนข้างให้ข้อมูลดี ชอบตัวอย่างการนำไปใช้จริง แต่การตั้งค่าเริ่มต้นใช้เวลานานกว่าที่คิด

Chernet Mekonnen ET ผู้เรียนที่ยืนยันแล้ว
★ 5 · 2026-01-05T06:03:24+00:00

สนุกกับคอร์สนี้มากจริงๆ วิธีการนำเสนอข้อมูลยอดเยี่ยม และมีการเน้นการนำไปใช้จริงอย่างมีประสิทธิภาพ ทำได้ดีมาก!

Олександр Коваленко UA ผู้เรียนที่ยืนยันแล้ว
★ 2 · 2024-12-18T10:12:24+00:00

เป็นการแนะนำที่ดีพอสมควรค่ะ น่าจะมีตัวอย่างที่หลากหลายกว่านี้ และการเชื่อมโยงระหว่างบทเรียนน่าจะดีขึ้นนิดหน่อย

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

ผู้เรียนคนอื่นเรียน

Python Scripting: การสร้างระบบจัดการนายหน้าลูกค้า

พัฒนา ระบบจัดการบนคอนโซลที่ใช้งานได้จริง โดยใช้หลักการเขียนโปรแกรมเชิงวัตถุ (object-oriented principles) และตรรกะทางธุรกิจ (business logic) ของ Python เพื่อจัดการข้อมูลลูกค้าและการคำนวณค่าคอมมิชชั่น
★ 4.9 (14)
$4.99

การเขียนโปรแกรมภาษาไพธอนเชิงวิทยาศาสตร์: เรียนรู้โดยการแก้ไขปัญหาโปรเจคทางปฏิบัติ

สร้างพื้นฐานที่แข็งแกร่งในภาษาไพธอน และเรียนรู้ที่จะแก้ไขปัญหาทางวิทยาศาสตร์และข้อมูลที่ขับเคลื่อนด้วยโลกแห่งความเป็นจริง ใช้วิธีการเขียนโปรแกรมสมัยใหม่และฝึกฝนการเขียน
★ 4.8 (1,559)
$4.99

เขียนโค้ดภาษาไพธอนอย่างมีประสิทธิภาพ: พื้นฐานความเร็วและปรับปรุงประสิทธิภาพ

เรียนรู้วิธีการเขียนโค้ดภาษาไพธอนที่สะอาด เร็ว และประหยัดทรัพยากร โดยการทำโปรไฟล์การประมวลผล การปรับโครงสร้างข้อมูลให้เหมาะสม และใช้ประโยชน์จากการประมวลผลแบบเวกเตอร์
★ 4.8 (2,270)
$4.99

วิศวกรรมข้อมูลขนาดใหญ่ด้วยสกาล่า

สร้างแอพพลิเคชันข้อมูลกระจายโดยใช้ DataFrames, Spark SQL และ RDDs ในขณะที่เรียนรู้พื้นฐานการประมวลผลข้อมูลขนาดใหญ่ด้วย Scala
★ 4.8 (2,299)
$4.99

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe หรือคริปโต เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 30 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม