การวิเคราะห์ข้อมูลขนาดใหญ่ด้วย PySpark และ Python

ประมวลผลชุดข้อมูลขนาดใหญ่ เขียนคำถามที่มีประสิทธิภาพ และสร้างระบบการเรียนรู้เครื่องที่ปรับขนาดได้ ด้วยการใช้ Python และ Spark DataFrames

4.4 (1,239) ⏱ 36 นาที 📚 10 บทเรียน 🎧 เวอร์ชันเสียง

เกี่ยวกับคอร์สนี้

ข้อมูลเติบโตเร็วกว่าที่เคยเป็นมา และเครื่องมือวิเคราะห์มาตรฐานมักจะลำบากในการตามทันกับปริมาณข้อมูล PySpark ให้บริการเครื่องมือการคำนวณแบบกระจายอำนาจที่ทรงพลัง ซึ่งช่วยให้คุณสามารถประมวลผลชุดข้อมูลขนาดใหญ่ได้ โดยใช้ภาษาโปรแกรม Python ที่คุ้นเคย หลักสูตรนี้จะพาคุณไปจากแนวคิดพื้นฐานของ Python ไปสู่การสร้างระบบ Big Data Pipeline ที่แข็งแกร่ง คุณจะอ่านผ่านสถานการณ์ทางปฏิบัติ ใช้วิศวกรรมข้อมูลในโลกจริงและเทคนิคการเรียนรู้ของเครื่อง ในการดึงความรู้ที่มีค่าออกมาจากข้อมูลขนาดใหญ่ โดยไม่ต้องพึ่งพาโครงสร้างที่ซับซ้อนและล้าสมัย คุณจะเรียนรู้อะไร - เข้าใจโครงสร้างพื้นฐานของการกระจายการคำนวณและสปาร์คคลัสเตอร์ - เขียนโค้ดภาษาไพธอนที่เชื่อถือได้ ใช้วิธีการสมัยใหม่ เช่น ระบบเสมือน และคำแนะนำการพิมพ์ - ประมวลผลและแปลงชุดข้อมูลขนาดใหญ่อย่างมีประสิทธิภาพโดยใช้ Spark DataFrames และ Spark SQL - สร้างระบบการเรียนรู้เครื่องที่ปรับขนาดได้ ใช้ไลบรารี MLlib - ใช้รูปแบบวิศวกรรมข้อมูลสมัยใหม่ รวมถึงแนวคิดพื้นฐานของเดลต้าเลค - วิเคราะห์ข้อมูลที่ไหลต่อเนื่อง ใช้สปาร์คสตรีม - ฝึกทักษะของคุณ ผ่านการเขียนแบบจำลอง โครงการที่ปรึกษา และฝึกปฏิบัติการเขียนโค้ด เริ่มต้นด้วยคำศัพท์พื้นฐานของ big data และบทวิจารณ์พื้นฐานของ Python ก่อนที่จะย้ายไปสู่สถาปัตยกรรมการกระจายของ Spark จากนั้นคุณจะพัฒนาผ่านการประมวลผลข้อมูลที่มีโครงสร้าง, การเรียนรู้ของเครื่องและสตรีม, นำไปสู่การฝึกอบรมทางปฏิบัติที่จำลองงานที่ปรึกษาข้อมูลในโลกจริง ออกแบบมาสำหรับผู้เริ่มต้น โดยเฉพาะ หลักสูตรนี้ไม่จำเป็นต้องมีประสบการณ์ก่อนหน้า ทำให้เป็นจุดเริ่มต้นที่สมบูรณ์แบบ สำหรับนักวิเคราะห์ข้อมูลและวิศวกร เริ่มอ่านวันนี้เพื่อสร้างทักษะพื้นฐานที่จำเป็น ในการรับมือกับความท้าทายของข้อมูลขนาดใหญ่ที่ซับซ้อน

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 🎧 รวมเวอร์ชันเสียง
    เรียนได้ทุกที่ ไม่ต้องดูจอ
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 30 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    36 นาที เนื้อหาเชิงปฏิบัติ

รีวิว (6)

Benjamin Wilson US
★ 5 · 2026-05-18T10:17:52+00:00

คอร์สนี้ยอดเยี่ยมมาก ตัวอย่างตรงประเด็น ช่วยให้เข้าใจเนื้อหาได้ดีขึ้นมากจริงๆ ความเข้าใจของฉันดีขึ้นเยอะเลย

Tsegaye Endale ET ผู้เรียนที่ยืนยันแล้ว
★ 5 · 2026-05-11T09:56:52+00:00

เนื้อหาดีเลยค่ะ แม้ว่าบางโมดูลอาจจะลงรายละเอียดได้มากกว่านี้ แต่โดยรวมแล้วคุ้มค่าและนำไปใช้ได้จริง ทำได้ดีค่ะ!

Daniel White US
★ 3 · 2026-04-29T23:12:52+00:00

เป็นการแนะนำที่ดีพอสมควรค่ะ น่าจะมีตัวอย่างที่หลากหลายกว่านี้ และการเชื่อมโยงระหว่างบทเรียนน่าจะดีขึ้นนิดหน่อย

Bilal Ahmed PK
★ 5 · 2025-11-13T05:28:52+00:00

ชอบการดำเนินเรื่องของคอร์สนี้มาก การนำไปใช้จริงที่พูดถึงก็ตรงเป๊ะ คอร์สดีมาก!

Pari Singh SG ผู้เรียนที่ยืนยันแล้ว
★ 5 · 2025-10-29T08:14:52+00:00

เป็นคอร์สที่ดีเลยครับ โครงสร้างสมเหตุสมผล ตัวอย่างส่วนใหญ่มีประโยชน์ แต่อาจจะต้องมีสถานการณ์จริงเพิ่มอีกหน่อย

فؤاد بن أحمد TN ผู้เรียนที่ยืนยันแล้ว
★ 4 · 2024-12-26T12:03:52+00:00

ค่อนข้างให้ข้อมูลดี ชอบตัวอย่างการนำไปใช้จริง แต่การตั้งค่าเริ่มต้นใช้เวลานานกว่าที่คิด

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

ผู้เรียนคนอื่นเรียน

Python Scripting: การสร้างระบบจัดการนายหน้าลูกค้า

พัฒนา ระบบจัดการบนคอนโซลที่ใช้งานได้จริง โดยใช้หลักการเขียนโปรแกรมเชิงวัตถุ (object-oriented principles) และตรรกะทางธุรกิจ (business logic) ของ Python เพื่อจัดการข้อมูลลูกค้าและการคำนวณค่าคอมมิชชั่น
★ 4.9 (14)
$4.99$9.99

การเขียนโปรแกรมภาษาไพธอนเชิงวิทยาศาสตร์: เรียนรู้โดยการแก้ไขปัญหาโปรเจคทางปฏิบัติ

สร้างพื้นฐานที่แข็งแกร่งในภาษาไพธอน และเรียนรู้ที่จะแก้ไขปัญหาทางวิทยาศาสตร์และข้อมูลที่ขับเคลื่อนด้วยโลกแห่งความเป็นจริง ใช้วิธีการเขียนโปรแกรมสมัยใหม่และฝึกฝนการเขียน
★ 4.8 (1,559)
$4.99$9.99

เขียนโค้ดภาษาไพธอนอย่างมีประสิทธิภาพ: พื้นฐานความเร็วและปรับปรุงประสิทธิภาพ

เรียนรู้วิธีการเขียนโค้ดภาษาไพธอนที่สะอาด เร็ว และประหยัดทรัพยากร โดยการทำโปรไฟล์การประมวลผล การปรับโครงสร้างข้อมูลให้เหมาะสม และใช้ประโยชน์จากการประมวลผลแบบเวกเตอร์
★ 4.8 (2,270)
$4.99$9.99

วิศวกรรมข้อมูลขนาดใหญ่ด้วยสกาล่า

สร้างแอพพลิเคชันข้อมูลกระจายโดยใช้ DataFrames, Spark SQL และ RDDs ในขณะที่เรียนรู้พื้นฐานการประมวลผลข้อมูลขนาดใหญ่ด้วย Scala
★ 4.8 (2,299)
$4.99$9.99

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe หรือคริปโต เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 30 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม