วิศวกรรมไปป์ไลน์ข้อมูลแบบแบตช์ด้วย Dataflow และ Dataproc

ออกแบบและสร้างเวิร์กโฟลว์ ETL ที่ปรับขนาดได้โดยใช้เครื่องมือคลาวด์แบบไร้เซิร์ฟเวอร์เพื่อแปลงชุดข้อมูลขนาดใหญ่สำหรับระบบธุรกิจอัจฉริยะที่เชื่อถือได้

4.4 (30) ⏱ 57 นาที 📚 12 บทเรียน 🎧 เวอร์ชันเสียง

เกี่ยวกับคอร์สนี้

การประมวลผลชุดข้อมูลขนาดใหญ่ได้อย่างมีประสิทธิภาพเป็นหัวใจสำคัญของระบบธุรกิจอัจฉริยะและการรายงานที่ทันสมัย หลักสูตรนี้จะสอนวิธีเปลี่ยนจากการใช้สคริปต์ข้อมูลแบบง่ายๆ ไปสู่การออกแบบไปป์ไลน์แบบแบตช์ที่แข็งแกร่งและเป็นอัตโนมัติ ซึ่งสามารถจัดการกับการแปลงข้อมูลขนาดใหญ่ได้อย่างง่ายดาย คุณจะได้รับทักษะที่จำเป็นในการจัดการการเคลื่อนย้ายและการแปลงข้อมูลในขนาดใหญ่โดยใช้เทคโนโลยีคลาวด์มาตรฐานอุตสาหกรรม สิ่งที่คุณจะได้เรียนรู้: - ทำความเข้าใจแนวคิดพื้นฐานของวิศวกรรมข้อมูล รวมถึงรูปแบบ ETL/ELT และสถาปัตยกรรมประมวลผลแบบแบตช์ - สร้างงานประมวลผลข้อมูลแบบไร้เซิร์ฟเวอร์โดยใช้ Apache Beam บน Dataflow สำหรับการจัดการข้อมูลแบบรวมศูนย์ - กำหนดค่า Dataproc Serverless เพื่อรันแอปพลิเคชัน Spark โดยไม่จำเป็นต้องจัดการโครงสร้างพื้นฐานที่อยู่เบื้องหลัง - ประยุกต์ใช้การตรวจสอบคุณภาพข้อมูลและรูปแบบการสังเกตการณ์เพื่อให้มั่นใจถึงความน่าเชื่อถือและความถูกต้องของไปป์ไลน์ - จัดการเวิร์กโฟลว์ที่ซับซ้อนและจัดการการพึ่งพาระหว่างขั้นตอนการประมวลผลข้อมูลต่างๆ - ใช้การตรวจสอบและแจ้งเตือนที่ทันสมัยเพื่อระบุและแก้ไขข้อผิดพลาดของไปป์ไลน์เชิงรุก หลักสูตรเริ่มต้นด้วยคำจำกัดความหลักและหลักการทางสถาปัตยกรรม ก่อนที่จะเข้าสู่กลยุทธ์การนำไปใช้งานจริงโดยใช้ตรรกะที่อิงตาม SQL และ Python คุณจะได้อ่านคำอธิบายโดยละเอียดเกี่ยวกับการออกแบบไปป์ไลน์และสำรวจวิธีการจัดโครงสร้างโค้ดเพื่อความสามารถในการบำรุงรักษาและประสิทธิภาพ โปรแกรมนี้ออกแบบมาสำหรับผู้เริ่มต้นในวิศวกรรมข้อมูลที่มีความเข้าใจพื้นฐานเกี่ยวกับ SQL และ Python และพร้อมที่จะนำทักษะเหล่านั้นไปใช้กับการประมวลผลข้อมูลขนาดคลาวด์ เริ่มสร้างไปป์ไลน์ข้อมูลที่พร้อมใช้งานจริงได้แล้ววันนี้

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 🎧 รวมเวอร์ชันเสียง
    เรียนได้ทุกที่ ไม่ต้องดูจอ
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 30 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    57 นาที เนื้อหาเชิงปฏิบัติ

รีวิว

ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

ผู้เรียนคนอื่นเรียน

Elasticsearch: การจัดทำดัชนี, การสืบค้น และการปรับแต่งข้อมูล

เรียนรู้การจัดทำดัชนี, การสืบค้น และการปรับแต่งข้อมูลใน Elasticsearch อย่างมีประสิทธิภาพ ช่วยให้คุณสร้างโซลูชันการค้นหาและการวิเคราะห์ที่ทรงพลังได้
★ 5.0 (17)
$4.99$9.99

Snowflake Data Engineering Foundations

เรียนรู้วิธีออกแบบ สร้าง และจัดการ cloud data pipelines และ schemas ที่ปรับขนาดได้ โดยใช้ Snowflake SQL และหลักการ data warehousing สมัยใหม่
★ 4.9 (16)
$4.99$9.99

พื้นฐานของวิศวกรรมข้อมูล: ระบบท่อ, ระบบจัดเก็บ, และกระบวนการทำงาน

เรียนรู้ว่าข้อมูลไหลผ่านองค์กรสมัยใหม่อย่างไร โดยการสำรวจสถาปัตยกรรมท่อส่ง วิธีการจัดเก็บ และกระบวนการทำความสะอาดข้อมูล
★ 4.9 (1,002)
$4.99$9.99

ฐานข้อมูลการจัดเก็บข้อมูล: การออกแบบการแก้ไขข้อมูลสมัยใหม่

เรียนรู้หลักการพื้นฐานของการจัดเก็บข้อมูล โมเดลมิติ และสถาปัตยกรรมคลาวด์สมัยใหม่ เพื่อออกแบบฐานข้อมูลการวิเคราะห์ที่มีประสิทธิภาพ
★ 4.8 (4,475)
$4.99$9.99

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe หรือคริปโต เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 30 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม