วิศวกรรมไปป์ไลน์ข้อมูลแบบแบตช์ด้วย Dataflow และ Dataproc
ออกแบบและสร้างเวิร์กโฟลว์ ETL ที่ปรับขนาดได้โดยใช้เครื่องมือคลาวด์แบบไร้เซิร์ฟเวอร์เพื่อแปลงชุดข้อมูลขนาดใหญ่สำหรับระบบธุรกิจอัจฉริยะที่เชื่อถือได้
เกี่ยวกับคอร์สนี้
การประมวลผลชุดข้อมูลขนาดใหญ่ได้อย่างมีประสิทธิภาพเป็นหัวใจสำคัญของระบบธุรกิจอัจฉริยะและการรายงานที่ทันสมัย หลักสูตรนี้จะสอนวิธีเปลี่ยนจากการใช้สคริปต์ข้อมูลแบบง่ายๆ ไปสู่การออกแบบไปป์ไลน์แบบแบตช์ที่แข็งแกร่งและเป็นอัตโนมัติ ซึ่งสามารถจัดการกับการแปลงข้อมูลขนาดใหญ่ได้อย่างง่ายดาย คุณจะได้รับทักษะที่จำเป็นในการจัดการการเคลื่อนย้ายและการแปลงข้อมูลในขนาดใหญ่โดยใช้เทคโนโลยีคลาวด์มาตรฐานอุตสาหกรรม
สิ่งที่คุณจะได้เรียนรู้:
- ทำความเข้าใจแนวคิดพื้นฐานของวิศวกรรมข้อมูล รวมถึงรูปแบบ ETL/ELT และสถาปัตยกรรมประมวลผลแบบแบตช์
- สร้างงานประมวลผลข้อมูลแบบไร้เซิร์ฟเวอร์โดยใช้ Apache Beam บน Dataflow สำหรับการจัดการข้อมูลแบบรวมศูนย์
- กำหนดค่า Dataproc Serverless เพื่อรันแอปพลิเคชัน Spark โดยไม่จำเป็นต้องจัดการโครงสร้างพื้นฐานที่อยู่เบื้องหลัง
- ประยุกต์ใช้การตรวจสอบคุณภาพข้อมูลและรูปแบบการสังเกตการณ์เพื่อให้มั่นใจถึงความน่าเชื่อถือและความถูกต้องของไปป์ไลน์
- จัดการเวิร์กโฟลว์ที่ซับซ้อนและจัดการการพึ่งพาระหว่างขั้นตอนการประมวลผลข้อมูลต่างๆ
- ใช้การตรวจสอบและแจ้งเตือนที่ทันสมัยเพื่อระบุและแก้ไขข้อผิดพลาดของไปป์ไลน์เชิงรุก
หลักสูตรเริ่มต้นด้วยคำจำกัดความหลักและหลักการทางสถาปัตยกรรม ก่อนที่จะเข้าสู่กลยุทธ์การนำไปใช้งานจริงโดยใช้ตรรกะที่อิงตาม SQL และ Python คุณจะได้อ่านคำอธิบายโดยละเอียดเกี่ยวกับการออกแบบไปป์ไลน์และสำรวจวิธีการจัดโครงสร้างโค้ดเพื่อความสามารถในการบำรุงรักษาและประสิทธิภาพ โปรแกรมนี้ออกแบบมาสำหรับผู้เริ่มต้นในวิศวกรรมข้อมูลที่มีความเข้าใจพื้นฐานเกี่ยวกับ SQL และ Python และพร้อมที่จะนำทักษะเหล่านั้นไปใช้กับการประมวลผลข้อมูลขนาดคลาวด์ เริ่มสร้างไปป์ไลน์ข้อมูลที่พร้อมใช้งานจริงได้แล้ววันนี้
สิ่งที่คุณจะได้รับ
-
📜
ใบประกาศนียบัตร
เพิ่มในโปรไฟล์ LinkedIn ของคุณ -
🎧
รวมเวอร์ชันเสียง
เรียนได้ทุกที่ ไม่ต้องดูจอ -
♾️
เข้าถึงตลอดชีพ
กลับมาเรียนได้ตลอด ไม่มีหมดอายุ -
📱
โทรศัพท์หรือคอมพิวเตอร์
ใช้งานได้ทุกที่ ทุกอุปกรณ์ -
💸
คืนเงิน 30 วัน
ไม่ต้องอธิบาย -
⚡
กระชับและตรงประเด็น
57 นาที เนื้อหาเชิงปฏิบัติ
รีวิว
ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์
ผู้เรียนคนอื่นเรียน
เรียนรู้การจัดทำดัชนี, การสืบค้น และการปรับแต่งข้อมูลใน Elasticsearch อย่างมีประสิทธิภาพ ช่วยให้คุณสร้างโซลูชันการค้นหาและการวิเคราะห์ที่ทรงพลังได้
$4.99$9.99
เรียนรู้วิธีออกแบบ สร้าง และจัดการ cloud data pipelines และ schemas ที่ปรับขนาดได้ โดยใช้ Snowflake SQL และหลักการ data warehousing สมัยใหม่
$4.99$9.99
เรียนรู้ว่าข้อมูลไหลผ่านองค์กรสมัยใหม่อย่างไร โดยการสำรวจสถาปัตยกรรมท่อส่ง วิธีการจัดเก็บ และกระบวนการทำความสะอาดข้อมูล
$4.99$9.99
เรียนรู้หลักการพื้นฐานของการจัดเก็บข้อมูล โมเดลมิติ และสถาปัตยกรรมคลาวด์สมัยใหม่ เพื่อออกแบบฐานข้อมูลการวิเคราะห์ที่มีประสิทธิภาพ
$4.99$9.99
คำถามที่พบบ่อย
ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +
แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ
ฉันชำระเงินอย่างไร? +
ผ่านบัตรด้วย Stripe หรือคริปโต เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย
ฉันขอคืนเงินได้ไหม? +
ใช่ — คืนเงินเต็มจำนวนใน 30 วัน ไม่ต้องอธิบาย
ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +
ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด
ฉันจะได้ใบประกาศนียบัตรไหม? +
ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้
ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี
ดีไซน์
การเงิน
การตลาด
สาธารณสุข
การศึกษา
ธุรกิจการบริการ
อุตสาหกรรม