การสร้าง Batch Data Pipeline บน Google Cloud

เรียนรู้วิธีออกแบบ ปรับขนาด และจัดการเวิร์กโฟลว์ข้อมูลแบบแบตช์ที่แข็งแกร่งโดยใช้ Apache Beam, Spark และ BigQuery เพื่อขับเคลื่อนไปป์ไลน์วิเคราะห์ที่ทันสมัย

4.8 (16) ⏱ 1 ชม. 5 นาที 📚 11 บทเรียน

เกี่ยวกับคอร์สนี้

ธุรกิจสมัยใหม่ต้องอาศัยข้อมูลที่สะอาด เชื่อถือได้ และทันเวลาเพื่อทำการตัดสินใจที่สำคัญ การสร้างไปป์ไลน์แบตช์ที่มีประสิทธิภาพบนโครงสร้างพื้นฐานคลาวด์เป็นกุญแจสำคัญในการแปลงข้อมูลดิบให้เป็นข้อมูลเชิงลึกทางธุรกิจที่นำไปปฏิบัติได้ ในหลักสูตรแบบข้อความนี้ คุณจะได้เรียนรู้วิธีออกแบบ สร้าง และปรับปรุงเวิร์กโฟลว์ข้อมูลแบบแบตช์บน Google Cloud คุณจะได้เรียนรู้ตั้งแต่แนวคิดพื้นฐานเกี่ยวกับข้อมูลคลาวด์ไปจนถึงการนำการแปลงข้อมูลที่ปรับขนาดได้และการจัดการเวิร์กโฟลว์ไปป์ไลน์อัตโนมัติ สิ่งที่คุณจะได้เรียนรู้: - ทำความเข้าใจแนวคิดพื้นฐานของการประมวลผลข้อมูลแบบแบตช์และสถาปัตยกรรม Google Cloud - สร้างไปป์ไลน์ข้อมูลที่ปรับขนาดได้โดยใช้ Dataflow และ Apache Beam - ประมวลผลชุดข้อมูลขนาดใหญ่ด้วย Spark แบบไร้เซิร์ฟเวอร์บน Dataproc - จัดการและกำหนดเวลาเวิร์กโฟลว์อย่างมีประสิทธิภาพโดยใช้รูปแบบ Cloud Composer และ Airflow ที่ทันสมัย - ปรับปรุงประสิทธิภาพการจัดเก็บข้อมูลและการสอบถามโดยใช้การแบ่งพาร์ติชันและการจัดกลุ่มของ BigQuery หลักสูตรเริ่มต้นด้วยคำศัพท์ด้านวิศวกรรมข้อมูลที่จำเป็นและบริการ Google Cloud หลักก่อนที่จะเข้าสู่การพัฒนาไปป์ไลน์จริง คุณจะได้อ่านคำอธิบายที่ครอบคลุม ศึกษาตัวอย่างโค้ดที่สะอาด และตรวจสอบรูปแบบการออกแบบในโลกแห่งความเป็นจริงสำหรับการแปลงข้อมูล หลักสูตรนี้ออกแบบมาสำหรับวิศวกรข้อมูล นักวิเคราะห์ และนักพัฒนาที่ต้องการเริ่มต้นใช้งานไปป์ไลน์ข้อมูลคลาวด์ ไม่จำเป็นต้องมีประสบการณ์ด้านวิศวกรรมคลาวด์มาก่อน แม้ว่าความเข้าใจพื้นฐานเกี่ยวกับ SQL และ Python จะเป็นประโยชน์ก็ตาม เริ่มอ่านวันนี้เพื่อสร้างไปป์ไลน์แบตช์ที่เชื่อถือได้และพร้อมใช้งานบน Google Cloud

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 30 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    1 ชม. 5 นาที เนื้อหาเชิงปฏิบัติ

รีวิว

ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

ผู้เรียนคนอื่นเรียน

Elasticsearch: การจัดทำดัชนี, การสืบค้น และการปรับแต่งข้อมูล

เรียนรู้การจัดทำดัชนี, การสืบค้น และการปรับแต่งข้อมูลใน Elasticsearch อย่างมีประสิทธิภาพ ช่วยให้คุณสร้างโซลูชันการค้นหาและการวิเคราะห์ที่ทรงพลังได้
★ 5.0 (17)
$4.99

Snowflake Data Engineering Foundations

เรียนรู้วิธีออกแบบ สร้าง และจัดการ cloud data pipelines และ schemas ที่ปรับขนาดได้ โดยใช้ Snowflake SQL และหลักการ data warehousing สมัยใหม่
★ 4.9 (16)
$4.99

พื้นฐานของวิศวกรรมข้อมูล: ระบบท่อ, ระบบจัดเก็บ, และกระบวนการทำงาน

เรียนรู้ว่าข้อมูลไหลผ่านองค์กรสมัยใหม่อย่างไร โดยการสำรวจสถาปัตยกรรมท่อส่ง วิธีการจัดเก็บ และกระบวนการทำความสะอาดข้อมูล
★ 4.9 (1,002)
$4.99

ฐานข้อมูลการจัดเก็บข้อมูล: การออกแบบการแก้ไขข้อมูลสมัยใหม่

เรียนรู้หลักการพื้นฐานของการจัดเก็บข้อมูล โมเดลมิติ และสถาปัตยกรรมคลาวด์สมัยใหม่ เพื่อออกแบบฐานข้อมูลการวิเคราะห์ที่มีประสิทธิภาพ
★ 4.8 (4,475)
$4.99

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe หรือคริปโต เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 30 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม