DataflowとDataprocによるバッチデータパイプラインエンジニアリング
サーバーレスクラウドツールを使用してスケーラブルなETLワークフローを設計・構築し、大規模なデータセットを変換して信頼性の高いビジネスインテリジェンスを実現します。
このコースについて
大規模なデータセットを効率的に処理することは、現代のビジネスインテリジェンスとレポート作成の根幹です。このコースでは、単純なデータスクリプトから、大規模な変換を容易に処理する堅牢で自動化されたバッチパイプラインの設計へと移行する方法を学びます。業界標準のクラウドテクノロジーを使用して、データ移動と変換を大規模に管理するために必要なスキルを習得します。
学習内容:
- ETL/ELTパターンやバッチ処理アーキテクチャを含む、データエンジニアリングの基礎概念を理解する
- Dataflow上のApache Beamを使用してサーバーレスデータ処理ジョブを構築し、統合されたデータ処理を実現する
- 基盤となるインフラストラクチャを管理することなくSparkアプリケーションを実行するためにDataproc Serverlessを構成する
- パイプラインの信頼性と正確性を確保するために、データ品質チェックと可観測性パターンを適用する
- 複雑なワークフローをオーケストレーションし、さまざまなデータ処理ステージ間の依存関係を管理する
- パイプラインの障害をプロアクティブに特定し解決するために、最新の監視とアラートを実装する
このコースは、SQLとPythonベースのロジックを使用した実践的な実装戦略に進む前に、コア定義とアーキテクチャ原則から始まります。パイプライン設計の詳細な説明を読み、保守性とパフォーマンスのためにコードを構造化する方法を探求します。このプログラムは、SQLとPythonの基本的な理解があり、それらのスキルをクラウドスケールのデータ処理に適用する準備ができているデータエンジニアリングの初心者向けに設計されています。今日から本番環境に対応したデータパイプラインの構築を始めましょう。
得られるもの
-
📜
修了証
LinkedInプロフィールに追加 -
🎧
音声版付き
画面なしでもどこでも学べる -
♾️
無期限アクセス
いつでも再開可能、有効期限なし -
📱
スマホでもPCでも
どこでもどんな端末でも -
💸
30日返金保証
理由を聞きません -
⚡
短く要点だけ
57分の実践的な内容
レビュー
まだレビューはありません — 最初の体験を共有しましょう。
他の受講者はこれも
Elasticsearch内でデータを効果的にインデックス作成、クエリ、最適化する方法を学び、強力な検索および分析ソリューションを構築できるようになります。
$4.99$9.99
Learn to design, build, and manage scalable cloud data pipelines and schemas using Snowflake SQL and modern data warehousing principles.
$4.99$9.99
プロフェッショナル向けに設計されたパイプラインアーキテクチャ、ストレージソリューション、データクリーニングプロセスを調べることにより、現代の組織におけるデータの流れを学ぶ。
$4.99$9.99
効率的な分析データベースを設計するためのデータウェアハウジング、次元モデリング、および最新のクラウドアーキテクチャの基本原理を学ぶ。
$4.99$9.99
よくある質問
このコースを受けるには何が必要ですか? +
インターネットに接続したスマホかパソコンだけ。インストールも特別な機材も不要です。
支払い方法は? +
Stripe経由のカード、または暗号通貨。カード情報は当社では保存せず、Stripeが安全に取り扱います。
返金できますか? +
はい — 30日以内なら理由を問わず全額返金。
いつまでアクセスできますか? +
ずっと。購入後はあなたのもの。いつでも見返せます。
修了証はもらえますか? +
はい。修了するとLinkedInプロフィールに追加できる修了証を受け取れます。
こんな分野の方に
テック
デザイン
金融
マーケティング
医療
教育
ホスピタリティ
製造業