かなり有益でした。実践的な応用例は気に入りましたが、最初のセットアップに予想以上に時間がかかりました。
ビッグデータ分析用のScalaとSpark
Scala の関数型プログラミングと Apache Spark の分散コンピューティングエンジンを組み合わせて大規模なデータセットを処理する方法を学びます。
このコースについて
データセットが単一のマシンにとって大きくなるにつれて、現代の開発者とデータエンジニアは伝統的なローカル処理から分散コンピューティングへの移行を迫られている。このテキストベースのコースでは、ビッグデータ処理の核となる概念を説明し、Scalaのエレガントで機能的なパラダイムを用いて、Apache Sparkの速度を活用する方法を示します。
基本的なローカルコードの書き方からクラスタ間で拡張可能なロバストな分散データパイプラインの設計へと移行する。明確な概念的説明を読み通し、実際的なコード例を分析することにより、分散システムにおける強固な基礎を構築する。
学ぶことは
分散コンピューティングの基本原理,クラスタ実行,Sparkのメモリモデルを理解する。
また,分散データベースの安全かつ効率的な操作を行うために,Scalaの関数型プログラミング概念を適用する。
また,データフレームとデータセットを含むマスタースパークの構造化APIを用いて,データ変換を最適化する。
SPARK SQLは,大規模な構造化データや半構造化データを分析するための表現力のあるクエリを書く。
また,データパイプラインを構成し,ParketやDelta Lakeなどの最新のストレージフォーマットに読み書きする。
分散データタスクにおける一般的な性能ボトルネックの同定と解決の実践。
まず,ビッグデータの基本的な用語,Scalaの基本的な構文,コア分散概念を説明し,次に,データの操作,構造化API設計,実用的な最適化ワークフローを説明する。
クラスタ経験を必要としない分散処理を基礎から学びたい開発者,データアナリスト,そして志望するデータエンジニアを含むビッグデータの初心者向けに設計された。
まずは、Scala と Spark を使った分散データ分析の力を解き放つために今日から読み始めましょう。
得られるもの
-
📜
修了証
LinkedInプロフィールに追加 -
♾️
無期限アクセス
いつでも再開可能、有効期限なし -
📱
スマホでもPCでも
どこでもどんな端末でも -
💸
30日返金保証
理由を聞きません -
⚡
短く要点だけ
1時間48分の実践的な内容
レビュー (2)
Good overall. Some parts were a bit faster than I expected, but the examples were helpful. Generally a solid course.
他の受講者はこれも
Pythonのオブジェクト指向原則とビジネスロジックを使用して、顧客データと証券計算を処理する機能的なコンソールベースの管理システムを開発します。
$4.99$9.99
Pythonで強固な基礎を構築し、現代的なプログラミング実践と実践的な書面練習を用いて、現実の科学的およびデータ駆動型問題を解くことを学ぶ。
$4.99$9.99
実行プロファイル化、データ構造の最適化、ベクトル化演算を活用して、クリーンで高速でリソース効率の良いPythonコードを書く方法を学びます。
$4.99$9.99
分散データアプリケーションの構築に DataFrames、Spark SQL、RDDを使用し、Scalaでビッグデータ処理の基礎を習得します。
$4.99$9.99
よくある質問
このコースを受けるには何が必要ですか? +
インターネットに接続したスマホかパソコンだけ。インストールも特別な機材も不要です。
支払い方法は? +
Stripe経由のカード、または暗号通貨。カード情報は当社では保存せず、Stripeが安全に取り扱います。
返金できますか? +
はい — 30日以内なら理由を問わず全額返金。
いつまでアクセスできますか? +
ずっと。購入後はあなたのもの。いつでも見返せます。
修了証はもらえますか? +
はい。修了するとLinkedInプロフィールに追加できる修了証を受け取れます。
こんな分野の方に
テック
デザイン
金融
マーケティング
医療
教育
ホスピタリティ
製造業