悪くない導入でした。構成は論理的でしたが、基本的な例以外にもっと実践的な練習があればよかったです。
Pythonでのビッグデータ処理
PySparkを使って大規模なデータセットを処理、クエリ、分析し、PythonとSQLのスキルを分散されたビッグデータ環境に移行する方法を学ぶ。
このコースについて
データセットが従来のツールで扱うには大きすぎるようになると、分散コンピューティングは現代のデータプロフェッショナルにとって不可欠となってきています。このテキストベースのコースでは、PySparkを紹介します。PySparkはSparkのためのPython APIで、大量のデータセットを高速かつ効率的に処理し分析することができます。
単一のマシンでのデータ処理から分散されたビッグデータワークフローへの移行を行う。明確な説明を読み通し、実世界のコードスニペットで実践することにより、分散ストレージ、クエリ実行、データ操作の基本的な概念を習得する。
学ぶことは
分散コンピューティングの基本,Sparkアーキテクチャ,伝統的なデータライブラリからの移行を理解する。
これらのデータセットを利用して,データフレームを作成し,データフレームを操作する。
また,SPARK SQLを用いて,分散データに対する関係データのクエリを行う。
- Spark に最新の Pandas API を適用して、既存の Pandas ワークフローをビッグデータにスムーズに拡張します。
また,データ処理パイプラインの最適化を行うための,キャッシュ,パーティション,効率的なスキーマ定義を述べた。
実時間データフィード処理のための構造化ストリーミングの基礎を調べた。
まず,ビッグデータの基本的な用語とSparkのコアアーキテクチャを説明し,次に,実用的なDataFrame操作とSQLクエリを説明する。
分散システムの経験は不要であるが,PythonとSQLの基礎的な理解が有用である。
今日から読み始めて 分散コンピューティングの力を解き放ち データ処理のスキルを伸ばして
得られるもの
-
📜
修了証
LinkedInプロフィールに追加 -
🎧
音声版付き
画面なしでもどこでも学べる -
♾️
無期限アクセス
いつでも再開可能、有効期限なし -
📱
スマホでもPCでも
どこでもどんな端末でも -
💸
30日返金保証
理由を聞きません -
⚡
短く要点だけ
1時間1分の実践的な内容
レビュー (4)
かなり有益でした。実践的な応用例は気に入りましたが、最初のセットアップに予想以上に時間がかかりました。
このコースを徹底的に楽しんだ。情報の提示方法が素晴らしく、実践的な応用が効果的に強調されていた。素晴らしい出来!
It's a decent introduction. Could benefit from more diverse examples and a slightly better flow between modules.
他の受講者はこれも
Pythonのオブジェクト指向原則とビジネスロジックを使用して、顧客データと証券計算を処理する機能的なコンソールベースの管理システムを開発します。
$4.99$9.99
Pythonで強固な基礎を構築し、現代的なプログラミング実践と実践的な書面練習を用いて、現実の科学的およびデータ駆動型問題を解くことを学ぶ。
$4.99$9.99
実行プロファイル化、データ構造の最適化、ベクトル化演算を活用して、クリーンで高速でリソース効率の良いPythonコードを書く方法を学びます。
$4.99$9.99
分散データアプリケーションの構築に DataFrames、Spark SQL、RDDを使用し、Scalaでビッグデータ処理の基礎を習得します。
$4.99$9.99
よくある質問
このコースを受けるには何が必要ですか? +
インターネットに接続したスマホかパソコンだけ。インストールも特別な機材も不要です。
支払い方法は? +
Stripe経由のカード、または暗号通貨。カード情報は当社では保存せず、Stripeが安全に取り扱います。
返金できますか? +
はい — 30日以内なら理由を問わず全額返金。
いつまでアクセスできますか? +
ずっと。購入後はあなたのもの。いつでも見返せます。
修了証はもらえますか? +
はい。修了するとLinkedInプロフィールに追加できる修了証を受け取れます。
こんな分野の方に
テック
デザイン
金融
マーケティング
医療
教育
ホスピタリティ
製造業