Scala và Spark: Dữ liệu lớn và máy học dành cho người mới bắt đầu

Hãy học cách xử lý các tập dữ liệu khổng lồ và xây dựng các quy trình học máy có khả năng mở rộng bằng Scala và Spark, bắt đầu từ những kiến ​​thức lập trình cơ bản nhất.

4.5 (5,587) ⏱ 1 giờ 9 phút 📚 7 bài

Về khóa học này

Khi khối lượng dữ liệu tăng lên theo cấp số nhân, các tổ chức dựa vào các công cụ mạnh mẽ để xử lý và phân tích thông tin ở quy mô lớn. Học Scala và Spark sẽ trang bị cho bạn những kỹ năng cơ bản cần thiết để xử lý các tập dữ liệu khổng lồ và xây dựng các quy trình làm việc máy học hiệu quả. Khóa học viết toàn diện này sẽ đưa bạn từ người mới bắt đầu hoàn toàn đến việc tự tin viết mã Scala và chạy các tác vụ Spark. Bạn sẽ chuyển từ việc hiểu các khái niệm lập trình cốt lõi sang thiết kế các đường dẫn dữ liệu có khả năng mở rộng và huấn luyện các mô hình máy học trên các tập dữ liệu lớn. Những gì bạn sẽ học: - Học các nguyên tắc cơ bản của lập trình Scala, bao gồm cú pháp, các khái niệm lập trình hàm và các nguyên tắc hướng đối tượng. - Hiểu kiến ​​trúc Spark, bao gồm các tập dữ liệu phân tán linh hoạt (RDD), Spark SQL và các API DataFrame hiện đại. - Áp dụng các kỹ thuật thao tác dữ liệu để làm sạch, lọc, kết hợp và tổng hợp các tập dữ liệu khối lượng lớn. - Xây dựng các mô hình máy học bằng thư viện MLlib của Spark cho các tác vụ phân loại, hồi quy và phân cụm. - Cấu hình và chạy các ứng dụng Spark trong môi trường đám mây hiện đại và các nền tảng cộng tác như Databricks. - Thực hành các quy trình làm việc dữ liệu lớn hiện đại, bao gồm các nguyên tắc truyền phát có cấu trúc và các kỹ thuật tối ưu hóa hiệu suất cơ bản. Bạn sẽ bắt đầu với cú pháp và thuật ngữ cốt lõi của Scala trước khi chuyển sang hệ sinh thái mạnh mẽ của Spark, khám phá DataFrame, truy vấn SQL và các pipeline máy học. Thông qua các giải thích bằng văn bản chi tiết và các bài tập mã nguồn có cấu trúc, bạn sẽ phát triển các kỹ năng thực tiễn cần thiết để phân tích dữ liệu thực tế. Khóa học này được thiết kế cho người mới bắt đầu, những người muốn trở thành kỹ sư dữ liệu và nhà phân tích dữ liệu muốn học các công nghệ dữ liệu lớn. Không yêu cầu kinh nghiệm trước đó với Scala hoặc Spark. Hãy bắt đầu đọc ngay hôm nay để khai phá tiềm năng của xử lý dữ liệu lớn và thăng tiến sự nghiệp kỹ thuật của bạn.

Bạn sẽ nhận được

  • 📜 Chứng chỉ hoàn thành
    Thêm vào hồ sơ LinkedIn
  • ♾️ Truy cập trọn đời
    Quay lại bất cứ lúc nào, không hết hạn
  • 📱 Điện thoại hoặc máy tính
    Hoạt động mọi nơi, mọi thiết bị
  • 💸 Hoàn tiền 30 ngày
    Không cần lý do
  • Ngắn gọn, đi vào trọng tâm
    1 giờ 9 phút nội dung thực hành

Đánh giá (2)

رشيد DZ Học viên đã xác minh
★ 3 · 2026-01-03T12:26:52+00:00

Khá nhiều thông tin. Tôi thích các ví dụ ứng dụng thực tế, mặc dù việc thiết lập ban đầu mất nhiều thời gian hơn tôi mong đợi.

이주원 KR Học viên đã xác minh
★ 3 · 2025-10-08T15:46:52+00:00

Đây là một khóa học chắc chắn. Cấu trúc logic và hầu hết các ví dụ đều hữu ích. Tuy nhiên, có thể thêm một vài tình huống thực tế nữa.

Viết đánh giá

Sau khi gửi, chúng tôi sẽ yêu cầu đăng nhập — bản nháp được lưu.

Học viên cũng học

Câu hỏi thường gặp

Tôi cần gì để học khóa này? +

Chỉ cần điện thoại hoặc máy tính có kết nối internet. Không cần cài đặt hay thiết bị đặc biệt.

Tôi thanh toán bằng cách nào? +

Bằng thẻ qua Stripe, hoặc tiền điện tử. Chúng tôi không lưu thông tin thẻ — Stripe xử lý an toàn.

Tôi có thể được hoàn tiền không? +

Có — hoàn tiền đầy đủ trong 30 ngày, không cần lý do.

Tôi sẽ có quyền truy cập trong bao lâu? +

Mãi mãi. Sau khi mua, khóa học là của bạn để xem lại bất cứ lúc nào.

Tôi có nhận được chứng chỉ không? +

Có. Sau khi hoàn thành, bạn sẽ nhận được chứng chỉ và có thể thêm vào hồ sơ LinkedIn.

Dành cho người học trong
Công nghệ Thiết kế Tài chính Marketing Y tế Giáo dục Khách sạn-Dịch vụ Sản xuất