Big Data

THỜI LƯỢNG: 5 ngày (~40 giờ)

GIỚI THIỆU KHÓA HỌC

  • Khóa học được thiết kế để cung cấp cho học viên kiến thức nền tảng về Dữ liệu lớn, bao gồm đặc điểm của Dữ liệu lớn, nhu cầu và lợi ích của việc phân tích dữ liệu quy mô lớn trong cuộc sống hiện đại và cách vận dụng các công cụ Dữ liệu lớn phổ biến. Dữ liệu quy mô lớn có những đặc điểm riêng biệt đòi hỏi phải mở rộng các công nghệ và thuật toán phân tích, do đó dẫn đến những quan điểm mới trong việc hiểu dữ liệu và phân tích dữ liệu.
  • Học viên được cung cấp một cái nhìn tổng quan về lĩnh vực Dữ liệu lớn đang phát triển tích cực, các vấn đề chính của nó trong quản lý dữ liệu và các ứng dụng liên quan trong kinh doanh thông minh và nghiên cứu khoa học. Kinh nghiệm thực tế sẽ được củng cố thông qua việc vận dụng các công cụ quản lý và phân tích Dữ liệu lớn như Hadoop MapReduce để xử lý hàng loạt, Spark để xử lý trực tuyến và chạy các thuật toán học máy. Qua đó cho phép học viên xây dựng các kỹ năng của riêng mình để giải quyết các vấn đề phức tạp trong thế giới thực cũng như hỗ trợ ra quyết định.

MỤC TIÊU KHÓA HỌC

Sau khi hoàn tất khóa học, học viên sẽ có khả năng:

  • Trình bày được các đặc điểm chính của Dữ liệu lớn và động lực của việc chuyển từ phân tích dữ liệu cổ điển sang các hình thức nâng cao hơn.
  • Cài đặt, triển khai được một hệ thống quản lý Dữ liệu lớn ở mức cơ bản dựa trên các công nghệ Hadoop và các công nghệ liên quan.
  • Lập trình một số bài toán qua các pha Map Reduce và đánh giá mức hiệu quả.
  • Vận dụng được Spark vào phân tích Dữ liệu lớn.
  • Triển khai được các thuật toán học máy trên môi trường Dữ liệu lớn.

ĐIỀU KIỆN THAM GIA

Để học tốt khóa học học viên cần có kiến thức trước về: Mạng máy tính cơ bản, Lập trình Python, Lập trình Java

CHỨNG NHẬN

Sau khi hoàn tất khóa học, học viên sẽ được cấp chứng nhận hoàn tất khóa học theo quy định của SmartPro.

NỘI DUNG KHÓA HỌC

Xem thêm
CÓ THỂ BẠN QUAN TÂM
Array
(
)