Big Data Hadoop And Spark Developer

GIỚI THIỆU KHÓA HỌC

Thế giới ngày càng trở nên “kỹ thuật số”, và điều này có nghĩa là big data sẽ càng phát triển. Trên thực tế, tầm quan trọng của big data và phân tích dữ liệu sẽ tiếp tục phát triển trong những năm tới. Chọn làm việc trong lĩnh vực big data và làm việc trong lĩnh vực này có thể đạt mức lương ấn tượng, với mức lương trung bình cho các nhà data scientists là $ 116.000. Ngay cả những người mới bắt đầu sẽ có mức lương cao, với thu nhập trung bình là $ 92.000. Khi ngày càng có nhiều công ty nhận ra sự cần thiết của các chuyên gia về big data và analytics, số lượng các công việc này sẽ tiếp tục tăng lên.
Khóa học Big Data Hadoop Certification được thiết kế để cung cấp cho bạn kiến ​​thức chuyên sâu về khung Big Data bằng Hadoop và Spark, bao gồm HDFS, YARN và MapReduce. Bạn sẽ học cách sử dụng Pig, Hive và Impala để xử lý và phân tích các bộ dữ liệu lớn được lưu trữ trong HDFS, và sử dụng Sqoop và Flume để nhập dữ liệu với chương trình đào tạo big data của chúng tôi.

CÁC TÍNH NĂNG CHÍNH

 • 48 giờ đào tạo trực tuyến có giảng viên hướng dẫn
 • 24 giờ thông qua video với chương trình self-paced learning
 • 5 dự án công nghiệp thực tế sử dụng Hadoop và Spark
 • Tập huấn về Yarn, MapReduce, Pig, Hive, Impala, HBase và Apache Spark
 • Truy cập trọn đời vào chế độ self-paced learning.
 • Phù hợp với kỳ thi chứng chỉ Cloudera CCA175

MỤC TIÊU KHÓA HỌC

Sau khi hoàn thành khóa học này, học viên sẽ có kiến ​​thức và kỹ năng để:

 • Hiểu các thành phần khác nhau của hệ sinh thái Hadoop như Hadoop 2.7, Yarn, MapReduce, Pig, Hive, Impala, HBase, Sqoop, Flume và Apache Spark với khóa học Hadoop này.
 • Hiểu Hadoop Distributed File System (HDFS) và kiến ​​trúc YARN và tìm hiểu cách làm việc với chúng để lưu trữ và quản lý tài nguyên.
 • Hiểu MapReduce và các đặc điểm của nó và đồng hóa các khái niệm MapReduce nâng cao
 • Nhập dữ liệu bằng Sqoop và Flume
 • Tạo cơ sở dữ liệu và bảng trong Hive và Impala, hiểu HBase và sử dụng Hive và Impala để phân vùng
 • Hiểu các loại định dạng tệp khác nhau, Avro Schema, sử dụng Arvo với Hive và phát triển Sqoop và Schema
 • Hiểu Flume, kiến ​​trúc Flume, nguồn, cấu trúc Flume, kênh và cấu hình Flume
 • Hiểu và làm việc với HBase, kiến ​​trúc và lưu trữ dữ liệu của nó và tìm hiểu sự khác biệt giữa HBase và RDBMS
 • Có kiến ​​thức làm việc về Pig và các thành phần của nó
 • Lập trình chức năng trong Spark, đồng thời triển khai và xây dựng các ứng dụng Spark
 • Hiểu chi tiết các bộ dữ liệu phân phối linh hoạt (RDD)
 • Hiểu biết sâu về xử lý song song trong các kỹ thuật tối ưu hóa Spark và Spark RDD
 • Hiểu các trường hợp sử dụng phổ biến của Spark và các thuật toán tương tác khác nhau
 • Tìm hiểu Spark SQL, tạo, chuyển đổi và truy vấn khung dữ liệu
 • Luyện tập chứng nhận Big Data Cloudera CCA175.

ĐỐI TƯỢNG THAM GIA

 • Các Kiến trúc sư và các nhà phát triển phần mềm (Software Developers and Architects)
 • Các chuyên gia phân tích (Analytics Professionals)
 • Các chuyên gia CNTT cấp cao (Senior IT professionals)
 • Các chuyên gia Testing và Mainframe (Testing and Mainframe Professionals)
 • Các chuyên gia quản lý dữ liệu (Data Management Professionals)
 • Các chuyên gia BI (Business Intelligence Professionals)
 • Quản lý dự án (Project Managers)
 • Aspiring Data Scientists
 • Những ai mong muốn theo đuổi ngành nghề Big Data Analytics

ĐIỀU KIỆN THAM GIA

Không cần có kinh nghiệm để học khóa học này. Tuy nhiên, kiến ​​thức về Core Java và SQL sẽ có ích. Nếu bạn muốn cải thiện các kỹ năng Java cốt lõi của mình, Simplilearn cung cấp một khóa học bổ sung "Java essentials for Hadoop" khi bạn đăng ký khóa học này. Đối với Spark, khóa học này sử dụng Python và Scala, một cuốn sách điện tử sẽ được cung cấp để hỗ trợ việc học của bạn.

BÀI THI & CẤP CHỨNG NHẬN

Mở khóa chứng chỉ Simplilearn:

Online Classroom:

 • Tham dự một lớp hoàn chỉnh (complete batch)
 • Hoàn thành một dự án và một thử nghiệm mô phỏng với số điểm tối thiểu 80%

Online Self-Learning:

 • Hoàn thành 85% khóa học
 • Hoàn thành một dự án và một thử nghiệm mô phỏng với số điểm tối thiểu 80%

Ai cung cấp chứng nhận?

Sau khi hoàn thành khóa đào tạo chứng chỉ Big Data Hadoop, bạn sẽ được trao chứng nhận hoàn thành khóa học từ Simplilearn.

Mất bao lâu để hoàn thành kỳ thi chứng chỉ Big Data Hadoop?

Bạn sẽ mất khoảng 45-50 giờ để hoàn thành chứng chỉ khóa học Big Data Hadoop.

Tôi phải vượt qua bao nhiêu lần để vượt qua kỳ thi chứng chỉ Big Data Hadoop?

Mặc dù Simplilearn cung cấp hướng dẫn và hỗ trợ để giúp người học vượt qua bài kiểm tra trong lần thử đầu tiên, nhưng nếu bạn thất bại, bạn có tối đa ba lần thi để vượt qua bài thi này.

Hiệu lực của Big Data Hadoop

Chứng nhận khóa học Big Data Hadoop từ Simplilearn có giá trị suốt đời.

NỘI DUNG KHÓA HỌC

 • Bài 1 - Course Introduction
 • Bài 2 - Introduction to Big Data and Hadoop
 • Bài 3 - Hadoop Architecture, Distributed Storage (HDFS) and YARN
 • Bài 4 - Data Ingestion into Big Data Systems and ETL
 • Bài 5 - Distributed Processing - MapReduce Framework and Pig
 • Bài 6 - Apache Hive
 • Bài 7 - NoSQL Databases - HBase
 • Bài 8 - Basics of Functional Programming and Scala
 • Bài 9 - Apache Spark Next Generation Big Data Framework
 • Bài 10 - Spark Core Processing RDD
 • Bài 11 - Spark SQL - Processing DataFrames
 • Bài 12 - Spark MLLib - Modelling BigData with Spark
 • Bài 13 - Stream Processing Frameworks and Spark Streaming
 • Bài 14 - Spark GraphX
CÓ THỂ BẠN QUAN TÂM
Array
(
)