Data Science with Python

GIỚI THIỆU KHÓA HỌC

Python là một ngôn ngữ lập trình đa ngôn ngữ hoặc đa năng, có thể được xem nhue một loại dao Thụy Sĩ trong thế giới lập trình. Đây là vì nó hỗ trợ lập trình cấu trúc, lập trình hướng đối tượng (Object Oriented Programming), và thậm chí cả các mẫu lập trình chức năng. Tính linh hoạt của Python chắc hẳn sẽ làm nó trở nên thích hợp với các ngôn ngữ lập trình dành cho các nhà khoa học dữ liệu. Dưới đây là một vài lợi ích của python đối với khoa học dữ liệu, và sẽ giúp bạn hiểu tại sao bạn nên học khóa học dữ liệu với Python:

  • Python là một ngôn ngữ lập trình mã nguồn mở quyền lực, điều này có nghĩa rằng bạn sẽ không mất tiền sử dụng trong khi lại có được các tính chất mà một ngôn ngữ lập trình nên có.
  • Nó là một ngôn ngữ đa năng hỗ trợ lập trình hướng đối tượng (Object-Oriented Programming), lập trình cấu trúc (Structured Programming), và các mẫu lập trình chức năng.
  • Python có khoảng 72,000 thư viện trong gói Python Package Index có thể viện trợ các tính toán khoa học và các ứng dụng machine learning.
  • Môn thể thao Python có thể dễ dàng hiểu và các cú pháp có thể đọc được, đảm bảo thời gian phát triển được giảm một nửa khi so sánh với các ngôn ngữ lập trình khác.
  • Python cho phép bạn thực hiện phân tích dữ liệu, thao tác dữ liệu, và ảo hóa dữ liệu, vốn rất quan trọng đối với ngành khoa học dữ liệu.

Tất cả những lợi ích nói trên của ngôn ngữ lập trình Python làm nó trở nên lý tưởng đối với những nhà khoa học về dữ liệu khi sử dụng nó để phân tích dữ liệu.

CÁC TÍNH NĂNG CHÍNH

  • 68 giờ học các kiến thức chuyên sâu
  • 4 dự án thực tế trong ngành ở các domain như telecom, stock market…
  • Tương tác học tập với Jupyter notebooks labs
  • Thời hạn truy cập tự học trọn đời
  • Nhận được các buổi tư vấn từ các chuyên gia nổi tiếng trong ngành

MỤC TIÊU KHÓA HỌC

Sau khi hoàn tất khóa học, học viên sẽ có khả năng:

  • Có được hiểu biết chuyên sâu về các quy trình của khoa học dữ liệu, sắp xếp dữ liệu, thăm dò dữ liệu, ảo hóa dữ liệu, xây dựng các giả thuyết, và kiểm nghiệm.
  • Cấu hình môi trường yêu cầu Python và các công cụ và thư viện phụ trợ khác
  • Hiểu các khai niệm thiết yếu của chương trình Python như các loại dữ liệu,
    bộ dữ liệu, danh sách, dicts, toán tử cơ bản và các chức năng
  • Thực hiện các tính toán máy tính cao cấp sử dụng gói NumPy và thư việc lớn các hàm toán học
  • Thực hiện các tính toán khoa học kỹ thuật sử dụng gói SciPy và các gói phụ như Integrate, Optimize, Statistics, IO và Weave
  • Thực hiện phân tích dữ liệu và các thao tác bằng cách sử dụng các cấu trúc dữ liệu và các công cụ được cung cấp trong gói Pandas
  • Có được chuyên môn về machine learning bằng cách sử dụng gói Scikit-Learn
  • Sử dụng gói Scikit-Learn để xử lý ngôn ngữ tự nhiên
  • Sử dụng thư viện matplotlib của Python dùng để ảo hóa dữ liệu
  • Trích xuất các dữ liệu hữu ích từ các website bằng cách thực hiện rút trích nội dung (Web scrapping) bằng cách sử dụng Python
  • Tích hợp Python với Hadoop, Spark và MapReduce

ĐỐI TƯỢNG KHÓA HỌC

  • Các chuyên gia phân tích mong muốn làm việc với Python
  • Các chuyên gia phần mềm đang tìm kiếm cơ hội ở lĩnh vực phân tích
  • Các chuyên gia IT quan tâm đến việc theo đuổi nghề nghiệp phân tích
  • Sinh viên mới tốt nghiệp tìm kiếm cơ hội nghề nghiệp về phân tích và khóa học dữ liệu
  • Bất kì ai hứng thú về bộ môn khóa học dữ liệu

BÀI THI VÀ CẤP CHỨNG CHỈ

Để trở thành Certified Data Scientist with Python, bạn phải hoàn thành các tiêu chí sau:

  • Hoàn thành một trong số hai dự án được cung cấp trong khóa học. Gửi bản hoàn chỉnh của dự án qua LMS để các chuyên gia đào tạo đánh giá
  • Đạt số điểm tối thiểu 60% trên cả hai bài test mô phỏng
  • Hoàn thành 85% thời lượng khóa học
  • Tham dự một gói các khóa học (complete batch)

NỘI DUNG KHÓA HỌC

Lesson 00 - Course Overview

Lesson 01 - Data Science Overview

Lesson 02 - Data Analytics Overview

Lesson 03 - Statistical Analysis and Business Applications

Lesson 04 - Python Environment Setup and Essentials

Lesson 05 - Mathematical Computing with Python (NumPy)

Lesson 06 - Scientific computing with Python (Scipy)

Lesson 07 - Data Manipulation with Pandas

Lesson 08 - Machine Learning with Scikit–Learn

Lesson 09 - Natural Language Processing with Scikit Learn

Lesson 10 - Data Visualization in Python using matplotlib

Lesson 11 - Web Scraping with BeautifulSoup

Lesson 12 - Python integration with Hadoop MapReduce and Spark