KHÓA HỌC PHÂN TÍCH DỮ LIỆU VỚI PYTHON

Chương trình đào tạo

KHÓA HỌC PHÂN TÍCH DỮ LIỆU VỚI PYTHON

KHÓA HỌC PHÂN TÍCH DỮ LIỆU VỚI PYTHON

08:44 05/11/2024
KHÓA HỌC PHÂN TÍCH DỮ LIỆU VỚI PYTHON

Thời lượng: 80h

Mục tiêu:

Sau khi hoàn thành khoá học, học viên có hiểu và vận dụng kiến thức để phân tích dữ liệu của một dự án thực tế.

Đối tượng: Sinh viên, người đi làm có kiến thức nền trước đó về Python

Giáo trình:

Kiến thức đạt được:

  • Kiến thức về nền tảng về Python, hiểu và vận dụng trong giải quyết bài toán thực tế.
  • Phân tích dữ liệu bài bản từ khai phá dữ liệu, làm sạch, biến đổi dữ liệu, phân tích thống kê, trực quan hoá…
  • Học viên được rèn luyện kỹ năng code, tư duy độc lập, phản biện, làm việc nhóm…

NỘI DUNG KHÓA HỌC PHÂN TÍCH DỮ LIỆU  - DATA ANALYST WITH PYTHON

Module1: Module PCAP (40h)

PYTHON ESSENTIALS 1: BASIC

Unit 1

Introduction to Python and computer programming

- Ngôn ngữ lập trình Python và chương trình máy tính.

- Cài đặt môi trường, chạy chương trình Python đầu tiên.

Unit  2

Data types, variables, basic input-output operations, basic operators

- Biến, kiểu dữ liệu, biểu thức và toán tử.

- Nhập xuất dữ liệu cơ bản với input(), print()

Unit 3

Boolean values, conditional execution, loops, lists and list processing, logical and bitwise operations

- Biểu thức logic, câu lệnh rẽ nhánh if-else.

- Vòng lặp for, while…

- Kiểu dữ liệu list và các phương thức.

Unit 4

Functions, tuples, dictionaries, and data processing

- Hàm trong Python.

- Kiểu dữ liệu tuple, từ điển...

PYTHON ESSENTIALS 2: INTERMEDIATE

Unit 5

Modules, Packages and PIP

- Mô đun và gói package.

- Cài đặt thư viện bên thứ ba với PIP.

- Thực hành: xử lý ảnh, chữ viết sang giọng nói…

Unit 6

Strings, String and List Methods, Exceptions

- Chuỗi và các phương thức xử lý chuỗi.

- Ngoại lệ exception

- Xử lý ngoại lệ với try-except

- Làm việc với tệp tin.

Unit 7

Object-Oriented Programming

- Lập trình hướng đối tượng với Python.

- Thuộc tính và phương thức

- Tính đóng gói, kế thừa, đa hình và trừu tượng.

Unit 8

Miscellaneous

- Các chủ đề khác: sử dụng iterator, yield...

THI BÀI  TRÊN NETACAD

Module 2: Phân tích dữ liệu với Python (40h)

BÀI HỌC

T.LƯỢNG (H)

NỘI DUNG

1. Python và phân tích dữ liệu

 

4

- Tổng quan về phân tích dữ liệu.

- Các bước để phân tích dữ liệu.

- Cài đặt các thư viện Python.

2. Thư viện Numpy

4

- Thư viện numpy.

- Thao tác cơ bản với mảng, ma trận.

3. Xử lý dữ liệu Pandas

6

- Giới thiệu Pandas và các cấu trúc dữ liệu (Series, DataFrame)

- Đọc và ghi dữ liệu từ các định dạng khác nhau (CSV, Excel,...)

-  Lọc, sắp xếp, và truy vấn dữ liệu.

- Làm sạch dữ liệu: xử lý trùng lặp, chuyển đổi dữ liệu.

4. Web crawling

6

- Cấu trúc HTML5

- Sử dụng Request, tạo request HTTP.

- Bóc tách dữ liệu với Beautifulsoup4

- Thực hành Crawl dữ liệu, khai phá và lọc và phân tích dữ liệu.

5. Trực quan hóa dữ liệu với Matplotlib và Seaborn

4

- Giới thiệu Matplotlib và Seaborn

- Vẽ các loại biểu đồ phổ biến (đường, cột, tròn, phân tán,...)

- Tùy chỉnh biểu đồ (màu sắc, nhãn, tiêu đề,...)

- Thực hành

6. Thống kê

2

- Các khái niệm thống kê: trung bình, trung vị, mode, độ lệch chuẩn,...

- Tính toán và diễn giải các chỉ số thống kê bằng Python.

7. Phân tích dữ liệu khám phá (EDA)

2

- Các kỹ thuật EDA phổ biến (phân phối dữ liệu, mối quan hệ giữa các biến, phát hiện outlier,...)

- Thực hành EDA trên một tập dữ liệu thực tế.

8. Học máy

6

- Giới thiệu học máy và phân loại: học có giám sát, học không giám sát ….

- Học máy với Scikit-learn

9. Dự án thực tế

6

- Dự án thực tế theo cá nhân hoặc nhóm, dưới sự hướng dẫn của giảng viên.

Liên hệ tìm hiểu các chính sách hỗ trợ học phí tại: Dang ky hoc

Khóa học khác

Nhằm khuyến khích thí sinh có thành tích học tập tốt và phát triển tài năng, với kỳ nhập học năm 2024 tại Chương trình Học viện Công nghệ BKACAD, nhà trường trao tặng các suất học bổng đầu vào nằm trong quỹ học bổng "Sinh viên tài năng" cho các bạn tân sinh viên lựa chọn một trong 04 ngành BTEC đào tạo tại BKACAD

Mô hình DevOps là sự phối kết hợp của bộ phận Phát triển phần mềm và bộ phận Hoạt động vận hành hỗ trợ CNTT, sự hợp tác và giao tiếp hiệu quả nhịp nhàng của hai nhóm này trong mỗi tổ chức đem lại những ưu thế & lợi ích phát triển chung cho toàn tổ chức. Mục tiêu của mô hình DevOps là tăng khả năng cung cấp sản phẩm với tốc độ nhanh nhất, giảm thiểu những yếu tố kém hiệu quả, cải thiện sự hài lòng và chất lượng dịch vụ đối với khách hàng và trên hết là tăng cường độ tin cậy đối với các sản phẩm dịch vụ phần mềm.