KHÓA HỌC DATA ANALYTICS
Chương trình đào tạo
KHÓA HỌC DATA ANALYTICS
KHÓA HỌC DATA ANALYTICS
Thời lượng: 80h
Mục tiêu:
- Chứng nhận hoàn thành khoá học Data Analytics Essentials – Cisco – Skill for all. - Thực hiện một dự án về phân tích dữ liệu
Đối tượng: Sinh viên, người đi làm có kiến thức nền trước đó về Python
Giáo trình:
Kiến thức đạt được:
Học viên được trang bị đủ kiến thức và kỹ năng để thực hiện một dự án về phân tích dữ liệu
Module 1 (30h): Data Analytics Essential – Skill For All
Cơ bản về dữ liệu và các công cụ cơ bản của nhà phân tích dữ liệu.
1. Data Analytics Projects (2h)
(Dự án phân tích dữ liệu)
- Dữ liệu là gì?
- Các lợi ích của phân tích dữ liệu.
- Các giai đoạn trong quá trình phân tích.
2. Getting started with data gathering and investigation (4h)
(Thu thập và phân tích dữ liệu)
- Các công cụ phần mềm phổ biến được sử dụng trong phân tích dữ liệu.
- Thực hiện thu thập dữ liệu ban đầu và điều tra bằng bảng tính
- Sử dụng các hàm excel cơ bản để thu thập và kiểm tra dữ liệu
3. Preparing and cleaning data for analysis (4h)
(Chuẩn bị và làm sạch dữ liệu cho phân tích)
- Các nguồn dữ liệu khác nhau được sử dụng trong phân tích dữ liệu.
- Các loại tệp dữ liệu có cấu trúc khác nhau.
- Các loại nguồn dữ liệu phi cấu trúc khác nhau.
- Xác định cấu trúc dữ liệu theo các yêu cầu cho việc phân tích.
4. Transforming Data with Excel (4h)
(Chuyển đổi dữ liệu với Excel)
- Sử dụng các hàm và công thức Excel để chuyển đổi dữ liệu để phân tích.
- Sử dụng các công cụ và kỹ thuật phân tích dữ liệu để sắp xếp và lọc dữ liệu với Excel.
- Sử dụng các công cụ và kỹ thuật phân tích dữ liệu để định dạng và điều chỉnh dữ liệu với Excel
- Sử dụng các kỹ thuật Excel để thực hiện tính toán dữ liệu
5. Analyze the data using statistics (4h)
(Phân tích dữ liệu sử dụng số liệu thống kê)
- Trực quan hóa dữ liệu với Excel.
- Trực quan hóa để xác định sự bất thường trong dữ liệu.
- Sử dụng Vlookup hoặc Xlookup trong Excel để xác định và khắc phục sự cố.
6. Introduction to Relational Databases and SQL (2h)
(Tổng quan về cơ sở dữ liệu quan hệ và SQL)
- Các khái niệm cơ bản về cơ sở dữ liệu.
- Xây dựng một truy vấn có cấu trúc bằng SQL.
7. Introduction to structured queries (4h)
(Giới thiệu về truy vấn có cấu trúc)
- Truy vấn dữ liệu từ nhiều bảng với câu lệnh JOIN
8. Introduction to Tableau (4h)
(Tổng quan về Tableau)
- Giới thiệu về Tableau.
- Chuẩn bị dữ liệu và trực quan hoá dữ liệu với Tableau.
9. Final Test (2h)
- Làm bài test cuối khoá trên Skill for All.
Module 2 (40h): Data Analytics with Python – phân tích dữ liệu cơ bản với Python
1. Python và phân tích dữ liệu (4h)
- Python cơ bản (ôn tập nhanh).
- Cài đặt một số thư viện Python và công cụ cho phân tích dữ liệu.
2. Làm việc với dữ liệu dạng bảng với Numpy (4h)
- Giới thiệu về Numpy và mảng Numpy.
- Thao tác cơ bản với mảng
3. Phân tích dữ liệu với Pandas (6h)
- Giới thiệu Pandas và các cấu trúc dữ liệu (Series, DataFrame)
- Đọc và ghi dữ liệu từ các định dạng khác nhau (CSV, Excel,...)
- Lọc, sắp xếp, và truy vấn dữ liệu.
- Làm sạch dữ liệu: xử lý trùng lặp, chuyển đổi dữ liệu.
4. Web crawling (6h)
- Cấu trúc HTML
- Thư viện Python Requests
- Bóc tách dữ liệu với Beautifulsoup4
- Thực hành Crawl dữ liệu.
5. Trực quan hóa dữ liệu với Matplotlib và Seaborn (4h)
- Giới thiệu Matplotlib và Seaborn
- Vẽ các loại biểu đồ phổ biến (đường, cột, tròn, phân tán,...)
- Tùy chỉnh biểu đồ (màu sắc, nhãn, tiêu đề,...)
6. Thống kê cơ bản (2h)
- Các khái niệm thống kê cơ bản (trung bình, trung vị, mode, độ lệch chuẩn,...)
- Tính toán và diễn giải các chỉ số thống kê bằng Python
7. Phân tích dữ liệu (EDA) (2h)
- Các kỹ thuật EDA phổ biến (phân phối dữ liệu, mối quan hệ giữa các biến, phát hiện outlier,...)
- Thực hành EDA trên một tập dữ liệu thực tế
8. Học máy
- Giới thiệu học máy và phân loại: học có giám sát, học không giám sát ….
- Học máy với Scikit-learn
9. Dự án thực tế
Module 3 (10 h): Project – dự án
Học viên làm dự án cá nhân dưới sự hỗ trợ giảng viên (8h).
Báo cáo dự án (2h).
Khóa học khác
Chứng chỉ Lập trình ứng dụng Android
Chứng chỉ Lập trình Website với PHP&MySQL