Xin chào các bạn. Bài trước là "Cách tôi học Data Analysis" hiện đã được tôi đánh dấu là Bài 1: Còn các ghi chép hướng dẫn về Ngôn ngữ lập trình R tôi lưu ở "Ngôn ngữ lập trình R". Rất vui vì các bạn đã đến đây và chúc hành trình tìm kiếm kiến thức của bạn thành công.
Ở bài trước, tôi có liệt kê một số trang web cung cấp datasheet để các bạn có thể tải về và sử dụng. Tôi nhận thấy các bạn nên tìm hiểu dữ liệu từ tổng cục thống kê Việt Nam để có thể đưa ra nhiều đánh giá và nhận định hơn nữa.
Tuy nhiên ở đây có vấn đề sau:
Lấy dữ liệu về để phân tích.
Lấy dữ liệu về và gặp sạn, phải lọc lại.
Nếu chúng được tải về từ các trang thống kê thì nó đã được làm sạch. Bạn là data analyst
Nếu chúng được giao cho bạn và chưa được làm sạch. Bạn là Data Engineer, nếu không phải thì bạn nên yêu cầu Data Engineer làm việc ấy để data analys có thời gian làm việc khác.
Lưu trữ