Thu thập và phân loại dữ liệu
1. Thu thập và phân loại dữ liệu
Dữ liệu được phân loại theo sơ đồ sau:
Dữ liệu là số còn gọi là dữ liệu định lượng.
Dữ liệu không là số còn gọi là dữ liệu định tính.
Chú ý: Dữ liệu không là số có thể chia thành hai loại, loại không thể sắp thứ tự (chẳng hạn dữ liệu về tên các tỉnh: Nam Định, Thái Bình,...) và loại có thể sắp thứ tự (chẳng hạn dữ liệu về đánh giá chất lượng dịch vụ với các mức Rất tốt, Tốt, Trung bình, Kém).
Ví dụ 1: Bình đã phỏng vấn các bạn trong lớp và thu được các dãy dữ liệu sau.
(1) Cân nặng (đơn vị kilogam) của 5 bạn trong lớp:
43; 41; 48; 45; 52
(2) Tên một số tỉnh thuộc đồng bằng sông Hồng:
Nam Định, Thái Bình, Hưng Yên, Bắc Ninh
(3) Đánh giá của bốn bạn học sinh về chất lượng bài giảng môn Toán:
Tốt, Xuất sắc, Khá, Trung bình
Giải
- Dãy dữ liệu (1) là dãy số liệu.
- Dãy dữ liệu (2) không là dãy số liệu, không thể sắp thứ tự.
- Dãy dữ liệu (3) không là dãy số liệu, có thể sắp xếp theo thứ tự từ mức cao nhất đến mức thấp nhất (Xuất sắc, Tốt, Khá, Trung bình) nên đây là dãy dữ liệu không là số, có thể sắp thứ tự.
Một số tuyến xe buýt mà bạn An đã đi là: 01; 02; 12; 15. Ý kiến nào sau đây là đúng?
Phân loại các dãy dữ liệu sau dựa trên các tiêu chí định tính và định lượng.
Dữ liệu là số
Dữ liệu không là số
2. Tính đại diện của dữ liệu
Nam và Bắc muốn tìm hiểu về mức độ thường xuyên lên thư viện trường của các bạn học sinh trong trường nên quyết định lập phiếu để tiến hành khảo sát.

Nam đưa ra ý kiến: "Mình chỉ cần phát phiếu khảo sát cho các bạn lên thư viện trong một tuần."
Bắc lại không đồng ý: "Không, tớ nghĩ mỗi lớp cần chọn ngẫu nhiên 10 bạn để phát phiếu khảo sát."
Hãy nối các ý kiến đúng với nhau.
Nhận xét:
Để đưa ra các kết luận hợp lí, dữ liệu phải đảm bảo tính đại diện cho toàn bộ đối tượng được quan tâm.
Chẳng hạn, khi đối tượng quan tâm là toàn thể học sinh thì không thể chỉ lấy ý kiến các bạn nam hoặc chỉ lấy ý kiến của các bạn trong câu lạc bộ Toán học,... mà phải lấy ý kiến của các học sinh được chọn một cách ngẫu nhiên.
Ví dụ 2: Một hãng hàng không muốn khảo sát ý kiến của khách hàng trên một chuyến bay để đánh giá mức độ hài lòng về phục vụ trên chuyến bay đó.
a) Em hãy cho biết đối tượng mà hãng hàng không muốn hướng đến.
b) Trong hai cách khảo sát sau, cách nào hợp lí hơn?
Cách 1. Lấy ý kiến của 20 hành khách ở khoang hạng thương gia.
Cách 2. Đánh số ngẫu nhiên 100 hành khách trên chuyến bay và xin ý kiến của những hành khách số 5; 10; 15; ...; 100.
Giải
a) Hãng hàng không cần lấy ý kiến của tất cả các hành khách đi trên chuyến bay.
b) Theo cách 1, hành khách hạng phổ thông không được tham gia khảo sát nên dữ liệu thu thập được chưa đảm bảo tính đại diện. Khảo sát theo cách 2 hợp lí hơn.
Để đánh giá mức độ phù hợp của đề thi môn Toán 7, nhà trường có thể sử dụng cách nào để đảm bảo tính đại diện?
Phỏng vấn 50 bạn nam trong trường thấy có 40 bạn thích bóng đá. Kết luận nào hợp lí?
