Mẫu số liệu ghép nhóm
Mẫu số liệu ghép nhóm
1. Khái niệm và ví dụ mẫu số liệu ghép nhóm:
Ví dụ 1:
Số lượng khách mua bảo hiểm nhân thọ trong một ngày
| Khoảng tuổi | $[20;30)$ | $[30;40)$ | $[40;50)$ | $[50;60)$ | $[60;70)$ |
| Số khách hàng | $1$ | $7$ | $12$ | $4$ | $0$ |
Nhận xét: Khách hàng mua bảo hiểm nhân thọ được phân loại vào các khoảng tuổi.
Space
Số khách hàng trong khoảng tuổi là .
Trong ngày đó, một nhân viên thống kê theo trí nhớ là đã bán bảo hiểm cho một khách tuổi và một khách tuổi. Hỏi nhân viên này nhớ đúng hay sai?
* Định nghĩa
Mẫu số liệu ghép nhóm thường được trình bày dưới dạng bảng thống kê như sau:
Bảng 1: Bảng tần số ghép nhóm
| Nhóm | $[u_1;u_2)$ | $[u_2;u_3)$ | ... | $[u_k;u_{k+1})$ |
| Tần số | $n_1$ | $n_2$ | ... | $n_k$ |
Chú ý:
- Bảng trên gồm $k$ nhóm $\left[u_j ; u_{j+1}\right)$ với $1 \leq j \leq k$, mỗi nhóm gồm một số giá trị được ghép theo một tiêu chí xác định.
- Cỡ mẫu $n=n_1+n_2+\ldots+n_k$.
- Giá trị chính giữa mỗi nhóm được dùng làm giá trị dại diện cho nhóm ấy. Ví dụ nhóm $\left[u_1 ; u_2\right)$ có giá trị đại diện là $\dfrac{1}{2}\left(u_1+u_2\right)$.
- Hiệu $u_{j+1}-u_j$ được gọi là độ dài của nhóm $\left[u_j ; u_{j+1}\right)$.
Lấy thông tin ở ví dụ 1, hoàn thành phần luyện tập dưới đây.
Cỡ mẫu của mẫu số liệu trong ví dụ 1 là .
Giá trị đại diện của khoảng tuổi là .
Độ dài của nhóm là .
Space
2. Ghép nhóm mẫu số liệu:
* Quy tắc thường dùng:
- Tính độ lớn của khoảng biến thiên $R$.
- Chọn từ $k=5$ đến $k=20$ nhóm. Cỡ mẫu càng lớn thì cần càng nhiều nhóm số liệu. Các nhóm có cùng độ dài bằng $L$. Cách chọn: $L > \dfrac{R}{k}$.
- Giá trị nhỏ nhất của mẫu thuộc vào nhóm $\left[u_1 ; u_2\right)$ và càng gần $u_1$ càng tốt. Giá trị lớn nhất của mẫu thuộc nhóm $\left[u_k ; u_{k+1}\right)$ và càng gần $u_{k+1}$ càng tốt.
Ví dụ 2: Cân nặng của $28$ học sinh nam lớp $11$ được cho như sau:
$55,4$ $62,6$ $54,2$ $56,8$ $58,8$ $59,4$ $60,7$ $58$ $59,5$ $63,6$ $61,8$ $52,3$ $63,4$ $57,9$
$49,7$ $45,1$ $56,2$ $63,2$ $46,1$ $49,6$ $59,1$ $55,3$ $55,8$ $45,5$ $46,8$ $54$ $49,2$ $52,6$
Hãy chia mẫu dữ liệu trên thành $5$ nhóm, lập bảng tần số ghép nhóm và xác định giá trị đại diện cho mỗi nhóm.
Giải
Khoảng biến thiên của mẫu số liệu trên là $R=63,6-45,1=18,5$.
Độ dài mỗi nhóm $L>\dfrac{R}{k}=\dfrac{18,5}{5}=3,7$
Ta chọn $L=4$ và chia dữ liệu thành các nhóm $[45;49),[49;53),[53;57),[57;61),[61;65)$.
Khi đó, ta có bảng tần số ghép nhóm sau:
| Cân nặng | $[45;49)$ | $[49;53)$ | $[53;57)$ | $[57;61)$ | $[61;65)$ |
| Giá trị đại diện | $47$ | $51$ | $55$ | $59$ | $63$ |
| Số học sinh | $4$ | $5$ | $7$ | $7$ | $5$ |
Space
Một thư viện thống kê số người đến đọc sách vào buổi tối trong ngày của tháng vừa qua như sau: