Bài 24: Bảng tần số, tần số tương đối ghép nhóm và biểu đồ
📏 Khi dải dữ liệu vượt ngoài tầm kiểm soát
Trong bài nghiên cứu về “Chiều cao của thanh thiếu niên” cho hồ sơ tuyển sinh vận động viên cấp tỉnh, liên đoàn điền kinh thu thập chiều cao (đơn vị: cm) của 100 em học sinh. Phổ phân phối của mẫu số liệu sẽ được chia nhỏ không ngừng tuỳ thuộc vào các giá trị: , , , v…v.
Vì đây là dữ liệu hình thái liên tục nên có hàng trăm chỉ số phân độ chiều cao, rất hiếm các số liệu trong phổ có sự trùng lặp hoàn toàn 100%. Nếu chúng ta sử dụng Bảng tần số chuẩn từ bài 22, ta sẽ phải lập một dải liệt kê hàng ngang dài đến hàng trăm cột đại diện, điều này khiến cho số lượng đếm ở tần số từng chỉ số luôn rơi vào vùng vi phân nhỏ (1 hoặc 2 giá trị) và làm cho công cụ bảng thất bại thảm hại trong phân tích xu thế.
Để tóm lược mẫu số liệu liên tục hiệu quả, giới toán học thống kê chia phổ quan sát thành các khung mốc như: “Nhóm những người cao từ ”, “Nhóm cao ”… gọi là quá trình Ghép nhóm dữ liệu. Cụ thể chúng ta nghiên cứu các đặc tính trong Bài 24 dưới đây!
📖 1. Bảng tần số, tần số tương đối ghép nhóm
Khi mẫu số liệu lưu trữ trong kho tham khảo là liên tục (như đo đạc chiều dài, cân nặng, hoặc độ lớn thời gian) và có nhiều nhóm phân bố rất đa dạng trải dài, ta thường phân mẫu thành các nhóm số liệu dưới dạng nửa khoảng để phục vụ cho lập bảng phân phối.
- Giá trị biên bên phải (mút ) không được tính cho nhóm hiện tại và được gộp vào nhóm liền kề sau đó. Ngoại trừ giới hạn nhóm cuối cùng, có thể sử dụng đoạn để giữ mút giới hạn.
- Chiều dài của một khoảng được đánh giá qua sự chênh lệch .
Khi đó ta nói tần số của một nhóm là số lượng các giá trị được quy tụ trong khoảng chênh lệch số liệu thực tế thuộc nhóm đó. Tương tự, ta xác định đại lượng tần số tương đối ghép nhóm là tỉ số phần trăm giữa tần số và cỡ số liệu khảo khát ().
Ví dụ Lập biểu: Bảng tần số học kỳ thể hiện giờ tự tập gym (phút) của sinh viên:
| Khoảng giờ tự học | Tổng | ||||
|---|---|---|---|---|---|
| Tần số () | 5 | 18 | 12 | 5 | |
| Tần số t/đối () | 12.5% | 45.0% | 30.0% | 12.5% | 100% |
📖 2. Biểu đồ hình cột Tổ chức (Histogram)
Nhằm minh họa trực quan sự lên xuống của tần số trong mẫu dữ liệu nhóm này, ta vẽ bảng khảo sát biểu diễn thông qua một khối liên cột gọi là Biểu đồ tổ chức (Histogram).
- Trục hoành: Các mốc số liệu tạo lập nửa khoảng ghép nhóm.
- Trục tung: Đại diện cho số lượng phần tử lọt nhóm hoặc tần số đo đếm (Tần số hoặc Tần số ).
- Đặc tính cơ bản: Vì biến thiên thông số trên đoạn hoành là dải thực liên tục, nên mép của mỗi hộp chữ nhật phải dựa sát thẳng vào hộp bên cạnh (Khoảng liền khối với ).
Mở rộng về Đường Gấp khúc tần số (Frequency Polygon) Thay đổi dạng thể hiện thành nối ghép các điểm tọa độ nằm lộn xộn, người ta bổ sung đường gấp khúc vào biểu đồ để kiểm chứng mô hình biểu thức biến thiên dữ kiện bằng cách tìm phần giữa của mái trên mỗi thỏi chữ nhật đồ thị rồi xâu liên tiếp bằng đường gấp khúc dài.
🖩 3. Hệ thống xử lí mốc số liệu thống kê máy tính
Máy Tính Thống Kê & Tần Số
Nhập dãy số liệu thống kê, cách nhau bởi dấu phẩy hoặc khoảng trắng.
Cỡ Mẫu (N)
10
Số Trung Bình (x̄)
7.3
Bảng Phân Bố Tần Số & Tần Số Tương Đối:
| Giá trị (x) | Tần số (n) | Tần số tương đối (f) |
|---|---|---|
| 5 | 1 | 10.0% |
| 6 | 2 | 20.0% |
| 7 | 3 | 30.0% |
| 8 | 2 | 20.0% |
| 9 | 1 | 10.0% |
| 10 | 1 | 10.0% |
| Tổng Vị Trí | N = 10 | 100% |
Dạng 1: Chuyển dữ liệu sang Bảng Tần số Ghép nhóm Phương pháp:
- Xét toàn bộ mẫu số liệu gốc gồm nhiều phần tử.
- Đặt các khoảng cho trước ở cấu trúc nửa đoạn (thường là để độ chia bằng nhau giữa các nửa khoảng).
- Thẩm định lại từng con số đo xem nó thuộc về giới hạn nào, cẩn thận số lượng trùng khớp vào số liệu mút đầu mút cuối theo quy tắc bao gồm/loại trừ (giao và hợp).
- Sau khi tổng kết đếm nhặt, ta lập tần số hoặc tỉ lệ phần trăm cho mỗi nhóm. (Phải chắc chắn tổng tần số vẫn duy trì bằng chuẩn Cỡ mẫu ).
Ví dụ 1:
Phòng y tế của trường tiểu học kiểm tra chiều cao (cm) của 20 học sinh theo dải số liệu:
110, 112, 115, 120, 121, 119, 122, 125, 128, 129, 131, 135, 137, 138, 140, ... (Để thuận tiện, coi như ta đã tổng hợp nhanh tần số thu thập như bên dưới).
Với kích cỡ phân bố chiều cao . Hãy xây dựng bảng nhóm và rút ra nhóm đạt nhiều quan sát nhất (Mốt nhóm).
Hướng dẫn:
- Quá trình phân chia cỡ nửa khoảng : [110; 120), [120; 130), [130; 140), [140; 150]
- Tính tần số và ta kết luận được mảng tần số tương tự như sau:
- Khoảng ghi nhận 6 học sinh.
- Khoảng ghi nhận 5 học sinh.
- Khoảng ghi nhận 7 học sinh.
- Khoảng ghi nhận 2 học sinh.
- Nhóm chiều cao thu thập nhiều phần tử học sinh nhất là khoảng với tần số đạt n=7. Do đó trong mô hình này, đây được coi là “Nhóm chứa mốt”.
Dạng 2: Phân tích số liệu từ biểu đồ ghép nhóm Histogram Phương pháp:
- Khởi điểm ở đáy Hoành trên biểu đồ, ta xét độ dài dải để biết chi tiết mức độ lớn bé.
- Phóng đối chiếu độ tịnh tiến thẳng lên mốc cột để tiếp nhận độ dày / tần số bằng cột độ dài tung ứng chiếu sang vạch trục .
- Từ những kết xuất quan sát đó, có thể thiết lập ngay lập tức Bảng chỉ số đối chiếu chuẩn bị số liệu.
Ví dụ 2: Dựa theo cột đầu tiên của biểu đồ Histogram phía trên (nửa khoảng ). Hỏi khoảng thời lượng giờ tập này gồm mấy bạn sinh viên được ghi nhận? Hướng dẫn:
- Hình chữ nhật tại tọa độ trên trục hoành có độ cao tương ứng chạm vào màng vạch kẻ ngang của số trên trục tung. Tần số bằng 5. Có người.
Mục đích chính của việc lập bảng tần số ghép nhóm là gì?
📝 Bài tập tự luận
Bài 1: Cửa hàng điện máy kiểm tra tuổi thọ của bóng đèn (đơn vị: nghìn giờ) từ bộ xét nghiệm 50 bóng trong nhà máy. Thống kê kết xuất trong bộ bảng nửa khoảng phân độ như sau:
| Tuổi thọ bóng () | ||||
|---|---|---|---|---|
| Tần số phát hiện () |
a) Độ lớn quy mô nhóm chiều dài ở các phân khúc đánh giá mẫu vật kiểm tra là bao nhiêu? Giá trị tuổi thọ sẽ bị quy kết ở ô tần số nào? b) Hãy tính tần số tương đối ứng với từng vùng thời gian hoạt động tuổi thọ. c) Nhận xét khung khoảng không gian tuổi thọ hoạt động điển hình có độ phủ sóng cao nhất.
Bài 2: Theo dữ liệu khí tượng về lượng mưa trung bình một tháng (đơn vị: mm) của các địa bàn thị xã gồm 30 trạm đo thu nhận được mảng tần số tương đối như sau:
| Lượng mưa () | ||||
|---|---|---|---|---|
| Tần số tương đối (%) |
a) Dựa trên định luật toàn phần trong tổng chuẩn tương đối, xác định tham số chênh lệch về tỉ lệ ? b) Tính cụ thể có bao nhiêu xã tương ứng của đại diện khu vực vượt lượng mưa chuẩn ?
📊 Hướng dẫn giải
Bài 1: a) Chiều rộng các mảng thời gian: . Tuổi thọ định mức sẽ trượt khỏi vòng giới hạn của nhóm thứ 2 là , do nửa khoảng không ôm góc mút 4, nó sẽ thụt về vào mảng quy kết số đếm ở nhóm thứ 3 là . b) Tính quy mô Tần số tương đối do :
- Nhóm 1: .
- Nhóm 2: .
- Nhóm 3: .
- Nhóm 4: . (Tổng trọn vẹn ). c) Độ phủ sóng của lô hàng chiếm mạnh mẽ nhất tại phân định tuổi thọ với số bóng đại diện lọt tỷ trọng dẫn đầu .
Bài 2: a) Dựa trên tiêu chuẩn 100% trong số tần số: . Do đó giá trị lượng mưa nhóm có tần số tương đối . b) Ghi chú cho số liệu của lượng mưa phân độ chiếm tương ứng . Áp dụng công thức quy xuất số hạng số lượng quan sát là: trạm đo thời tiết.