Lớp 9 · Chương VII: Tần số và tần số tương đối

Bài 24: Bảng tần số, tần số tương đối ghép nhóm và biểu đồ

🚀 Khởi động

📏 Khi dải dữ liệu vượt ngoài tầm kiểm soát

Trong bài nghiên cứu về “Chiều cao của thanh thiếu niên” cho hồ sơ tuyển sinh vận động viên cấp tỉnh, liên đoàn điền kinh thu thập chiều cao (đơn vị: cm) của 100 em học sinh. Phổ phân phối của mẫu số liệu sẽ được chia nhỏ không ngừng tuỳ thuộc vào các giá trị: 155.1155.1, 167.3167.3, 158.4158.4, v…v.

Vì đây là dữ liệu hình thái liên tục nên có hàng trăm chỉ số phân độ chiều cao, rất hiếm các số liệu trong phổ có sự trùng lặp hoàn toàn 100%. Nếu chúng ta sử dụng Bảng tần số chuẩn từ bài 22, ta sẽ phải lập một dải liệt kê hàng ngang dài đến hàng trăm cột đại diện, điều này khiến cho số lượng đếm ở tần số từng chỉ số luôn rơi vào vùng vi phân nhỏ (1 hoặc 2 giá trị) và làm cho công cụ bảng thất bại thảm hại trong phân tích xu thế.

Để tóm lược mẫu số liệu liên tục hiệu quả, giới toán học thống kê chia phổ quan sát thành các khung mốc như: “Nhóm những người cao từ 150160 cm150–160\text{ cm}”, “Nhóm cao 160170 cm160–170\text{ cm}”… gọi là quá trình Ghép nhóm dữ liệu. Cụ thể chúng ta nghiên cứu các đặc tính trong Bài 24 dưới đây!

🔍 I. Lý thuyết trọng tâm

📖 1. Bảng tần số, tần số tương đối ghép nhóm

Khi mẫu số liệu lưu trữ trong kho tham khảo là liên tục (như đo đạc chiều dài, cân nặng, hoặc độ lớn thời gian) và có nhiều nhóm phân bố rất đa dạng trải dài, ta thường phân mẫu thành các nhóm số liệu dưới dạng nửa khoảng [a;b)[a; b) để phục vụ cho lập bảng phân phối.

  • Giá trị biên bên phải (mút bb) không được tính cho nhóm hiện tại và được gộp vào nhóm liền kề sau đó. Ngoại trừ giới hạn nhóm cuối cùng, có thể sử dụng đoạn [a;b][a; b] để giữ mút giới hạn.
  • Chiều dài của một khoảng [a;b)[a; b) được đánh giá qua sự chênh lệch L=baL = b - a.

Khi đó ta nói tần số nn của một nhóm là số lượng các giá trị được quy tụ trong khoảng chênh lệch số liệu thực tế thuộc nhóm đó. Tương tự, ta xác định đại lượng tần số tương đối ghép nhóm là tỉ số phần trăm giữa tần số nn và cỡ số liệu khảo khát NN (fi=niN100%f_i = \frac{n_i}{N} \cdot 100\%).

Ví dụ Lập biểu: Bảng tần số học kỳ thể hiện giờ tự tập gym (phút) của sinh viên:

Khoảng giờ tự học[0;30)[0; 30)[30;60)[30; 60)[60;90)[60; 90)[90;120][90; 120]Tổng
Tần số (nn)518125N=40N=40
Tần số t/đối (f%f\%)12.5%45.0%30.0%12.5%100%

📖 2. Biểu đồ hình cột Tổ chức (Histogram)

Nhằm minh họa trực quan sự lên xuống của tần số trong mẫu dữ liệu nhóm này, ta vẽ bảng khảo sát biểu diễn thông qua một khối liên cột gọi là Biểu đồ tổ chức (Histogram).

  • Trục hoành: Các mốc số liệu tạo lập nửa khoảng ghép nhóm.
  • Trục tung: Đại diện cho số lượng phần tử lọt nhóm hoặc tần số đo đếm (Tần số nn hoặc Tần số f%f\%).
  • Đặc tính cơ bản: Vì biến thiên thông số trên đoạn hoành là dải thực liên tục, nên mép của mỗi hộp chữ nhật phải dựa sát thẳng vào hộp bên cạnh (Khoảng [0;30)[0; 30) liền khối với [30;60)[30; 60)).

Mở rộng về Đường Gấp khúc tần số (Frequency Polygon) Thay đổi dạng thể hiện thành nối ghép các điểm tọa độ nằm lộn xộn, người ta bổ sung đường gấp khúc vào biểu đồ để kiểm chứng mô hình biểu thức biến thiên dữ kiện bằng cách tìm phần giữa của mái trên mỗi thỏi chữ nhật đồ thị rồi xâu liên tiếp bằng đường gấp khúc dài.

051015200306090120Tần sốPhút

🖩 3. Hệ thống xử lí mốc số liệu thống kê máy tính

Máy Tính Thống Kê & Tần Số

Nhập dãy số liệu thống kê, cách nhau bởi dấu phẩy hoặc khoảng trắng.

Cỡ Mẫu (N)

10

Số Trung Bình (x̄)

7.3

Bảng Phân Bố Tần Số & Tần Số Tương Đối:

Giá trị (x)Tần số (n)Tần số tương đối (f)
5110.0%
6220.0%
7330.0%
8220.0%
9110.0%
10110.0%
Tổng Vị TríN = 10100%
🌍 II. Các dạng toán và Phương pháp giải

Dạng 1: Chuyển dữ liệu sang Bảng Tần số Ghép nhóm Phương pháp:

  • Xét toàn bộ mẫu số liệu gốc gồm nhiều phần tử.
  • Đặt các khoảng cho trước ở cấu trúc nửa đoạn [a;b)[a; b) (thường là để độ chia bằng nhau giữa các nửa khoảng).
  • Thẩm định lại từng con số đo xem nó thuộc về giới hạn nào, cẩn thận số lượng trùng khớp vào số liệu mút đầu mút cuối theo quy tắc bao gồm/loại trừ (giao và hợp).
  • Sau khi tổng kết đếm nhặt, ta lập tần số nn hoặc tỉ lệ phần trăm fi%f_i\% cho mỗi nhóm. (Phải chắc chắn tổng tần số vẫn duy trì bằng chuẩn Cỡ mẫu NN).

Ví dụ 1: Phòng y tế của trường tiểu học kiểm tra chiều cao (cm) của 20 học sinh theo dải số liệu: 110, 112, 115, 120, 121, 119, 122, 125, 128, 129, 131, 135, 137, 138, 140, ... (Để thuận tiện, coi như ta đã tổng hợp nhanh tần số thu thập như bên dưới). Với kích cỡ phân bố chiều cao L=10 cmL = 10\text{ cm}. Hãy xây dựng bảng nhóm và rút ra nhóm đạt nhiều quan sát nhất (Mốt nhóm).

Hướng dẫn:

  • Quá trình phân chia cỡ nửa khoảng 10 cm10\text{ cm}: [110; 120), [120; 130), [130; 140), [140; 150]
  • Tính tần số và ta kết luận được mảng tần số tương tự như sau:
    • Khoảng [110;120)[110; 120) ghi nhận 6 học sinh.
    • Khoảng [120;130)[120; 130) ghi nhận 5 học sinh.
    • Khoảng [130;140)[130; 140) ghi nhận 7 học sinh.
    • Khoảng [140;150][140; 150] ghi nhận 2 học sinh.
  • Nhóm chiều cao thu thập nhiều phần tử học sinh nhất là khoảng [130;140)[130; 140) với tần số đạt n=7. Do đó trong mô hình này, đây được coi là “Nhóm chứa mốt”.

Dạng 2: Phân tích số liệu từ biểu đồ ghép nhóm Histogram Phương pháp:

  • Khởi điểm ở đáy Hoành trên biểu đồ, ta xét độ dài dải L=baL = b - a để biết chi tiết mức độ lớn bé.
  • Phóng đối chiếu độ tịnh tiến thẳng lên mốc cột để tiếp nhận độ dày / tần số nin_i bằng cột độ dài tung ứng chiếu sang vạch trục OyOy.
  • Từ những kết xuất quan sát đó, có thể thiết lập ngay lập tức Bảng chỉ số đối chiếu chuẩn bị số liệu.

Ví dụ 2: Dựa theo cột đầu tiên của biểu đồ Histogram phía trên (nửa khoảng [0;30)[0; 30)). Hỏi khoảng thời lượng giờ tập này gồm mấy bạn sinh viên được ghi nhận? Hướng dẫn:

  • Hình chữ nhật tại tọa độ [0;30)[0; 30) trên trục hoành có độ cao tương ứng chạm vào màng vạch kẻ ngang của số 55 trên trục tung. Tần số bằng 5. Có 55 người.
✏️ Luyện tập trắc nghiệm
Câu 1 / 8
Dễ0 đã trả lời

Mục đích chính của việc lập bảng tần số ghép nhóm là gì?


📝 Bài tập tự luận

Bài 1: Cửa hàng điện máy kiểm tra tuổi thọ của bóng đèn (đơn vị: nghìn giờ) từ bộ xét nghiệm 50 bóng trong nhà máy. Thống kê kết xuất trong bộ bảng nửa khoảng phân độ như sau:

Tuổi thọ bóng (xx)[2;3)[2; 3)[3;4)[3; 4)[4;5)[4; 5)[5;6][5; 6]
Tần số phát hiện (nn)55151520201010

a) Độ lớn quy mô nhóm chiều dài ở các phân khúc đánh giá mẫu vật kiểm tra là bao nhiêu? Giá trị tuổi thọ 4 nghıˋn giờ4\text{ nghìn giờ} sẽ bị quy kết ở ô tần số nào? b) Hãy tính tần số tương đối ứng với từng vùng thời gian hoạt động tuổi thọ. c) Nhận xét khung khoảng không gian tuổi thọ hoạt động điển hình có độ phủ sóng cao nhất.

Bài 2: Theo dữ liệu khí tượng về lượng mưa trung bình một tháng (đơn vị: mm) của các địa bàn thị xã gồm 30 trạm đo thu nhận được mảng tần số tương đối như sau:

Lượng mưa (xx)[50;100)[50; 100)[100;150)[100; 150)[150;200)[150; 200)[200;250][200; 250]
Tần số tương đối (%)10%10\%40%40\%m%m\%20%20\%

a) Dựa trên định luật toàn phần trong tổng chuẩn tương đối, xác định tham số chênh lệch về tỉ lệ m%m\%? b) Tính cụ thể có bao nhiêu xã tương ứng của đại diện khu vực vượt lượng mưa chuẩn [100;150)[100; 150)?

📊 Hướng dẫn giải

Bài 1: a) Chiều rộng các mảng thời gian: L=32=1 (nghıˋn giờ)L = 3 - 2 = 1\text{ (nghìn giờ)}. Tuổi thọ định mức =4.0 nghıˋn giờ= 4.0\text{ nghìn giờ} sẽ trượt khỏi vòng giới hạn của nhóm thứ 2 là [3;4)[3; 4), do nửa khoảng không ôm góc mút 4, nó sẽ thụt về vào mảng quy kết số đếm ở nhóm thứ 3 là [4;5)[4; 5). b) Tính quy mô Tần số tương đối do N=50N = 50:

  • Nhóm 1: 550100%=10%\frac{5}{50} \cdot 100\% = 10\%.
  • Nhóm 2: 1550100%=30%\frac{15}{50} \cdot 100\% = 30\%.
  • Nhóm 3: 2050100%=40%\frac{20}{50} \cdot 100\% = 40\%.
  • Nhóm 4: 1050100%=20%\frac{10}{50} \cdot 100\% = 20\%. (Tổng trọn vẹn 100%100\%). c) Độ phủ sóng của lô hàng chiếm mạnh mẽ nhất tại phân định tuổi thọ [4;5)[4; 5) với số bóng đại diện lọt tỷ trọng dẫn đầu 40%40\%.

Bài 2: a) Dựa trên tiêu chuẩn 100% trong số tần số: 10%+40%+m%+20%=100%70%+m%=100%m=30%10\% + 40\% + m\% + 20\% = 100\% \Rightarrow 70\% + m\% = 100\% \Rightarrow m = 30\%. Do đó giá trị lượng mưa nhóm [150;200)[150; 200) có tần số tương đối 30%30\%. b) Ghi chú cho số liệu của lượng mưa phân độ [100;150)[100; 150) chiếm tương ứng 40%40\%. Áp dụng công thức quy xuất số hạng số lượng quan sát là: n=4030100=12n = \frac{40 \cdot 30}{100} = 12 trạm đo thời tiết.