Trung bình cộng
Trong toán học và thống kê, trung bình cộng (và rất ít khi là trung bình số học), hay được gọi ngắn đi là trung bình (khi đã rõ ngữ cảnh), là thương số giữa tổng của một họ các số với số lượng các con số trong họ đó.[1] Họ các con số ở đây thường là tập kết quả từ một cuộc thí nghiệm, nghiên cứu quan sát hoặc phỏng vấn. Tên gọi "trung bình số học" đôi khi được dùng để đối chiếu với bản tiếng Anh (arithmetic mean), tương tự đối với trung bình hình học.
Bên ngoài toán học và thống kê, trung bình cộng cũng được dùng nhiều trong kinh tế học, nhân loại học và lịch sử và gần như có sử dụng trong mọi nhánh học. Ví dụ chẳng hạn, thu nhập bình quân đầu người là trung bình cộng của thu nhập của toàn bộ dân số của một quốc gia.
Mặc dù trung bình cộng thường được dùng để báo cáo xu hướng tập trung, nó không phải là thống kê chuẩn mạnh: nó bị ảnh hưởng rất nhiều từ các giá trị bất thường (các giá trị hoặc cực lớn hoặc cực nhỏ so với số còn lại). Đối với các phân phối bị xiên, ví dụ như trong phân phối thu nhập, trong đó sẽ có một số người có thu nhập hơn rất nhiều so với đa số những người còn lại, trung bình cộng sẽ khó xác định "giá trị đứng giữa" của phân phối đó. Trong trường hợp này, dùng trung vị có thể mô tả tốt hơn xu hướng tập trung.
Định nghĩa
[sửa | sửa mã nguồn]Cho tập dữ liệu , trung bình cộng (hoặc được gọi ngắn đi là trung bình), và được ký hiệu là (đọc là gạch trên), là trung bình cộng của giá trị .[2]
Trong tập dữ liệu, trung bình cộng là trong những cách thường dùng để hiểu độ đo của xu hướng tập trung. Trung bình cộng của tập dữ liệu quan sát bằng với tổng các giá trị số của mỗi quan sát chia cho số lần quan sát. Viết dưới công thức cho tập dữ liệu bao gồm các giá trị, trung bình cộng được định nghĩa như sau:
(Dấu ký hiệu cho phép lấy tổng.)
Ví dụ chẳng hạn, nếu lương hàng tháng của nhân viên là như sau: , thì trung bình cộng của lương của bọn họ là:
Nếu tập dữ liệu là quần thể thống kê (tức là chứa mọi quan sát khả thi và không chỉ là tập con của chúng) thì trung bình cộng đó được gọi là trung bình quần thể và được ký hiệu bởi chữ Hy Lạp . Nếu tập dữ liệu là mẫu thống kê (là tập con của quần thể), thì trung bình cộng được gọi là trung bình mẫu (trung bình đối với tập dữ liệu được viết là ).
Trung bình cộng được định nghĩa tương tự cho vectơ trong nhiều chiều, chứ không nhất thiết phải giữa các giá trị scalar. Tổng quát hơn, bởi vì trung bình cộng là tổ hợp lồi (tức là tổng các hệ số của nó bằng ), nó có thể được định nghĩa trên không gian lồi chứ không chỉ không gian vectơ.
Các tính chất thúc đẩy
[sửa | sửa mã nguồn]Trung bình cộng có một số tính chất đặc biệt, nhất là khi dùng để đo xu hướng tập trung. Chúng bao gồm:
- Nếu có giá trị trung bình , thì . Bởi là khoảng cách từ số đó đến trung bình, ta có thể xem tính chất là đang nói rằng các phần tử ở bên trái đang được cân bằng bởi các phần tử ở bên phải. Giá tri trung bình là giá trị duy nhất sao cho các phần dư (độ lệch so với ước lượng) có tổng bằng không. Ta cũng có thể xem giá trị trung bình có tính bất biến tịnh tiến bởi cho bất kỳ số thực , .
- Nếu buộc phải dùng một giá trị "tầm thường" cho một tập các số đã biết , thì trung bình cộng thường là tốt nhất bởi nó đã tối thiểu hoá tổng của các bình phương độ lệch chuẩn từ giá trị thường: tức tổng của . Trung bình mẫu cũng là ước lượng đơn tốt nhất bởi nó có sai số dùng căn trung bình bình phương nhỏ nhất.[2] Nếu cần phải dùng trung bình cộng cho cả một quần thể , thì ước lượng không chệch của nó là trung bình cộng của một mẫu lấy từ quần thể.
- Trung bình cộng không phụ thuộc đơn vị đo, bởi Ví dụ chẳng hạn, tính trung bình theo đơn vị lít rồi đổi sang ga-lông thì cũng tương tự với đổi sang đơn vị ga-lông rồi mới tính trung bình. Tính chất này được gọi là tính thuần nhất bậc nhất.
Trái với trung vị
[sửa | sửa mã nguồn]Trung bình cộng có thể trái với trung vị. Giá trị trung vị được định nghĩa sao cho không có hơn một nửa trong tập lớn hơn nó và cũng không có hơn một nửa trong tập nhỏ hơn nó. Khi sắp xếp các dữ liệu theo một thứ tự nào đó sao cho các dữ liệu tăng theo cấp số cộng, thì trong trường hợp này trung bình và trung vị là cùng một giá trị. Ví dụ chẳng hạn, xét tập . Giá trị trung bình là , và giá trị trung vị cũng bằng 2.5. Tuy nhiên, nếu như tập hợp không thể sắp xếp được sao cho dữ liệu tăng theo cấp số cộng, chẳng hạn như tập , thì giá trị trung bình sẽ sai khác đáng kể so với giá trị trung vị. Trong ví dụ này, trung bình bằng với , còn trung vị là . Giá trị trung bình có thể lớn hơn hoặc nhỏ hơn so với đa số dữ liệu trong tập.
Có nhiều ứng dụng cho hiện tượng này trong nhiều ngành. Ví dụ chẳng hạn, kể từ năm 1980, trung vị thu nhập của Hoa Kỳ chậm hơn nhiều so với trung bình thu nhập.[4]
Tổng quát
[sửa | sửa mã nguồn]Trung bình có trọng số
[sửa | sửa mã nguồn]Trung bình có trọng số là trung bình trong đó có một số điểm dữ liệu có "trọng lượng" nhiều hơn một số khác khi tính toán.[5] Ví dụ chẳng hạn, trung bình của và là , hoặc tương đương . Ngược lại, trong trung bình có trọng số, ta có thể đổi sao cho số đầu tiên có trọng số gấp đôi số thứ hai (có thể là vì số đó có tần suất xuất hiện gấp đôi số còn lại). Khi đó trung bình sẽ được như sau: . Ở đây, các trọng số phải có tổng bằng một, là và , trong đó cái đầu gấp đôi cái thứ hai. Do đó, trung bình cộng có thể được coi là trường hợp đặc biệt của trung bình có trọng số trong đó các trọng số đều bằng nhau ( trong trường hợp trên và trong trường hợp tổng quát xét số).
Góc
[sửa | sửa mã nguồn]Dấu và mã hoá
[sửa | sửa mã nguồn]Trung bình cộng thường được ký hiệu bằng dấu gạch trên đầu, như trong .[2]
Một số phần mềm (chẳng hạn như các phần mềm xử lý văn bản, trình duyệt web) có thể không hiển thị đúng ký hiệu "x̄". Ví dụ chẳng hạn, dấu HTML "x̄" gộp hai mã — ký tự gốc "x" thêm một mã cho dấu gạch trên (̄ hoặc ¯).[6]
Xem thêm
[sửa | sửa mã nguồn]- Trung bình Fréchet
- Trung bình tổng quát
- Trung bình nhân
- Trung bình điều hoà
- Trung bình mẫu và covariance
- Độ lệch chuẩn
- Sai số chuẩn của trung bình
- Thống kê tổng
Tham khảo
[sửa | sửa mã nguồn]- ^ Jacobs, Harold R. (1994). Mathematics: A Human Endeavor . W. H. Freeman. tr. 547. ISBN 0-7167-2426-X.
- ^ a b c Medhi, Jyotiprasad (1992). Statistical Methods: An Introductory Text. New Age International. tr. 53–58. ISBN 9788122404197.
- ^ Weisstein, Eric W. “Arithmetic Mean”. mathworld.wolfram.com (bằng tiếng Anh). Truy cập 21 Tháng tám năm 2020.
- ^ Krugman, Paul (4 tháng 6 năm 2014) [Fall 1992]. “The Rich, the Right, and the Facts: Deconstructing the Income Distribution Debate”. The American Prospect.
- ^ “Mean | mathematics”. Encyclopedia Britannica (bằng tiếng Anh). Truy cập 21 Tháng tám năm 2020.
- ^ “Notes on Unicode for Stat Symbols”. www.personal.psu.edu. Bản gốc lưu trữ 31 Tháng Ba năm 2022. Truy cập 14 tháng Mười năm 2018.
Đọc thêm
[sửa | sửa mã nguồn]- Huff, Darrell (1993). How to Lie with Statistics. W. W. Norton. ISBN 978-0-393-31072-6.