Phân phối chuẩn chuẩn hóa (standard normal distribution) là phân phối chuẩn với giá trị trung bình bằng 0 và
phương sai bằng 1 (đường cong màu đỏ trong hình bên phải). Phân phối chuẩn còn được gọi là đường cong chuông
(bell curve) vì đồ thị của mật độ xác suất có dạng chuông.
Lịch sử
Abraham de Moivre là người đầu tiên đưa ra phân phối chuẩn trong bài báo năm 1734 (được in lại trong ấn bản lần 2
The Doctrine of Chances, 1738) khi muốn xấp xỉ một phân phối nhị thức với n lớn. Kết quả được mở rộng bởi
Laplace trong cuốn sách Analytical Theory of Probabilities (1812), và bây giờ gọi là định lý Moivre-Laplace.
Laplace dùng phân phối chuẩn để phân tích sai số của các thử nghiệm. Phương pháp quan trọng bình phương tối
thiểu được Legendre đưa ra năm 1805. Năm 1809, Gauss, người tuyên bố đã từng sử dụng phương pháp này từ năm
1794, đã chứng minh phương pháp này bằng cách giả thiết rằng các sai số có phân phối chuẩn.
11 trang |
Chia sẻ: vivian | Lượt xem: 2720 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Giáo án Phân phối chuẩn, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ội tụ về phân phối chuẩn. Thường trong những truờng hợp nói trên, độ kém chính xác sẽ xảy ra ở đuôi của
đường phân phối.
Khả năng phân chia vô hạn
Phân phối chuẩn có khả năng phân chia vô hạn.
Độ ổn định
Phân phối chuẩn là phân phối xác suất ổn định.
Độ lệch chuẩn
Phân phối chuẩn 7
Phần diện tích màu xanh lam thuộc phạm vi một độ lệch chuẩn từ trị trung bình. Đối với
phân phối chuẩn, nó chiếm 68% toàn bộ tổng thể trong khi đó phần diện tích nằm trong
khoảng 2 lần độ lệch chuẩn (màu xanh và nâu) chiếm 95% và 3 lần độ lệch chuẩn (xanh
lam, nâu, lá cây) chiếm 99.7%.
Trong thực nghiệm, ta thường giả thiết
rằng dữ liệu lấy từ tổng thể có dang
phân phối xấp xỉ chuẩn. Nếu giả thiết
này được kiểm chứng thì có khoảng
68% số giá trị nằm trong khoảng 1 độ
lệch chuẩn so với trị trung bình,
khoảng 95% số giá trị trong khoảng
hai lần độ lệch chuẩn và khoảng
99.7% nằm trong khoảng 3 lần độ lệch
chuẩn. Đó là "quy luật 68-95-99.7"
hoặc quy tắc kinh nghiệm.
Kiểm định giả thiết về
phân phối chuẩn
Phép kiểm định cho ta biết một bộ số liệu cho trước có dạng phân phối tương tự phân phối chuẩn hay không. Giả
thiết không là số liệu giống dạng phân phối chuẩn, do đó một giá trị P đủ nhỏ sẽ chứng tỏ dữ liệu không có phân phối
chuẩn.
• Phép kiểm định Kolmogorov-Smirnov
• Phép kiểm định Lilliefors
• Phép kiểm định Anderson-Darling
• Phép kiểm định Ryan-Joiner
• Phép kiểm định Sapiro-Wilk
• Đường cong phân phối chuẩn (rankit plot)
• Phép kiểm định Jarque-Bera
Các phân phối liên quan
• là một phân phối Rayleigh nếu với và
là 2 phân phối chuẩn độc lập.
• là một phân phối khi-bình phương với bậc tự do nếu với cho
và là độc lập
• là một phân phối Cauchy nếu và và
là 2 phân phối chuẩn độc lập.
• là một phân phối log-normal nếu and .
• Liên quan đến phân phối Lévy skew alpha-stable: nếu thì
.
• Phân phối chuẩn rút gọn. Nếu, thì, việc rút gọn dưới tại và trên tại sẽ dẫn đến một biến
ngẫu nhiên với mean , trong đó và
và , trong đó là hàm mật độ xác suất của biến ngẫu nhiên chuẩn
chuẩn hóa.
Phân phối chuẩn 8
Ước lượng tham số
Ước lượng hợp lí cực đại của các tham số
Giả sử
độc lập thống kê và mỗi biến đều có phân phối chuẩn với kì vọng μ và phương sai σ2. Theo ngôn ngữ thống kê, các
giá trị quan trắc của các biến ngẫu nhiên này tạo thành một "mẫu từ tổng thể có phân phối chuẩn". Ta cần ước lượng
"trị trung bình của tổng thể μ và độ lệch chuẩn của tổng thể σ, dựa trên các giá trị quan sát được của mẫu. Hàm mật
độ xác suất liên hiệp của các biến ngẫu nhiên này là:
(Chú ý: Ở đây kí hiệu tỉ lệ có nghĩa là tỉ lệ như một hàm của và , chứ không phải tỉ lệ như một hàm
của . Điểu này có thể xem như là điểm khác biệt giữa quan điểm của các nhà thống kê và nhà xác suất.
Lí do về tầm quan trọng của điểm khác nhau này sẽ được đề cập dưới đây.)
Hàm hợp lí - một hàm của μ và σ là
Trong phương pháp hợp lí cực đại, các giá trị của μ và σ làm cho hàm hợp lí đạt cực đại sẽ cho ta các giá trị của ước
lượng các thông số μ và σ của tổng thể.
Thông thường trong khi cực đại hóa một hàm 2 biến ta có thể xét các đạo hàm riêng. Nhưng ở đây ta sẽ khai thác
một đặc điểm là giá trị của μ làm cực đại hóa hàm hợp kí với σ là cố định, không phụ thuộc vào σ. Do đó, ta có thể
tìm giá trị của μ, sau đó thay thế nó vào trong phương trình hợp lí, để cuối cùng thu được giá trị của σ làm cực đại
biểu thức tìm được.
Rõ ràng là hàm hợp kí là một hàm giảm của tổng
Do đó ta muốn giá trị của μ làm cực tiểu hóa tổng này. Đặt:
là "trị trung bình mẫu". Nhận thấy
Chỉ có số hạng cuối phụ thuộc vào μ và nó được cực tiểu hóa bằng
Đó là ước lượng hợp lí cực đại của μ. Khi ta thay thế giá trị này cho μ trong hàm hợp lí, ta nhận được:
Ta quy ước kí hiệu hàm "log hợp lí", nghĩa là, logarit của hàm hợp lí, bằng một chữ thường, và ta có
Phân phối chuẩn 9
và sau đó
Đạo hàm này dương, bằng 0, hoặc âm tùy thuộc vào σ2 nằm giữa 0 và
hoặc bằng đại lượng đó, hoặc lớn hơn đại lượng đó.
Kết quả là trị trung bình của bình phương các sai số là một ước lượng hợp lí cực đại của σ2, và căn bậc hai của nó là
ước lượng hợp lí cực đại của σ. Ước lượng này là một ước lượng chệch, nhưng có một sai số căn quân phương nhỏ
hơn so với ước lượng không chệch, vốn là n/(n − 1) lần ước lượng trên.
Điều khái quát gây ngạc nhiên
Đạo hàm của ước lượng hợp lí cực đại của ma trận hiệp phương sai của một phân phối đa biến chuẩn rất khó nhận ra.
Nó liên quan đến định lí phổ và lí do có thể coi một đại lượng vô hướng như là vết của ma trận 1×1 hơn là chỉ một
biến vô hướng. Xem thêm cách xác định các ma trận hiệp phương sai.
Ước lượng không chệch của các tham số
Ước lượng hợp lí cực đại cho tổng thể đồng nghĩa với việc của một mẫu là một ước lượng không chệch của trị
trung bình, và phương sai cũng vậy. Tuy nhiên điều đó chỉ có được khi trị trung bình của tổng thể đã được biết trước.
Thực tế ta chỉ có một mẫu lấy từ tổng thể, và không hề có thông tin gì về trị trung bình cũng như phương sai của tổng
thể. Trường hợp này ước lượng không chệch của phương sai là:
"Phương sai mẫu" này tuân theo phân phối Gamma nếu như tất cả các biến ngẫu nhiên X đều có dạng phân phối
giống nhau và độc lập với nhau:
Tham khảo
• John Aldrich. Earliest Uses of Symbols in Probability and Statistics [1]. Electronic document, retrieved March 20,
2005. (See "Symbols associated with the Normal Distribution".)
• Abraham de Moivre (1738). The Doctrine of Chances.
• Stephen Jay Gould (1981). The Mismeasure of Man. First edition. W. W. Norton. ISBN 0-393-01489-4.
• R. J. Herrnstein and Charles Murray (1994). The Bell Curve: Intelligence and Class Structure in American Life.
Free Press. ISBN 0-02-914673-9.
• Pierre-Simon Laplace (1812). Analytical Theory of Probabilities.
• Jeff Miller, John Aldrich, et al. Earliest Known Uses of Some of the Words of Mathematics [2]. In particular, the
entries for "bell-shaped and bell curve" [3], "normal" (distribution) [4], "Gaussian" [5], and "Error, law of error,
theory of errors, etc." [6]. Electronic documents, retrieved December 13, 2005.
• S. M. Stigler (1999). Statistics on the Table, chapter 22. Harvard University Press. (History of the term "normal
distribution".)
• Eric W. Weisstein et al. Normal Distribution [7] at MathWorld. Electronic document, retrieved March 20, 2005.
Phân phối chuẩn 10
• Marvin Zelen and Norman C. Severo (1964). Probability Functions. Chapter 26 of Handbook of Mathematical
Functions with Formulas, Graphs, and Mathematical Tables, ed, by Milton Abramowitz and Irene A. Stegun.
National Bureau of Standards.
Liên kết ngoài
• Mô hình tương tác tính toán các phân phối (bao gồm phân phối chuẩn) [8].
• Công cụ tính toán diện tích tự do phía dưới đưòng phân phối chuẩn [9] từ Website Free Statistics Calculators của
Daniel Soper. Tính toán diện tích lũ tích phía dưới đường cong phân phối (tức là xác suất lũy tích), cho trước z.
• Các công cụ cơ bản cho vấn đề 6-sigma [10]
• PlanetMath: biến ngẫu nhiên phân phối chuẩn [11]
• Thư viện khoa học GNU – Reference Manual – The Gaussian Distribution [12]
• Công cụ tính toán phân phối [13] – Tính xác suất và các giá trị phân giới cho phân phối chuẩn, t, khi-bình phương
và phân phối F.
• Bảng phân phối chuẩn (tài liệu công cộng) [14]
• Có phải phân phối chuẩn lấy theo tên Karl Gauss? Euler và họ đường cong gamma của ông; vai trò của thống kê
học [15]
• Maxwell demons: Simulating probability distributions with functions of propositional calculus [16]
• Bảng tính phân phối chuẩn [17]
• Máy tính trực tuyến Phân phối chuẩn [18]
Chú thích
[1] http:/ / web. archive. org/ 20000610213020/ members. aol. com/ jeff570/ stat. html
[2] http:/ / web. archive. org/ 19990117033417/ members. aol. com/ jeff570/ mathword. html
[3] http:/ / web. archive. org/ 19991001182725/ members. aol. com/ jeff570/ b. html
[4] http:/ / web. archive. org/ 19991003084940/ members. aol. com/ jeff570/ n. html
[5] http:/ / web. archive. org/ 19990508225359/ members. aol. com/ jeff570/ g. html
[6] http:/ / web. archive. org/ 19990508224238/ members. aol. com/ jeff570/ e. html
[7] http:/ / mathworld. wolfram. com/ NormalDistribution. html
[8] http:/ / socr. stat. ucla. edu/ htmls/ SOCR_Distributions. html
[9] http:/ / www. danielsoper. com/ statcalc/ calc02. aspx
[10] http:/ / www. sixsigmafirst. com/ proba. htm
[11] http:/ / planetmath. org/ encyclopedia/ NormalRandomVariable. html
[12] http:/ / www. gnu. org/ software/ gsl/ manual/ html_node/ Random-Number-Distributions. html
[13] http:/ / www. vias. org/ simulations/ simusoft_distcalc. html
[14] http:/ / www. math. unb. ca/ ~knight/ utility/ NormTble. htm
[15] http:/ / www. visualstatistics. net/ Statistics/ Euler/ Euler. htm
[16] http:/ / www. visualstatistics. net/ Statistics/ Maxwell%20Demons/ Maxwell%20Demons. htm
[17] http:/ / www. digitalreview. com. ar/ normaldistribution/
[18] http:/ / www. elektro-energetika. cz/ calculations/ no. php?language=vi
Nguồn và người đóng góp vào bài 11
Nguồn và người đóng góp vào bài
Phân phối chuẩn Nguồn: Người đóng góp: Chien, Chitto, Con kiến, Ctmt, DHN, Minhtuanht, Nguyễn Thanh Quang, René Vápeník,
Rotlink, Tttrung, Volga, 8 sửa đổi vô danh
Nguồn, giấy phép, và người đóng góp vào hình
Tập tin:Normal Distribution PDF.svg Nguồn: ập_tin:Normal_Distribution_PDF.svg Giấy phép: Public Domain Người đóng góp: Inductiveload
Tập tin:Normal Distribution CDF.svg Nguồn: ập_tin:Normal_Distribution_CDF.svg Giấy phép: Public Domain Người đóng góp: Inductiveload
Tập tin:Normal approximation to binomial.svg Nguồn: ập_tin:Normal_approximation_to_binomial.svg Giấy phép: GNU Free Documentation
License Người đóng góp: User:MarkSweep
Tập tin:standard deviation diagram.png Nguồn: ập_tin:Standard_deviation_diagram.png Giấy phép: Copyrighted free use Người đóng góp:
Original uploader was Jeremykemp at en.wikipedia Later versions were uploaded by Patbeirne, Eggnock at en.wikipedia.
Giấy phép
Creative Commons Attribution-Share Alike 3.0
//creativecommons.org/licenses/by-sa/3.0/
File đính kèm:
- Phân phối chuẩn.pdf