you're reading...
Thống kê ứng dụng

Ra quyết định dựa trên suy diễn giá trị trung bình

Các ví dụ trong bài viết này được lấy từ các ứng dụng trong lĩnh vực môi trường, tuy nhiên nguyên tắc ta có thể áp dụng cho quản lý chất lượng hay bất kỳ ngành nào khác khi chúng ta cần ra quyết định so sánh chất lượng của một thông số đo đạc nào đó với một giá trị tiêu chuẩn đã biết trước. Bài viết hy vọng cung cấp một cái nhìn bằng con mắt thống kê khi quyết định đánh giá một thông số nào đó so với yêu cầu đặt ra. Do đó các khái niệm “giống nhau và khác nhau”, “đạt hay không đạt” sẽ có một ý nghĩa khác hơn với phân tích thống kê qua bài phân tích này.

Một trong những vấn đề phát sinh cơ bản và phổ biến trong xử lý số liệu để ra quyết định là ta đánh giá các giá trị trung bình, có nghĩa là suy diễn về giá trị trung bình thực \eta từ giá trị trung bình của tập mẫu thu được \overline x. Bài viết này sẽ đề cập đến vấn đề so sánh giá trị trung bình của mẫu với một giá trị đã biết hoặc cho trước. Có thể kể ra một số tình huống ứng dụng sau đây trong lĩnh vực môi trường:

  1. Muốn kiểm tra độ chính xác của một phương pháp phân tích nào đó, người ta sử dụng một dung dịch chuẩn đã biết trước nồng độ một cách chính xác. Khi so sánh giá trị trung bình của các mẫu phân tích bằng 1 phương pháp sẽ cho ta thấy độ chính xác của phương pháp đã sử dụng.
  2. Để kiểm tra một sản phẩm có đạt yêu cầu của tiêu chuẩn đã đề ra hay không, người ta tiến hành lấu mẫu và so sánh trung bình của mẫu với tiêu chuẩn đó.
  3. Một người bán hàng quảng cáo về chất lượng sản phẩm của mình, khách hàng tiến hành đo các sản phẩm để xem chất lượng hàng có như quảng cáo hay không?
  4. Để khảo sát một nơi chứa chất thải nguy hại có thỏa mãn hay không về mức độ an toàn.

Trong tất cả tình huống trên ta biết trước một giá trị và gọi đó là tiêu chuẩn. Vấn đề là ta phải đánh giá giá trị kỳ vọng của quần thể cần khảo sát như thế nào tương quan tiêu chuẩn đã cho theo cái nhìn của thống kê. Để xem giá trị trung bình mẫu của mình như thế nào với tiêu chuẩn đó, người ta tiến hành so sánh chúng với nhau. Mục đích của việc so sánh là ta cần kiểm định xem sự khác biệt giữa chúng có phải là do sai số ngẫu nhiên hay không hay là có sự khác nhau thật vì một lý do nào đó. Các phương pháp thống kê sau thường được sử dụng : (1) Tính khoảng tin cậy và xem giá trị tiêu chuẩn có nằm trong khoảng tin cậy đó hay không? (2) Lập giả thiết và kiểm định giả thiết đó. Mục tiêu là ta phải biết được sự sai biệt là dương hay âm, hoặc quá nhỏ không đủ để khẳng định chúng khác nhau.

Các quy trình thống kê nêu trên có thể gây chút rắc rối khó hiểu khi giải quyết vấn đề đặt ra. Tuy nhiên ta có thể phân tích vấn đề đối với từng quy trình như sau.

(1) Tính khoảng tin cậy và xem giá trị tiêu chuẩn có nằm trong khoảng tin cậy đó hay không?

Trong thực tế, để mô tả cái gì đó, ta không thể biết được giá trị thật của nó là bao nhiêu. Ví dụ như một nhà sản xuất quảng cáo về chất lượng sản phẩm của mình, ta cũng không thể biết được giá trị thật của chất lượng sản phẩm là bao nhiêu mà chỉ thông qua đo đạc. Giá trị đo mô tả chất lượng sản phẩm lúc này phải được xem như là một biến ngẫu nhiên và phân bố của nó sẽ đại diện cho phân bố của quần thể (tất cả các giá trị có thể có của thông số chất lượng đang khảo sát). Với cách nhìn thông số chất lượng là một phân bố, việc suy diễn giá trị trung bình của mẫu phải đồng thời với việc xem xét giá trị phương sai mô tả xu thế phân tán của quần thể (có thể tham khảo thêm bài Trung bình và kỳ vọng, tổng và tích phân). Nói cách khác, mỗi giá trị trung bình đã tính được phép “dao động” quanh nó với một độ tin cậy tùy chọn. Độ tin cậy càng lớn, độ dao động được phép càng lớn. Khi so sánh tương quan giá trị chuẩn với phân bố của trung bình đang khảo sát, dẫn đến hai trường hợp sau:

Nếu giá trị tiêu chuẩn cần so sánh nằm trong miền được phép dao động, ta có thể nói rằng KHÔNG CÓ sự khác nhau về mặt thống kê giữa giá trị trung bình và chuẩn cần so sánh, sự khác nhau là do các yếu tố ngẫu nhiên vì giá trị trung bình ta khảo sát bản thân nó cũng có thể có giá trị như vậy trong phạm vi tin cậy đã chọn (chẳng hạn như 90% tùy yêu cầu thực tế).

Nếu giá trị tiêu chuẩn cần so sánh nằm ngoài miền được phép dao động, ta có thể kết luận rằng CÓ sự khác nhau về mặt thống kê giữa giá trị trung bình và chuẩn cần so sánh, sự khác nhau là do các yếu tố nào đó không ngẫu nhiên vì khả năng (xác suất) giá trị trung bình ta khảo sát có giá trị như vậy rất thấp (nếu chọn độ tin cậy là 90%, xác suất này sẽ nhỏ hơn 5% cho mỗi bên) trong phạm vi tin cậy đã chọn.

(2) Lập giả thiết và kiểm định giả thiết đó. Mục tiêu là ta phải biết được sự sai biệt là dương hay âm, hoặc quá nhỏ không đủ để khẳng định chúng khác nhau.

Một cách tiếp cận nữa là khảo sát độ chênh lệch giữa trung bình và giá trị tiêu chuẩn. Bản thân đại lượng này cũng là biến ngẫu nhiên nên có thể mô tả bằng một phân bố xác suất (gọi là phân bố của biến t). Thay vì so sánh trung bình với giá trị chuẩn như trong trường hợp trên, người ta lại tiến hành so sánh tương quan giữa độ lệch thực tế với khoảng tin cậy của biến t. Do đó, biến t đóng vai trò mô tả phân bố xác suất của độ lệch và ta phải xem độ lệch thực tế (trung bình mẫu – giá trị tiêu chuẩn) nằm chỗ nào trong phân bố đó. Sau khi chọn độ tin cậy (thường là 90%), ta ước lượng khoảng giá trị của độ lệch được xem là biến thiên ngẫu nhiên. (1) Nếu độ lệch thực tế nằm trong vùng này, có thể kết luận không có sự khác biệt về mặt thống kê. (2) Nếu độ lệch nằm ngoài vùng này, rõ ràng có thể kết luận giá trị trung bình khác chuẩn vì khả năng xuất hiện giá trị trung bình (đã được tính từ mẫu) này chỉ xảy ra với xác suất rất thấp (5% cho mỗi bên).

Để minh họa cho hai quy trình trên, ta có thể xem ví dụ sau (trích trong sách Statistics for Environmental Engineers):

Người ta gởi một dung dịch chuẩn có nồng độ DO là 1.2 mg/l cho 14 phòng thí nghiệm khác nhau. Tất cả đều sử dụng phương pháp chuẩn độ Winkler để phân tích DO. Kết quả đo được như sau (mg/l):

1.2

1.4

1.4

1.3

1.2

1.35

1.4

2.0

1.95

1.1

1.75

1.05

1.05

1.4

Câu hỏi đặt ra là liệu các phòng thí nghiệm phân tích có cho được giá trị trung bình là 1.2 (mg/l) hay không? Hay là có sai số hệ thống (bias)?

Cách tiếp cận 1: Tính khoảng tin cậy và xem giá trị tiêu chuẩn có nằm trong khoảng tin cậy đó hay không? Bằng cách này, ta tiến hành khảo sát phân bố của trung bình và xem xét giá trị chuẩn với phân bố này.
Gọi giá trị trung bình thực của mẫu mà \eta, với số lượng mẫu là 14, nếu các mẫu được lấy từ một phân bố chuẩn thì \eta sẽ có phân bố Student với bậc tự do là \nu = 14 - 1=13. Khoảng tin cậy của giá trị trung bình thực của mẫu mà \eta sẽ được tính như sau:

\bar y - t_{\nu ,{\alpha \mathord{\left/  {\vphantom {\alpha 2}} \right.  \kern-\nulldelimiterspace} 2}} .s_{\bar y} \le \eta \le \bar y + t_{\nu ,{\alpha \mathord{\left/  {\vphantom {\alpha 2}} \right.  \kern-\nulldelimiterspace} 2}} .s_{\bar y} (1)

Trong đó \bar ys_{\bar y} là giá trị trung bình (1.4 mg/l) và sai số chuẩn (0.083 mg/l) tính được từ 14 mẫu. Chú ý rằng sai số chuẩn có ý nghĩa là độ lệch chuẩn tương đối, bình quân của độ biến thiên trên số mẫu: s_{\bar y} = \frac{s}{{\sqrt n }} với s là độ lệch chuẩn, tính bằng căn bậc hai của phương sai. \alpha là mức ý nghĩa đại diện cho xác suất giá trị trung bình xuất hiện bất thường, nằm ngoài khoảng tin cậy, được tính bằng cách lấy 1 trừ đi độ tin cậy đã chọn. t_{\nu ,{\alpha \mathord{\left/  {\vphantom {\alpha 2}} \right.  \kern-\nulldelimiterspace} 2}} là giá trị trên phân bố Student đại diện cho xác suất của miền tin cậy đã chọn.

Với mức ý nghĩa \alpha chọn là 5%, bậc tự do là 13, giá trị t_{\nu ,{\alpha \mathord{\left/  {\vphantom {\alpha 2}} \right.  \kern-\nulldelimiterspace} 2}} tra bảng được là 2.16, khoảng dao động của giá trị trung bình được tính theo công thức trên là:

1.4 - 2.16 \times 0.083 \le \eta \le 1.4 + 2.16 \times 0.083
hay
1.22 \le \eta \le 1.58

Từ 14 mẫu đo được, với giá trị trung bình đo được là 1.4, độ lệch chuẩn là 0.31, độ tin cậy là 90% (hay mức ý nghĩa 5% cho mỗi bên) ta có thể hình dung được rằng giá trị trung bình thực tế là một biến ngẫu nhiên mà 90% giá trị rơi vào khoảng [1.22; 1.58]. Do đó, giá trị chuẩn là 1.2 (mg/l) không nằm trong khoảng này hay nói cách khác sự khác biệt giữa giá trị trung bình đo (1.4 mg/l) với chuẩn (1.2 mg/l) là không ngẫu nhiên vì xác suất xuất hiện giá trị trung bình bằng 1.2 mg/l đối với hệ thống 14 phòng thí nghiệm trên nằm trong khoảng nhỏ hơn 5%. Vậy, với mức ý nghĩa 5% có thể kết luận các các phòng TN sử dụng phương pháp chuẩn độ Winkler để phân tích DO tồn tại một sai số hệ thống do những tác nhân đặc biệt nào đó cần phải tìm hiểu.

Cách tiếp cận 2: Lập giả thiết và kiểm định giả thiết đó. Mục tiêu là ta phải biết được sự sai biệt là dương hay âm, hoặc quá nhỏ không đủ để khẳng định chúng khác nhau.

Với cách này, ta lập giả thiết (giả sử) rằng giá trị trung bình thực và tiêu chuẩn cho trước không khác nhau (độ chênh lệch t bằng 0) và ta kiểm định giả thiết này xem có đúng hay không. Bằng cách xem độ lệch t giữa giá trị trung bình thực \eta và giá trị tiêu chuẩn \eta _0 (1.2 mg/l) là một biến ngẫu nhiên với phân bố xác suất Student có bậc tự do là \nu =13, ta coi thử độ lệch thực tế (giá trị trung bình thực-giá trị tiêu chuẩn = 1.4 – 1.2 = 0.2) có nằm trong miền dao động cho phép của độ lệch t hay không.

Nếu ta trừ các vế của bất phương trình (1) cho giá trị tiêu chuẩn \eta _0 sẽ có biên độ dao động của độ lệch t như sau:

\bar y - \eta _0 - t_{\nu ,{\alpha \mathord{\left/  {\vphantom {\alpha 2}} \right.  \kern-\nulldelimiterspace} 2}} .s_{\bar y} \le \eta - \eta _0 \le \bar y - \eta _0 + t_{\nu ,{\alpha \mathord{\left/  {\vphantom {\alpha 2}} \right.  \kern-\nulldelimiterspace} 2}} .s_{\bar y}
hay
1.22 - 1.2 \le t \le 1.58 - 1.2
hay
0.02 \le t \le 0.38

Đến đây ta có thể thấy được rằng với độ tin cậy 90% đã chọn, biến ngẫu nhiên mô tả độ lệch t có 90% giá trị nằm trong khoảng [0.02; 0.38], do đó khả năng xuất hiện giá trị độ lệch t=0 là nhỏ hơn 5% (dữ liệu trong trường hợp này coi là lệch dương). Do đó giả thiết ban đầu bị bác bỏ có nghĩa là tồn tại một sai số hệ thống với 14 phòng thí nghiệm khi tiến hành đo DO với phương pháp chuẩn độ Winkler.

Một điều nữa cũng cần phải bàn tới nữa là khía cạnh phương pháp luận của việc sử dụng mức ý nghĩa \alpha hay thường đề cập là trị số p (p-value) để bác bỏ hay chấp nhận giả thiết. Thực tế là ra chỉ khẳng định xác suất để xuất hiện của một sự kiện dựa trên số liệu có được (ở đây là xác suất xuất hiện giá trị trung bình bằng 1.4 mg/l trên 14 mẫu và giá trị này không nằm trong miền dao động của 90% giá trị trung bình thật) chứ chưa thật sự tính xác suất chấp nhận hay bác bỏ giả thiết. Có thể tham khảo thêm một bài viết rất hay của Thầy Tuấn về vấn đề này: Ý nghĩa của trị số p trong nghiên cứu khoa học.

Vậy là ta đã khảo sát hai cách tiếp cận để suy diễn giá trị trung bình bằng con mắt thống kê. Mời các bạn ra quyết định cho một số vấn đề sau nhé (trích trong sách Statistics for Environmental Engineers).

1. Vấn đề cáu bẩn ở nồi hơi.
Một công ty bán hóa chất quảng cáo rằng hóa chất A của họ có thể tẩy được 90% cáu bẩn ở nồi hơi. Qua kiểm tra thực tế 10 mẫu ngẫu nhiên thì hiệu quả trung bình là 81%, số liệu như sau:

92

60

77

92

100

90

91

82

75

50

Các nhà chức trách cho rằng công ty quảng cáo sai vì 81% < 90%, nhưng công ty bảo rằng các kết quả mang tính thống kê là 81% nhưng thực tế hiệu quả là 90%. Ai đúng, ai sai? Tại sao?
2. Vấn đề lên men sinh học.
Một nhà sản xuất ga bằng phương pháp lên men sinh học rao bán sản phẩm của mình với đảm bảo là: hàm lượng mêtan trung bình là 72%. Người ta tiến hành kiểm định 7 mẫu ngẫu nhiên với kết quả là:

64

65

75

67

65

74

75

Ta xem thử nhà sản xuất tuyên bố có hợp lý hay không hay nói cách khác xem quảng cáo có “quá lời” hay không?
3. Vấn đề tiêu chuẩn xả thải.
Một nhà máy được yêu cầu xả thải có nồng độ COD trung bình trong một tháng không quá 50 mg/l. quy trình kiểm tra là người ta sẽ lấy 20 mẫu ngẫu nhiên trong tháng, sau đó xây dựng khoảng tin cậy, sao cho giá trị 50 mg/l không nằm ngoài khoảng tin cậy đó là được. Giả sử ta có kết quả 20 mẫu phân tích COD như sau:

57

60

49

50

51

60

49

53

49

56

64

60

49

52

69

40

44

38

53

66

Câu hỏi đặt ra là với kết quả này, nhà máy đó có tuân thủ yêu cầu xả thải không?

Discussion

No comments yet.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: