you're reading...
Xác suất thống kê

Một chút về xác suất và thống kê

Nên hình dung khái niệm xác suất như thế nào cho đơn giản? Tại sao phải có khái niệm này?

Giả sử ta chắc chắn được những gì xảy ra, chắc chắn được mọi vấn đề là đúng hay sai, có lẽ sẽ không có khái niệm xác suất. Mọi thứ đều tương đối, đều “có thể”. Đó là lý do then chốt mà xác suất cần phải có. Xác suất ra đời để mô tả tính “không chắc chắn” (tính bất định) của thông tin chúng ta có được. Ví dụ, bạn đang đọc blog này trên một trang web có nền màu trắng, vậy xác suất của thông tin “blog này trên một trang web có nền màu trắng” là 100%? Có thể, nếu thật sự là nó màu trắng, bạn thấy nó là màu trắng và tin chắc như vậy, bạn có thể khẳng định xác suất của thông tin trên là 100%. Nhưng một người khác khi nhận thông tin đó có thể có quyền nghi ngờ, người đó thể cho rằng có khả năng quá trình nhìn bị lệch màu, hoặc màn hình máy tính bị hư, biến từ màu khác thành màu trắng…hoặc bất kỳ lý do nào khác. Với người đó, thông tin “blog này trên một trang web có nền màu trắng” không thể tin cậy 100% được mà nó chỉ có thể đúng với một xác suất nào đó. Xác suất là khái niệm dùng để diễn tả mức độ tin cậy của con người với thông tin mình có được.

Do đó, chỉ có tất cả thông tin từ thế giới hiện hữu tồn tại khách quan xung quanh chúng ta là thật và chỉ có xác suất của “sự thật” đó là 100%. Không may cho con người là ta không thể nào kiểm chứng được 100% sự thật đó. Chúng ta chỉ có thể thu thập thông tin, đánh giá chúng qua nhận thức của mình. Chính quá trình thông tin đi qua lăng kính của con người này làm cho nó không còn được tin cậy với 100% niềm tin nữa. Hay nói cách khác, con người luôn luôn có thông tin với độ tin cậy không tuyệt đối, tính chắc chắn của thông tin luôn nhỏ hơn 100%. Điều này luôn xảy ra xung quanh ta từ khi ta sinh ra đến khi mất đi. Tất cả các hoạt động, các quyết định của con người luôn đi kèm với một xác suất, độ rủi ro hay may mắn nào đó. Khi ta tung một đồng xu, không thể chắc là nó sấp hay ngửa; khi ta ăn một cái bánh, không thể chắc chắn được không bị đau bụng; khi ta đầu tư vào một cổ phiếu, không thể chắn chắn được ngày mai nó sẽ lên giá…

Thử lan man thêm một chút nữa tại sao xác suất tồn tại? Tận cùng cho câu hỏi này có lẽ phải trở về với quan điểm nhị nguyên luận triết học, nó sẽ cho ta cái lý lẽ tận cùng của vấn đề này. Như ta biết thế giới này tồn tại dựa trên hai mặt đối lập và không thể thiếu một trong hai. Không và có, âm và dương, có thể và không thể, chắc chắn và bất định nên không có cái gì là tuyệt đối. Thuyết tương đối của Albert Einstein ra đời cũng dựa trên quan niệm cổ điển này. Đi gần lại một chút, nguồn gốc sâu xa của cái không chắc chắn là quá trình chuyển động hỗn độn của vật chất. Vật chất, được cấu tạo bởi hai phần cơ bản âm và dương luôn ở trạng thái động, chuyển động không ngừng và không thể xác định đồng thời vị trí và vận tốc chuyển động của chúng (nguyên lý bất định). Chính điều này chi phối tính không chắc chắn của tất cả các quy luật trong khoa học tự nhiên cũng như khoa học xã hội.

Con người tương tác với thế giới xung quanh bằng thông tin thu thập được qua các giác quan và thông tin này được xử lý bằng não bộ. Kết quả của quá trình thu thập, xử lý thông tin là các tri thức giúp con người nhận thức và thay đổi thế giới. Như đã bàn ở trên, mọi thông tin con người có được luôn đi kèm với một xác suất nào đó hay nói cách khác luôn có một mức độ không chắc chắn. Vậy con người phải làm cách nào để đối phó với vấn đề này?

Con người không thể lấy được thông tin một cách liên tục và toàn bộ từ bên ngoài. Mọi cái con người có được là thông tin mang tính rời rạc và cục bộ bằng cách lấy mẫu từ quần thể mình cần khảo sát, nghiên cứu. Công cụ giúp con người nhìn, diễn dịch thế giới (quần thể) qua những thông tin (mẫu) mình có được là thống kê, công cụ làm việc với luật số lớn.

Một thống kê có thể hiểu là một số đo cho một thuộc tính nào đó của một tập mẫu. Mỗi giá trị thống kê được tính bằng một hàm nào đó và thông tin của môt thống kê mang tính đại diện cho thông tin của tập mẫu mang lại. Nói cách khác, các thống kê là những con số mang thông tin tóm tắt để mô tả một tập mẫu, từ đó gián tiếp mô tả thông tin của quần thể mà nó khảo sát.

Có thể nói thống kê được đặt trên nền tảng xác suất và mọi cái nhìn dưới góc độ thống kê đều đi kèm với xác suất và số đông. Với một sự kiện riêng biệt ta luôn không chắc về khả năng xảy ra của nó nhưng với một đám đông, ta có thể ước tính được khả năng này một cách chắc chắn hơn. Tung một đồng xu lên ta không thể phán 100% là sấp hay ngửa nhưng nếu ta tung chừng 1000 lần, tỷ lệ số lần sấp và ngửa sẽ hội tụ về con số 1/2 (Chứ không chắc chắn là bằng 1/2; Với giả định là đồng xu là cân đối, không thiên vị cho mặt nào). Đây cũng là triết lý của hai mặt chắc chắn và bất định của một vấn đề.

Thống kê là công cụ để con người làm việc với tính bất định của thông tin, nó nhìn các sự kiện xảy ra bằng các xác suất, mỗi một mẫu lấy từ quần thể tương đương với một sự kiện lấy từ một phân phối mô tả quần thể đó và dĩ nhiên sự kiện đó sẽ thừa hưởng phân bố xác suất của quần thể nó được lấy mẫu. Dựa trên nền tảng này, con người phát triển hàng loạt các công cụ thống kê để xử lý thông tin thu thập được, để hiểu về thế giới xung quanh qua quá trình suy diễn các thông tin đó.

Và tất nhiên là, mọi cái con người mình nhận thức được về thế giới xung quanh cũng chỉ mang tính …”xác suất”.

Discussion

No comments yet.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: