you're reading...
Thống kê ứng dụng, Xác suất thống kê, Đại số tuyến tính

Định thức, trị riêng và vector riêng trong thống kê ứng dụng

Hồi còn đại học, đến môn đại số tuyến tính rất hấp dẫn nhưng học xong thì không biết để làm gì, nhất là khi đụng đến các khái niệm khá trừu tượng. Một trong những khái niệm hơi khó hiểu và học xong không biết nó dùng để làm gì đó là “trị riêng” và “vector riêng” (còn gọi là trị đặc trưng và vector đặc trưng). Đây là một cặp khái  niệm rất quan trọng trong đại số tuyến tính và có nhiều ứng dụng thực tế. Một bài viết rất hay, dễ hiểu về trị riêng và vector riêng do anh Ngô Quang Hưng viết có thể được tham khảo ở đây. Bài viết này sẽ bàn về một số vai trò của trị riêng và vetor riêng trong lĩnh vực thống kê ứng dụng.

Trước hết, có lẽ nói một chút về vai trò của vector và ma trận, các phần tử cơ bản của đại số tuyến tính. Tại sao cần phải có vector và ma trận? Xuất phát từ nhu cầu thực tế của con người là (1) mô tả thế giới dưới dạng thông tin, (2) lưu trữ thông tin và (3) xử lý thông tin để đem lại tri thức. Bản chất thông tin là nhiều chiều nên vector và ma trận ra đời để hỗ trợ cho quá trình tiếp nhận, trao đổi thông tin của con người. Ví dụ để mô tả vị trí một điểm trên một đường thẳng, ta chỉ cần một giá trị khoảng cách của điểm đó đến một điểm được chọn làm gốc, lúc này ta chỉ cần một vector có một phần tử. Nếu điểm đó nằm trên một mặt phẳng, ta cần có một hệ trục tọa độ (gồm hai trục x và y) và vị trí điểm đã cho được xác định dựa trên khoảng cách của nó đến hai trục tọa độ đó. Lúc này ta cần một vector hai chiều (có 2 phần tử) để mô tả vị trí một điểm trên một mặt phẳng. Mở rộng hơn tý nữa, để mô tả một điểm trong không gian ta cần một vector ba chiều (có 3 phần tử). Suy rộng ra nữa, giả sử ta muốn mô tả một đứa bé, ta cần rất nhiều thông tin như giới tính, tuổi, tên, chiều cao, cân nặng, ngày tháng năm sinh…Các thông tin này có thể được lưu trữ dưới dạng một vector có số chiều ứng với số thông số cần mô tả cho đứa bé đó. Do đó, có thể xem vector là một đại lượng có nhiều phần tử dùng để chứa thông tin nhiều chiều theo nhu cầu thực tế đặt ra.

Còn ma trận? Ma trận có thể được coi là một dãy gồm nhiều “cột” vector nối tiếp nhau trong đó mỗi cột đại diện cho một đối tượng nào đó. Theo ví dụ trên có thể là nhiều em bé khác nhau. Do đó một ma trận có thể chứa thông tin của nhiều em bé được khảo sát, thông tin mỗi em bé được lưu trong một cột và mỗi thông số mô tả được lưu trong một hàng. Trong quan trắc môi trường, khi muốn khảo sát chất lượng nước của một ống xả theo thời gian, ta có thể dùng ma trận trong đó mỗi cột đại diện cho một thời điểm quan trắc và mỗi hàng ghi nhận cho một thông số chất lượng nước khác nhau. Một ví dụ nữa trong quản lý chất lượng, khi muốn khảo sát biến thiên của chất lượng sản phẩm đầu ra, người ta thường lấy mẫu theo mẻ (mỗi lần lấy một số mẫu trong tổng số sản phẩm đầu ra của mẻ) tại từng thời điểm định trước. Lúc này mỗi cột của ma trận biểu diễn kết quả mỗi mẻ đo đạc tại một thời điểm lấy mẫu và các hàng biểu diễn kết quả các mẫu trong mẻ đó.

Sau khi “mô tả” thông tin của các đối tượng và “lưu trữ” chúng bằng các vector và ma trận, việc tiếp theo là con người cần “xử lý” để đem lại tri thức có nghĩa là cố gắng tìm kiếm mối liên hệ giữa các vector và ma trận đó (tùy từng bài toán cụ thể) nhằm mục đích giúp con người hiểu được bản chất vấn đề cần quan tâm.

Theo bản chất, các mối liên hệ có thể được xem là quan hệ tuyến tính và phi tuyến. Mặc dù trong thực tế hầu hết các mối quan hệ là phi tuyến nhưng khi tiếp cận để khảo sát, người ta thường chọn cách tiếp cận của mối liên hệ tuyến tính vì các lý do sau: (1) tính toán đơn giản, (2) nhiều mối liên hệ phi tuyến có thể được xấp xỉ bằng hoặc là được coi như một tổng các quan hệ tuyến tính trong một số điều kiện nào đó chẳng hạn như khi ta thu hẹp hoặc chia nhỏ phạm vi tính toán, (3) các quan hệ phi tuyến có thể được chuyển đổi thành quan hệ tuyến tính qua một phép chuyển đổi (transformation) nào đó tùy vào bản chất vấn đề.

Do đó, các quan hệ tuyến tính mặc dù là “lý tưởng” nhưng đóng vai trò cực kỳ quan trọng trong việc khảo sát các mối quan hệ trong thực tế. Để diễn tả một mối quan hệ tuyến tính nào đó giữa một vector (biễu diễn thông tin của một đối tượng bằng n chiều) với một vector khác (biễu diễn thông tin của một đối tượng khác bằng m chiều), người ta dùng một ma trận có n hàng và m cột.  Trong nhiều trường hợp hai đối tượng có số chiều bằng nhau và ta có một ma trận vuông để biểu diễn mối quan hệ tuyến tính giữa chúng. Lúc này, định thức, trị riêng và vector riêng có vai trò trong quá trình con người tìm kiếm các mối quan hệ như vậy bằng ngôn ngữ của đại số tuyến tính.

Giả sử ma trận vuông A đại diện cho một phép biến đổi tuyến tính nào đó, nếu ta tìm được một vector sao cho biến đổi tuyến tính của ma trận A lên vector đó không làm thay đổi chiều, chỉ thay đổi độ lớn của vector đó, vector ứng với độ lớn thay đổi đó được gọi là vector riêng và trị riêng tương ứng. Một phép biến đổi tuyến tính A có thể có nhiều cặp trị riêng và vector riêng như vậy. Do đó, tính chất này của trị riêng và vector riêng trở nên cực kỳ quan trọng khi khảo sát các bài toán động, ở đó ta thực hiện các biến đổi tuyến tính lặp lại nhiều lần. Thay vì tính lũy thừa của ma trận của phép biến đổi tuyến tính đó, ta chỉ cần tính lũy thừa của trị riêng một cách đơn giản hơn. Biễu diễn toán học cho vấn đề này như sau: Nếu A*x = lamda*x thì A^k*x = (lamda)^k*x. Ta có thể gặp ứng dụng này trong các bài toán liên quan đến tăng trưởng, suy thoái, dao động hoặc các vấn đề liên quan chuỗi Makov. Phần này sẽ được đề cập trong một entry riêng.

Để hình dung vai trò độ lớn của trị riêng, phần này liên quan mật thiết khái niệm khoảng cách trong thống kê, trước hết ta chú ý vai trò đầu tiên của ma trận trong thống kê là lưu trữ các dữ liệu quan sát được trong đó các cột biểu diễn các đối tượng còn các hàng biễu diễn các quan sát cho những đối tượng đó. Vậy một ma trận m x n có thể biểu diễn n biến ngẫu nhiên trong đó mỗi biến ta có m mẫu được quan sát.

Quay lại đại số tuyến tính chút. Trong một ma trận vuông, giá trị tuyệt đối của định thức bằng thể tích (là diện tích nếu là ma trận 2 x 2) của không gian hình hộp tạo bởi các vector của ma trận đó. Nếu có bất kỳ hai vector phụ thuộc tuyến tính, thể tích đó hay định thức sẽ bằng không. Do đó, có thể hiểu rằng định thức đo mức độ độc lập tuyến tính của các vector của ma trận đó. Nếu cố định chiều dài các vector, định thức (trị tuyệt đối) sẽ có giá trị cực đại khi các vector trực giao vì lúc đó thể tích của khối hình hộp là lớn nhất.

Vậy định thức có liên quan thế nào với trị riêng và vector riêng? Có hai tính sau chất cần chú ý của trị riêng:
(1) Tích của các trị riêng sẽ bằng định thức của ma trận.
(2) Tổng các trị riêng sẽ bằng tổng các giá trị trên đường chéo của ma trận.

Từ đây ta có thể suy luận như sau: trong một ma trận vuông, các phần tử nằm trên đường chéo chứa thông tin mô tả thể tích không gian hình hộp tạo bởi các vector của ma trận. Tổng giá trị các phần tử này sẽ phân bố cho các trị riêng, độ lớn của các trị riêng sẽ cho ta biết độ lớn của không gian hình hộp theo hướng của vector riêng tương ứng. Hay nói cách khác, phân bố của dữ liệu mô tả bởi ma trận theo hướng các vector riêng sẽ tỷ lệ với độ lớn của trị riêng tương ứng của nó. Cái này ta có thể thấy rõ qua một số ứng dụng khi xử lý số liệu thống kê như sau:

Ví dụ 1:

Với một ma trận m x n mà các vector cột của nó là các biễn ngẫu nhiên, mỗi hàng là một quan sát biến cố của biến ngẫu nhiên đó, để tìm hiểu thông tin về độ biến thiên của thông tin cũng như mối tương quan của các biến ngẫu nhiên với nhau, người ta thường tính ma trận hiệp phương sai (covariance matrix) S. Ma trận hiệp phương sai này là một ma trận vuông có kích thước n x n, các phần tử trên đường chéo nó có giá trị bằng phương sai của từng biến ngẫu nhiên, các phần tử hai bên đường chéo phản ánh hiệp phương sai giữa các biến. Với ma trận hiệp phương sai này, sự phân tán của dữ liệu có thể phân tích theo hai mức độ.
(1) Một cách sơ bộ, nếu ta tính định thức (lấy trị tuyệt đối) của ma trận hiệp phương sai, ta sẽ có một giá trị gọi là phương sai tổng quát (tạm dịch từ generalized variance) \left| {\bf{S}} \right|. Giá trị này mô tả xu thế phân tán chung của n biến ngẫu nhiên quanh các giá trị trung bình của chúng.
(2) Cụ thể hơn, nếu ta tính trị riêng và vector riêng của ma trận hiệp phương sai S, ta sẽ xác định mức độ phân bố của dữ liệu theo các hướng của vector riêng ứng với trị riêng của nó. Hướng nào có trị riêng lớn nhất thì dữ liệu sẽ phân bố theo hướng đó nhiều nhất. Chú ý thêm là tổng các trị riêng sẽ bằng tổng các giá trị trên đường chéo của ma trận S nên thông tin về phương sai sẽ được bảo toàn khi mô tả bằng trị riêng.

Ví dụ 2:

Với m x n ở trên, nếu ta có nhu cầu mô tả khoảng cách xác suất của n biến ngẫu nhiên đến gốc tọa độ của không gian n chiều của nó: {\bf{d}}^2  = {\bf{x}}^T {\bf{Ax}} trong đó x là vector đại diện cho n biến ngẫu nhiên. Lúc này ma trận A sẽ đối xứng nên việc tính toán khoảng cách sẽ rất tiện lợi khi sử dụng phân tích phổ (tạm dịch từ spectral decomposition). Phân tích phổ cho phép biểu diễn ma trận A bằng một tổng của các ma trận cơ sở và trị riêng tương ứng: {\bf{A}} = \sum\limits_{i = 1}^p {{\bf{\lambda }}_i {\bf{e}}_i {\bf{e}}_i^T }

Discussion

No comments yet.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: