you're reading...
Giáo dục

Bàn một chút về đánh giá

Chủ đề liên quan đến đánh giá thì rất rộng, nhân tiện đọc một số bài báo viết về hiện tượng các trường khó khăn trong việc tuyển học sinh đầu vào vì…quá nhiều học sinh có kết quả “xuất sắc”, có “điểm giỏi 100/100” [1]. Chuyện nguyên nhân vì sao thì cũng có nhiều phân tích rồi. Hôm nay mình lạm bàn một chút về góc độ khoa học của việc đánh giá, với câu hỏi đặt ra là:

Chúng ta nên đánh giá bằng cách định lượng (cho điểm) như thế nào là hợp lý sao cho kết quả đánh giá đáp ứng các tiêu chí: (1) mang tính khoa học; (2) thể hiện được năng lực thật sự của đối tượng được đánh giá; (3) có thể dùng để xét tuyển, chọn lọc các đối tượng một cách khách quan?

Khi chúng ta bảo bạn An cao, có nghĩa là muốn nói bạn An cao hơn một bạn nào đó, nếu không ám chỉ bạn An cao hơn ai, thì điều đó ngầm ý rằng bạn An cao hơn mức trung bình của tất cả các bạn cùng lứa tuổi/giới tính với bạn An (phạm vi theo ngữ cảnh, có thể là 1 lớp học, 1 trường, 1 thành phố…). Tương tự vậy, nếu khẳng định bạn Bảo là xuất sắc vì có thể nhảy cao được 80cm nhưng nếu hầu hết các bạn khác trong trường (cùng tuổi bạn Bảo) đều nhảy cao được 80cm thì khẳng định đó là chưa hợp lý vì thành tích của bạn Bảo chỉ nên được xem là bình thường do đa số các bạn khác đều làm được. Vì vậy, đánh giá nên dựa trên sự so sánh một cách tương đối giữa các đối tượng với nhau.

Do đó, việc đánh giá một năng lực nào đó của một đối tượng nên mang tính chất tương đối, so sánh đối tượng đó với đám đông. Có một số câu hỏi đặt ngược lại mình như sau: Học sinh lớp một ngày xưa học cộng trừ trong phạm vi 10, ví dụ có khoảng 10% bạn có khả năng tính cộng trừ thông thạo trong phạm vi 10 sẽ được xếp loại giỏi, bây giờ điều kiện học tốt hơn, trẻ con giờ lớp 1 đa số thông thạo trong phạm vi 10, thậm chí đến 100 là chuyện thường, vậy cần phải đánh giá là giỏi hết, đâu có gì là không hợp lý? Và, chúng ta nên đưa ra một cái chuẩn, bạn nào đạt thì cứ đánh giá là giỏi, và việc trẻ con thành phố đạt loại giỏi nhiều hơn nông thôn là chuyện hợp lý, có gì sai đâu?

Ý tưởng đưa ra từ các câu hỏi trên dựa trên quan sát từ thực tế, rằng học sinh có thể tính được phép tính này, giải được bài toán kia, viết được bài văn với các ý như vậy…thì sẽ đạt điểm cao, có thể đạt điểm tối đa. Nhưng chúng ta nên đặt câu hỏi rằng: với cách đánh giá phổ biến hiện nay, liệu học sinh làm hết các yêu cầu, đạt điểm cao, có thể hiện được năng lực thực sự của các em hay không?

Vậy yêu cầu đặt ra để kiểm tra năng lực nói chung nên như thế nào? Trước hết chúng ta nên phân biệt rõ giữa “thông tin” và “kiến thức”. Thông tin là những dữ kiện chúng ra nạp vào, còn kiến thức chỉ có được sau khi đã xử lý thông tin theo một phương pháp nào đó. Từ thông tin, chúng ta có thể hệ thống được vấn đề, có thể so sánh, nhìn ra được quy luật…đó là kiến thức. Nếu một hệ thống đánh giá chỉ đánh giá được mức độ thông tin nạp vào thì không đánh giá được năng lực thật sự của đối tượng mà chỉ phản ánh được mức độ “biết” nhiều ít, chứ không phải mức độ “hiểu” (phản ánh lượng kiến thức và năng lực tư duy). Ngay cả việc học sinh có thể giải quyết một số vấn đề khó một cách thành thạo nhưng nếu chỉ dừng lại với các vấn đề quen thuộc thì kết quả đánh giá đó cũng chỉ đánh giá mức độ “biết” mà thôi.

Đánh giá, có nhiều hình thức để đánh giá năng lực của đối tượng. Nhưng có lẽ một trong hệ thống đánh giá năng lực tư duy khách quan nhất của chúng ta hiện nay là trắc nghiệm IQ. Nói đến IQ không thể không nhắc đến phân phối chuẩn. Hệ thống đánh giá IQ dựa trên ý tưởng nền tảng là năng lực của các cá nhân trong đám đông luôn tuân theo quy luật phân phối chuẩn (hình minh họa), nghĩa là với mức điểm trung bình là 100, có 68% dân số có điểm kiểm tra từ 85 đến 115, có thể xem là nhóm có năng lực ở mức “trung bình”; Từ 70 đến 85 điểm và từ 115 đến 130 điểm chiếm mỗi bên 14% tương ứng với nhóm thấp hơn trung bình (yếu) và cao hơn trung bình (khá, giỏi); còn từ 130 điểm trở lên có thể gọi là nhóm xuất sắc và nhóm có điểm nhỏ hơn 70 điểm tương đương với năng lực kém, khó mà có khả năng học hành bình thường, hai nhóm này chiếm khoảng hơn 2% mỗi nhóm.

Phân phối chuẩn rất phổi biến trong các hiện tượng liên quan đến các chỉ số đo đạc liên quan đến sinh học tự nhiên như chiều cao, trọng lượng cơ thể…Việc ứng dụng phân phối chuẩn vào việc đánh giá có thể đáp ứng được các tiêu chí đã đặt ra ở trên: (1) mang tính khoa học; (2) thể hiện được năng lực thật sự của đối tượng được đánh giá; (3) có thể dùng để xét tuyển, chọn lọc các đối tượng một cách khách quan. Và bài trắc nghiệm IQ cũng đáp ứng được về mặt nội dung cho việc đánh giá là vì nó không tập trung vào kiểm tra phần “thông tin” (phần “biết”) mà thông tin chỉ là nền tảng cho việc giải quyết các vấn đề, nghĩa là chú trọng vào kiểm tra phần “kiến thức” (phần “hiểu”).

Do đó, khi nào hệ thống đánh giá của chúng ta được thiết kế theo hướng sao cho kết quả đánh giá phản ánh được năng lực tư duy thật sự của học sinh, kết quả thu được tuân theo quy luật phân phối chuẩn, lúc đó sẽ không còn trường hợp các trường bị …choáng bởi việc lạm phát thành tích, khó khăn cho việc xét tuyển nữa.

Phân phối chuẩn của kết quả trắc nghiệm IQ.

Phân phối chuẩn của kết quả trắc nghiệm IQ.

[1] http://vietnamnet.vn/vn/giao-duc/242078/boi-roi-voi-1-000-ho-so-dat-diem-gioi-100-100.html

Discussion

No comments yet.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: