Phương pháp xử lý số liệu thị hiêu anova

Xử lý và phân tích số liệu hay dữ liệu nghiên cứu là một trong các bước cơ bản của một nghiên cứu, bao gồm xác định vấn đề nghiên cứu; thu thập số liệu; xử lý số liệu; phân tích số liệu và báo cáo kết quả. Xác định rõ vấn đề nghiên cứu giúp việc thu thập số liệu được nhanh chóng và chính xác hơn. Để có cơ sở phân tích số liệu tốt thì trong quá trình thu thập số liệu phải xác định trước các yêu cầu của phân tích để có thể thu thập đủ và đúng số liệu như mong muốn. Điều cốt lõi của phân tích số liệu là suy diễn thống kê, nghĩa là mở rộng những hiểu biết từ một mẫu ngẫu nhiên thành hiểu biết về tổng thể, hay còn gọi là suy diễn quy nạp. Muốn có được các suy diễn này phải phân tích số liệu dựa vào các test thống kê để đảm bảo độ tin cậy của các suy diễn. Bản thân số liệu chỉ là các số liệu thô, qua xử lý phân tích trở thành thông tin và sau đó trở thành tri thức. Đây chính là điều mà tất cả các nghiên cứu đều mong muốn. Trong khuôn khổ của bài viết này, tác giả muốn trình bày với người đọc một số khái niệm và kỹ thuật cơ bản khi xử lý và phân tích số liệu. Bên cạnh đó, tác giả giới thiệu một số thao tác cơ bản khi xử lý số liệu trên phần mềm SPSS, một phần mềm xử lý thông kê được sử dụng nhiều nhất hiện nay. 1. Xử lý số liệu nghiên cứu Ngày nay, hầu hết các nghiên cứu đều xử lý số liệu trên các phần mềm máy tính. Do vậy, việc xử lý số liệu phải qua các bước sau:-Mã hóa số liệu: Các số liệu định tính (biến định tính) cần được chuyển đổi (mã hóa) thành các con số. Các số liệu định lượng thì không cần mã hóa.-Nhập liệu: Số liệu được nhập và lưu trữ vào file dữ liệu. Cần phải thiết kế khung file số liệu thuận tiện cho việc nhập liệu.-Hiệu chỉnh: Là kiểm tra và phát hiện những sai sót trong quá trình nhập số liệu từ bảng số liệu ghi tay vào file số liệu trên máy tính. 2. Phân loại các số liệu (biến số) trong nghiên cứu Có 2 loại biến số chính trong hầu hết các nghiên cứu đố là biến số định tính và biến số định lượng.-Biến định tính: là loại biến số phản ảnh tính chất, sự hơn kém. Có thể biểu diễn dưới dạng định danh (ví dụ: nam/nữ) hay thứ bậc (tốt/khá/trung bình/yếu)…Đối với loại biến số này ta không tính được giá trị trung bình của số liệu.-Biến định lượng: Thường được biểu diễn bằng các con số. Các con số này có thể ở dưới dạng biến thiên liên tục (ví dụ: huyết áp của bệnh nhân theo thời gian) hoặc rời rạc (ví dụ: chiều cao, cân nặng của người bệnh lúc vào viện). Dạng

Trong nghiên cứu khoa học thống kê, kiểm định Anova là một phương pháp được nhiều người áp dụng để so sánh giá trị từ các bộ dữ liệu khác nhau. Các phân tích Anova ngày càng chứng minh sự hữu ích và quan trọng của mình trong các bài luận văn. Vậy bạn đã biết Kiểm định Anova là gì? Sử dụng kiểm định Anova ra sao và thực hành như thế nào? Tất cả sẽ được giải đáp trong bài viết dưới đây của Tri Thức Cộng Đồng.

Mục lục

  • 1. Khái niệm về kiểm định Anova
  • 2. Tổng hợp 3 loại phân tích Anova phổ biến
    • 2.1. One-way ANOVA
    • 2.2. Two-way ANOVA
    • 2.3. MANOVA 
  • 3. Ví dụ điển hình về kiểm định Anova
  • 4. Cách chạy Anova trong spss
    • 4.1. 6 bước phân tích Anova
    • 4.2. Cách phân tích kết quả

1. Khái niệm về kiểm định Anova

Khi mới tiếp xúc với các phương pháp phân tích thống kê trong nghiên cứu khoa học, nhiều người thường tự hỏi kiểm định ANOVA là gì? 

Kiểm định ANOVA (ANOVA test), hay còn được gọi là phân tích phương sai (Analysis of Variance), là một kỹ thuật thống kê tham số được sử dụng để phân tích sự khác nhau giữa giá trị trung bình của các biến phụ thuộc với nhau (Ronald Fisher, 1918). 

Hiểu đơn giản, đây là một công cụ giúp xác định ảnh hưởng của các biến độc lập với biến phụ thuộc trong một nghiên cứu hồi quy. Nhưng thay vì chỉ so sánh các đối tượng trong một nhóm nghiên cứu, phân tích ANOVA giúp so sánh trong phạm vi rộng hơn, giữa hai hoặc nhiều nhóm đối tượng.

Công cụ phân tích ANOVA sẽ chia một biến tổng hợp quan sát được tìm thấy bên trong tập dữ liệu thành 2 phần để phân tích:

  • Yếu tố hệ thống: Là yếu tố có ảnh hưởng thống kê đến tập dữ liệu đã cho
  • Yếu tố ngẫu nhiên: Ngược lại với yếu tố hệ thống, chúng không tác động đến tập dữ liệu có sẵn.

Ví dụ: Trong ứng dụng kinh doanh, bộ phận R&D sử dụng phân tích ANOVA thử nghiệm hai quy trình sản xuất khác nhau để xem liệu quy trình nào tốt hơn về hiệu quả chi phí so với quy trình còn lại.

2. Tổng hợp 3 loại phân tích Anova phổ biến

Kiểm định ANOVA bao gồm 3 phương pháp bao gồm: ANOVA một chiều (One-way ANOVA), ANOVA hai chiều (Two-way ANOVA) và ANOVA đa biến (MANOVA). Cụ thể từng phương pháp là gì, hãy tìm hiểu tiếp trong phần dưới đây.

2.1. One-way ANOVA

One-way ANOVA là một loại thử nghiệm thống kê nhằm đánh giá tác động của một biến độc lập duy nhất lên một biến phản hồi duy nhất. Nó giúp xác định xem tất cả các mẫu có giống nhau hay không. 

Tóm lại, One-way ANOVA được sử dụng để xác định liệu có bất kỳ sự khác biệt có ý nghĩa nào giữa các đối tượng của ba hay nhiều nhóm độc lập với nhau hay không.

Tất cả các kết quả trả ra đều dựa trên giả định rằng khả năng phạm sai lầm chỉ là 5%.

Ví dụ: Sử dụng One-way ANOVA để tìm hiểu xem liệu có sự phụ thuộc của độ tuổi khách hàng (Khách hàng trẻ tuổi, khách hàng trung niên và khách hàng cao tuổi) với hành vi mua hàng của họ hay không.

2.2. Two-way ANOVA

Two-way ANOVA có thể được coi là một phần mở rộng của phân tích One-way ANOVA. Vì đối với One-way ANOVA bạn chỉ có thể nghiên cứu ảnh hưởng của một biến độc lập với một biến phụ thuộc, còn Two-way ANOVA sẽ có 2 biến độc lập.

Phân tích Two-way ANOVA được sử dụng để quan sát sự tương tác giữa hai yếu tố và kiểm tra sự ảnh hưởng của 2 yếu tố đó lên biến phụ thuộc cùng một lúc.

Tương tự như trên, phương pháp này dựa trên giả định khả năng phạm lỗi chỉ là 5%.

Ví dụ: Two-way ANOVA Test giúp chúng ta tìm ra liệu sự ảnh hưởng của độ tuổi tới sự hài lòng giữa Nam và Nữ có khác nhau không.

2.3. MANOVA 

Một kiểm định MANOVA có thể có hai hoặc nhiều biến độc lập, và tương tự với biến phụ thuộc.

Trong thống kê, MANOVA không chỉ so sánh sự khác biệt về điểm trung bình giữa các nhóm mà còn giúp giả định mối quan hệ nhân - quả giữa các biến trong kiểm định. Theo đó, một học nhiều biến độc lập sẽ gây ra sự khác biệt đáng kể của một hoặc nhiều đặc điểm lên biến phụ thuộc.

3. Ví dụ điển hình về kiểm định Anova

Để Quý bạn đọc hiểu rõ hơn về cách thức vận dụng của kiểm định ANOVA thông qua ví dụ điển hình sau đây:

Một công ty muốn đào tạo nhân viên sử dụng chương trình bảng tính nâng cấp nội bộ để tăng tốc độ làm việc của mỗi người. Chuyên gia công ty đưa ra 3 khóa học: Beginner, Intermediate và Advanced. 

Tuy nhiên, chủ công ty không chắc chắn khóa học nào là cần thiết cho nhân viên. Nên ông đã quyết định thử nghiệm:

  • Gửi 10 người vào khóa học Beginner
  • Gửi 10 người khác vào khóa Intermediate
  • Gửi 10 người nữa cho khóa Advanced

Khi tất cả kết thúc khóa học, ông chủ đưa ra một vấn đề, yêu cầu học xử lý bằng chương trình bảng tính đã học và đo thời gian hoàn thành. 

Mục đích cuối cùng của ông chủ là nhằm xem xét liệu có sự khác biệt nào trong thời gian trung bình để hoàn thành vấn đề giữa 3 khóa học hay không.

Điều đó sẽ được thực hiện thông qua công cụ Phân tích phương sai một chiều One-way ANOVA. Chi tiết sẽ được hướng dẫn trong phần dưới đây.

4. Cách chạy Anova trong spss

Nối tiếp ví dụ được đề cập ở trên, trong phần này, Tri Thức Cộng Đồng sẽ hướng dẫn chi tiết cách chạy ANOVA trong SPSS thông qua 6 bước thực hành sau.

4.1. Tổng hợp 6 bước phân tích Anova

Bước 1: Nhập dữ liệu vào SPSS, sau đổi tại thanh công cụ chọn Analyze → Compare Means → One-way ANOVA

Bước 2: Khi hộp thoại One-way ANOVA được mở ra. Thao tác chuyển biến Time vào ô biến phụ thuộc (Dependent List) và biến Course vào ô nhân tố tác động (Factor) bằng cách kéo thả và sử dụng mũi tên ở giữa.

Bước 3: Một cửa sổ mới mở ra, chọn Post Hoc và tick chọn Tukey. Sau đó nhấn tiếp Continue.

Bước 5: Quay về hộp thoại ANOVA, chọn tiếp Options, tick vào ô Descriptive trong miền Statistic, sau đó nhấn Continue

Bước 6: Quay lại hộp thoại ANOVA chính, nhấn chọn OK và chờ kết quả

Đội ngũ của Tri Thức Cộng Đồng luôn lắng nghe, tư vấn tận tình cho từng khách hàng về DỊCH VỤ HỖ TRỢ SPSS, giảm bớt nỗi lo về thời gian, chi phí mà vẫn hoàn thành bài đúng thời hạn.

4.2. Cách phân tích kết quả

Sau khi thực hiện 6 bước như trên, ta nhận được bảng kết quả bao gồm 3 bảng, cụ thể Tri Thức Cộng Đồng sẽ giúp bạn phân tích kết quả tại mỗi bảng.

Bảng mô tả (Descriptives)

Bảng mô tả này cung cấp cho bạn các con số về Giá trị trung bình (Mean), Độ lệch chuẩn (Std. Deviation), Sai số (Std. Error) hoặc Độ tin cậy 95% cho biến phụ thuộc Time...

Bảng ANOVA

Các kết quả đầu ra phân tích chủ yếu dựa vào bảng ANOVA ở trên. Từ bảng này giúp ta đánh giá được liệu có sự khác biệt có ý nghĩa giữa các nhóm đối tượng thống kê hay không.

Chỉ số đáng quan tâm ở bảng trên là hệ số Sig. Nếu hệ số này nhỏ hơn 0.05 (Sig < 0.05) tức là khẳng định có sự khác biệt có ý nghĩa thống kê giữa các nhóm đối tượng.

Cụ thể, trong ví dụ trên, ta thấy hệ số Sig. = 0.021 < 0.05 ⇒ Có sự khác biệt có ý nghĩa về thời gian trung bình hoàn thành bảng tính giữa các khóa học với nhau.

Tuy nhiên để biết chi tiết mức khác biệt giữa các nhóm ra sao, chúng ta phải dựa vào bảng tiếp theo.

Bảng Multiple Comparisons

Với bảng Multiple Comparisons này, chúng ta sẽ phân tích rõ hơn sự khác biệt giữa các nhóm với nhau. Nếu giá trị Sig. nào nhỏ hơn 0.05 thì chứng tỏ có sự khác biệt về giá trị trung bình của đối tượng được so sánh.

Cụ thể, trong bảng trên, ta thấy có giá trị Sig. của Beginner và Intermediate là 0.046 < 0.05, chứng tỏ có sự khác biệt có ý nghĩa thống kê về thời gian để hoàn thành bảng tính giữa hai khóa học Beginner và Intermediate.

Tương tự, ta cũng thấy Sig. giữa khóa Beginner và Advanced là 0.034 < 0.05, tương tự cũng có sự khác biệt về thời gian hoàn thành bảng tính giữa hai khóa Beginner và Advanced.

Và nhận thấy hệ số Sig. giữa hai khóa Intermediate và Advanced lớn hơn 0.05 nên không có sự khác biệt nào giữa hai khóa học trên. 

Trên đây là toàn bộ thông tin hữu ích giúp bạn hiểu rõ Kiểm định ANOVA là gì cũng như cách sử dụng công cụ trong SPSS. Đây mới chỉ là những thông tin tổng quan và cơ bản nhất, tuy nhiên trên thực tế khi sử dụng công cụ phân tích ANOVA lại rất phức tạp và cần trải qua nhiều bước kiểm định chọn mẫu kỹ lưỡng. Do đó, nếu gặp phải các khó khăn thì hãy liên hệ ngay với Tri Thức Cộng Đồng để được hỗ trợ nhanh và chính xác nhất. 

Tài liệu tham khảo

  1. Hair, C & Ronald Fisher. (1917). "The Correlation between Relatives on the Supposition of Mendelian Inheritance." Investopedia: Fundamental Analytics. 
  2. Aylmer, R. (2020). Bách khoa toàn thư. UK: Britannica. 
  3. Minh Anh. (2018). Kiểm định ANOVA là gì? Các bước phân tích ANOVA. Tạp chí VietnamFinance.

Phương pháp xử lý số liệu thị hiêu anova

Content Manager tại Tri thức Cộng đồng

Xin chào, tôi là Hà Phương. Hiện tại Quản lý nội dung (Content Manager) của Tri Thức Cộng Đồng. Từ bé tôi đã yêu thích đọc sách và sáng tác nội dung, tôi đã nuôi dưỡng ước mơ và phấn đấu trong 5 năm để trở thành Quản lý nội dung tại Tri Thức Cộng Đồng. Với tôi mọi sự thành công đều cần ước mơ và nỗ lực. Bạn hãy tham khảo website https://trithuccongdong.net để tìm hiểu rõ hơn về công việc của tôi nhé.