29 0 7MB
MỤC LỤC LỜI MỞ ĐẦU CHƯƠNG 1: GIỚI THIỆU MÔ HÌNH PHƯƠNG TRÌNH CẤU TRÚC.......................... 1 1.1 Mô hình phương trình cấu trúc là gì? .................................................................................. 1 1.2 Các chú ý trong việc sử dụng mô hình phương trình cấu trúc ............................................ 3 1.2.1 Các biến tổng hợp .......................................................................................................... 3 1.2.2 Đo lường ........................................................................................................................ 4 1.2.3 Các thang đo .................................................................................................................. 6 1.2.4 Mã hoá ........................................................................................................................... 7 1.2.5 Phân phối dữ liệu ........................................................................................................... 8 1.3 Mô hình phương trình cấu trúc với mô hình đường dẫn bình phương tối thiểu riêng phần (PLS-SEM) ................................................................................................................................ 9 1.3.1 Mô hình đường dẫn với các biến tiềm ẩn ...................................................................... 9 1.3.2 Lý thuyết đo lường ...................................................................................................... 11 1.3.3 Lý thuyết cấu trúc ........................................................................................................ 11 1.4 PLS-SEM, CB-SEM và hồi quy dựa trên các điểm tổng .................................................. 12 1.4.1 Các đặc điểm dữ liệu ................................................................................................... 20 1.4.1.1 Yêu cầu kích thước mẫu tối thiểu ........................................................................... 20 1.4.1.2 Đặc điểm dữ liệu..................................................................................................... 24 1.4.2 Các đặc điểm mô hình ................................................................................................. 25 CHƯƠNG 2: BIẾN NGUYÊN NHÂN & BIẾN KẾT QUẢ .............................................. 27 2.1 Mô hình đo lường nguyên nhân & kết quả ........................................................................ 27 2.2 Minh họa tình huống nghiên cứu: xác định mô hình PLS - SEM ..................................... 33 2.3 Tạo mô hình đường dẫn bằng cách sử dụng phần mềm SmartPLS .................................. 39 CHƯƠNG 3: ĐÁNH GIÁ MÔ HÌNH ĐO LƯỜNG KẾT QUẢ ....................................... 47 3.1 Độ tin cậy nhất quán nội tại ............................................................................................... 48 3.2 Giá trị hội tụ ....................................................................................................................... 49 3.3 Giá trị phân biệt ................................................................................................................. 52 3.4 Minh họa tình huống nghiên cứu – mô hình đo lường kết quả ......................................... 60 PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
CHƯƠNG 4: ĐÁNH GIÁ MÔ HÌNH ĐO LƯỜNG NGUYÊN NHÂN ........................... 69 4.1 Bước 1: Đánh giá Giá trị hội tụ ......................................................................................... 70 4.2 Bước 2: Đánh giá mô hình đo lường nguyên nhân về vấn đề cộng tuyến ........................ 72 4.3 Cách đánh giá sự cộng tuyến và xử lý với các mức tới hạn .............................................. 74 4.4 Bước 3: Đánh giá ý nghĩa và mức độ liên quan của các biến quan sát nguyên nhân ....... 76 4.5 Hàm ý về số lượng biến quan sát được sử dụng dựa trên trọng số của biến quan sát ....... 78 4.6 Xử lý trọng số biến quan sát không có ý nghĩa ................................................................. 79 4.7 Thủ tục Bootstrapping ....................................................................................................... 82 4.7.1 Khái niệm .................................................................................................................... 82 4.7.2 Khoảng tin cậy Bootstrap ............................................................................................ 86 4.8 Minh họa tình huống nghiên cứu - đánh giá mô hình đo lường nguyên nhân .................. 92 4.8.1 Mở rộng mô hình đường dẫn đơn giản ........................................................................ 92 4.8.2 Đánh giá mô hình đo lường kết quả ..........................................................................101 4.8.3 Đánh giá mô hình đo lường nguyên nhân .................................................................106 CHƯƠNG 5: ĐÁNH GIÁ MÔ HÌNH CẤU TRÚC.......................................................... 120 5.1 Bước 1: Đánh giá sự cộng tuyến .....................................................................................122 5.2 Bước 2: Các hệ số đường dẫn mô hình cấu trúc.............................................................. 124 5.3 Bước 3: Hệ số xác định (giá trị R2)..................................................................................128 5.4 Bước 4: Hệ số tác động f2 ................................................................................................ 131 5.5 Bước 5: Phép dò tìm và sự liên quan dự báo Q2 ............................................................. 132 5.6 Bước 6: Hệ số tác động q2 ............................................................................................... 137 5.7 Minh họa tình huống nghiên cứu - làm thế nào để báo cáo kết quả mô hình cấu trúc PLSSEM? .....................................................................................................................................139 CHƯƠNG 6: MÔ HÌNH BẬC CAO..................................................................................154 6.1 Mô hình bậc cao và mô hình thành phần thứ bậc ............................................................ 154 6.2 Các mô hình thành phần thứ bậc .....................................................................................155 CHƯƠNG 7: PHÂN TÍCH BIẾN TRUNG GIAN & BIẾN ĐIỀU TIẾT ......................160 7.1 Tác động trung gian .........................................................................................................160 7.1.1 Giới thiệu ...................................................................................................................160 PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
7.1.2 Các dạng tác động trung gian ....................................................................................165 7.1.3 Kiểm định tác động trung gian ..................................................................................168 7.1.4 Đánh giá Mô hình Đo lường trong Phân tích trung gian ...........................................169 7.1.5 Tác động đa trung gian .............................................................................................. 170 7.1.6 Minh họa tình huống nghiên cứu - tác động trung gian ............................................172 7.2 Tác động điều tiết ............................................................................................................175 7.2.1 Giới thiệu ...................................................................................................................175 7.2.2 Các loại biến điều tiết ................................................................................................ 178 7.2.3 Mô hình hóa tác động điều tiết ..................................................................................179 7.2.4 Tạo số hạng tương tác................................................................................................ 181 7.2.5 Cách tiếp cận tích biến quan sát ................................................................................182 7.2.6 Cách tiếp cận trực giao .............................................................................................. 183 7.2.7 Cách tiếp cận hai giai đoạn ........................................................................................185 7.2.7.1 Hướng dẫn tạo Số hạng tương tác ........................................................................186 7.2.7.2 Đánh giá mô hình .................................................................................................189 7.2.7.3 Diễn giải các kết quả ............................................................................................ 190 7.3 Sự trung gian được điều tiết và Sự điều tiết được trung gian ..........................................192 7.4 Minh họa tình huống nghiên cứu – tác động điều tiết .....................................................197
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
LỜI MỞ ĐẦU GIỚI THIỆU VỀ PLS-SEM
Trong 5 năm gần đây PLS-SEM được sử dụng rộng rãi trong các nghiên cứu về thị trường, lĩnh vực marketing, du lịch lữ hành, quản trị chiến lược, hệ thống thông tin và dữ liệu lớn (big data). Thống kê của Hair Jr & cộng sự (2016) cho thấy hơn 500 bài báo khoa học chuyên ngành marketing, quản trị được công bố cho đến năm 2015 trên ba tạp chí hàng đầu. Tìm kiếm trên google scholar với từ khóa PLS-SEM, chúng tôi tìm thấy hơn 2.560.000 kết quả và chỉ riêng số bài báo có trích dẫn công trình của nhóm Hair Jr & cộng sự (2016) đã lên đến con số gần 3800 kết quả. Điều này chứng tỏ PLS-SEM có sự tin cậy nhất định đối với các nhà nghiên cứu và sử dụng nó trong quá trình kiểm định là một xu hướng đang được thế giới chấp nhận. PLS-SEM viết tắt từ cụm thuật ngữ Partial Least Square - Structural Equation Modeling - Mô hình phương trình cấu trúc dựa trên bình phương tối thiểu riêng phần. Khác với CB-SEM, PLS-SEM ước lượng các tham số của mô hình dựa trên ma trận phương sai (variance based matrix). Theo Hair & cộng sự (2016), PLS-SEM áp dụng kỹ thuật hồi quy bình phương tối thiểu (OLS) với mục tiêu làm giảm thiểu các sai số (tức là phương sai phần dư) của các biến phụ thuộc. Nói cách khác, PLS-SEM ước lượng các hệ số (các mối quan hệ mô hình đường dẫn) để tối đa hóa giá trị R2 của biến phụ thuộc (biến mục tiêu). Tính năng này đạt được mục tiêu dự báo của PLS-SEM. Do đó, PLS-SEM là phương pháp được ưa thích đối với nhà nghiên cứu khi mục tiêu nghiên cứu của họ là phát triển lý thuyết và giải thích sự thay đổi của biến phụ thuộc (dự báo biến nghiên cứu). PLS-SEM không sử dụng các chỉ số đo lường sự phù hợp của mô hình như CB-SEM. Ở PLS – SEM, sự tối đa hóa phương sai được giải thích thay vì giảm thiểu sự khác biệt giữa các ma trận hiệp phương sai như CB-SEM. Do đó, khái niệm sự phù hợp không hoàn toàn hợp lý với PLS-SEM như là phương pháp tìm ra một giải pháp khi ước lượng các
tham số mô hình (Hair & cộng sự, 2016). Những năm gần đây, một số nhà toán học đã phát triển chỉ số căn bậc hai phần dư chuẩn hóa (SRMR) để đánh giá sự phù hợp của mô hình trong PLS – SEM. Theo Henseler & cộng sự (2014), SRMR được xác định như là sự khác biệt căn bậc hai giữa các tương quan được quan sát và các tương quan của mô hình được đánh giá. Bởi vì SRMR là một đo lường về sự phù hợp mô hình tuyệt đối, giá trị SRMR bằng 0 cho thấy sự phù hợp hoàn hảo. Phiên bản phần mềm SmartPLS 3.2.7 mới nhất hiện nay cung cấp chỉ số này. PLS-SEM không nhất thiết phải sử dụng cỡ mẫu lớn như CB-SEM. PLS-SEM dùng cỡ mẫu tối thiểu 10 lần biến quan sát nguyên nhân (formative observator) lớn nhất được đo lường cho một khái niệm hoặc 10 lần số đường dẫn lớn nhất tác động đến một khái niệm trong mô hình (Barclay & cộng sự, 1995). Trong nhiều trường hợp Hair & cộng sự (2016) khuyên nhà nghiên cứu nên chọn công thức tính cỡ mẫu theo chuẩn của Cohen (1992). Một số nhà nghiên cứu PLS-SEM đã chứng minh rằng thuật toán của PLS - SEM không tính toán tất cả các mối quan hệ trong mô hình cấu trúc trong cùng một lúc. Thay vào đó, nó sử dụng hồi quy OLS để ước lượng các mối quan hệ hồi quy riêng phần của mô hình. Chin và Newsted (1999) đã đánh giá một cách hệ thống tính hiệu quả của PLS - SEM với các kích thước mẫu nhỏ và đã kết luận rằng nó hoạt động tốt. Gần đây hơn, nghiên cứu mô phỏng của Reinartz và cộng sự (2009) đã chỉ ra rằng PLS-SEM là sự lựa chọn tốt khi nhà nghiên cứu chỉ có dữ liệu với lượng mẫu nhỏ. Đối với sự phân phối của dữ liệu, đặc tính thống kê của PLS-SEM cung cấp những ước lượng mô hình mạnh mẽ với dữ liệu có đặc tính phân phối chuẩn cũng như phân phối không chuẩn (Ringle & cộng sự, 2009). Ngoài ra, theo Hair và cộng sự (2016), PLS-SEM được sử dụng khi nhà nghiên cứu đề xuất mô hình phức tạp. Nghĩa phức tạp được hiểu ở đây là mô hình có nhiều biến (lớn hơn 4 biến độc lập) và mối quan hệ trong mô hình chồng chéo, nhiều biến vừa đóng vai trò là biến độc lập, vừa là biến phụ thuộc. Tóm lại, PLS-SEM thể hiện nhiều ưu điểm vượt trội so với CB - SEM và các kỹ thuật phân tích thế hệ thứ nhất khác. Nhà nghiên cứu nên lựa chọn PLS-SEM khi mô hình nghiên cứu có chứa biến tiềm ẩn được đo lường qua các biến quan sát phản ánh
nguyên nhân, cỡ mẫu nhỏ và dữ liệu không phân phối chuẩn. Mô hình phân tích phức tạp cần nhiều kỹ thuật phân tích nâng cao với thang đo một hay nhiều cấp thì PLS-SEM được sử dụng rất phù hợp.
GIỚI THIỆU VỀ PHẦN MỀM SMARTPLS 3
Trong nghiên cứu kinh tế liên quan tới việc phân tích các dữ liệu sơ cấp đặc biệt là các nghiên cứu có sử dụng mô hình phương trình cấu trúc (SEM), AMOS là phần mềm được các nhà nghiên cứu tại Việt Nam sử dụng rộng rãi. Nhưng hiện nay kỹ thuật phân tích thế hệ thứ hai đã có những phần mềm thực hiện tốt những yêu cầu trên và hơn hết là cách sử dụng thân thiện, hiệu quả, trực quan. Một trong số đó phải kể đến phần mềm SmartPLS 3. Đối với những người bắt đầu nghiên cứu, SmartPLS 3 gây được ấn tượng mạnh bởi sự gọn nhẹ và trực quan so với các phần mềm cùng loại mà vẫn bảo đảm sự hiệu quả trong ước lượng mô hình. Với hơn 2.500 trích dẫn trong các tài liệu học thuật, SmartPLS 3 là một trong những công cụ phần mềm hàng đầu trong việc ứng dụng và cách tiếp cận phương pháp PLS trong mô hình ước lượng cấu trúc tuyến tính SEM (PLS-SEM). Nhà nghiên cứu, sinh viên, học viên, nghiên cứu sinh sẽ nhanh chóng làm quen với SmartPLS 3 và ứng dụng hiệu quả phương pháp PLS-SEM trong đề tài nghiên cứu nhờ sự trực quan và dễ sử dụng. Đặc biệt khi so sánh với AMOS – phần mềm cũng có chức năng ước lượng SEM, SmartPLS tỏ ra có ưu thế hơn về sự đơn giản, trực quan, thân thiện cho người sử dụng. Ứng dụng của SmartPLS 3: SmartPLS 3 có thể thực hiện hầu hết các nghiên cứu sử dụng dữ liệu sơ cấp với mô hình SEM hay các mô hình khác: -
Nghiên cứu tâm lý học: Tâm lý tội phạm, tâm lý học sinh, sinh viên…
-
Nghiên cứu xã hội học: Đánh giá chất lượng dịch vụ, ý kiến người dân, thống kê…
-
Nghiên cứu thị trường: Nghiên cứu và định hướng phát triển sản phẩm, mở rộng thị trường, sự hài lòng khách hàng…
-
Nghiên cứu kinh doanh: Dự định mua sản phẩm, xu hướng chấp nhận một sản phẩm, Định vị thương hiệu trên các thuộc tính sản phẩm…
-
Nghiên cứu đa dạng sinh học, trong phát triển nông lâm nghiệp…
-
Phân tích thực trạng, tìm ra nhân tố ảnh hưởng, dự đoán các xu hướng tiếp theo
Mặc dù có rất nhiều cố gắng nhưng nhóm tác giả cũng rất cần các góp ý và phản hồi từ các nhà nghiên cứu và người đọc để các thuật ngữ được dịch sát hơn và dễ hiểu hơn. Mọi góp ý và phản hồi của Quý độc giả xin vui lòng gửi về địa chỉ email: [email protected] Rất mong nhận được nhiều ý kiến góp ý và phản hồi của Quý độc giả để các lần phát hành tiếp theo được sửa chữa và cập nhật tốt hơn. Trân trọng cảm ơn./. TM nhóm biên dịch TS. Nguyễn Quang Anh
Thành viên tham gia Biên dịch: 1. 2. 3. 4. 5. 6. 7.
TS. Nguyễn Quang Anh TS. Nguyễn Ngọc Tuyên TS. Phạm Quốc Luyến TS. Nguyễn Ngọc Duy Phương TS. Nguyễn Thanh Vũ ThS. Cao Quốc Việt ThS. Huỳnh Trọng Hiến
CHƢƠNG 1 GIỚI THIỆU MÔ HÌNH PHƢƠNG TRÌNH CẤU TRÚC
1.1 MÔ HÌNH PHƢƠNG TRÌNH CẤU TRÚC LÀ GÌ? Phân tích thống kê là một công cụ thiết yếu cho các nhà nghiên cứu khoa học xã hội khoảng hơn một thế kỷ. Những ứng dụng của các phương pháp thống kê được mở rộng đáng kể bởi sự xuất hiện của phần cứng và phần mềm máy tính, đặc biệt trong những năm gần đây, với sự phổ biến của nhiều phương pháp nhằm tạo nên một giao diện thân thiện cho người dùng với sự chuyển giao khoa học công nghệ. Ban đầu, các nhà nghiên cứu dựa trên các phân tích về đơn biến và đa biến để hiểu và nắm bắt các mối quan hệ của dữ liệu. Sau đó, để hiểu rõ hơn các mối quan hệ phức tạp liên quan đến các hướng nghiên cứu trong khoa học xã hội hiện tại, việc ứng dụng của các phương pháp phân tích dữ liệu đa biến tinh vi hơn ngày càng cần thiết. Phân tích đa biến bao gồm các ứng dụng của các phương pháp thống kê, và phân tích đồng thời nhiều biến. Các biến thường đại diện cho sự đo lường liên quan đến các cá nhân, công ty, sự kiện, hoạt động, tình huống... Các đo lường này thường được thu thập từ việc khảo sát hoặc quan sát, nó được sử dụng trong khi thu thập dữ liệu sơ cấp, nhưng cũng có thể được thu thập từ cơ sở dữ liệu của dữ liệu thứ cấp. Phụ lục 1.1 trình bày các dạng chính của các phương pháp thống kê liên quan đến phân tích dữ liệu đa biến. Phụ lục 1.1 Sơ đồ tổ chức của các phƣơng pháp đa biến Khám phá chủ yếu
Khẳng định chủ yếu
Các kỹ thuật thế
Phân tích cụm
Phân tích phương sai
hệ đầu tiên
Phân tích nhân tố khám
Hồi quy logistic
phá Đo lường đa hướng
Hồi quy bội Phân tích nhân tố khẳng định
Các kỹ thuật thế hệ thứ hai
Mô hình SEM sử dụng
Mô hình SEM sử dụng
kỹ thuật bình phương tối
hiệp phương sai CB-
thiểu từng phần PLS-
SEM
SEM PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 1
Các phương pháp thống kê thường được sử dụng bởi các nhà khoa học xã hội thường được gọi là các kỹ thuật thế hệ thứ nhất. Những kỹ thuật này được trình bày ở phần trên của Phụ lục 1.1, gồm có các phương pháp tiếp cận dựa trên hồi quy như hồi quy bội, hồi quy logistic và phân tích phương sai cũng như bao gồm phân tích nhân tố khám phá và phân tích nhân tố khẳng định, phân tích cụm, đo lường đa hướng. Khi áp dụng vào vấn đề nghiên cứu, các phương pháp này có thể được sử dụng cùng nhau để khẳng định lý thuyết hoặc xác định mô hình dữ liệu và các mối quan hệ. Cụ thể, chúng gọi là khẳng định khi kiểm định các giả thuyết của lý thuyết và khái niệm hiện có, và gọi là khám phá khi chúng tìm kiếm mô hình tiềm ẩn trong dữ liệu trong trường hợp không có hoặc chỉ có một ít kiến thức trước đó về sự liên quan của các biến. Điều quan trọng cần lưu ý là sự phân biệt giữa khẳng định và khám phá không phải lúc nào cũng rõ ràng. Ví dụ, khi chạy phân tích hồi quy, các nhà nghiên cứu thường chọn các biến phụ thuộc và độc lập dựa trên các lý thuyết và khái niệm trước đó. Mục tiêu của phân tích hồi quy là kiểm định các lý thuyết và khái niệm này. Tuy nhiên, kỹ thuật cũng được sử dụng để khám phá các biến độc lập bổ sung chứng minh giá trị cho việc mở rộng các khái niệm đang được kiểm định. Những phát hiện này thường tập trung đầu tiên vào các biến độc lập có ý nghĩa thống kê trong việc dự đoán biến phụ thuộc (khẳng định nhiều hơn) và các biến độc lập có khả năng dự báo tốt hơn cho biến phụ thuộc (khám phá nhiều hơn). Một cách tương tự, khi phân tích nhân tố khám phá được áp dụng cho một tập dữ liệu, phương pháp tìm kiếm các mối quan hệ giữa các biến trong một nỗ lực để giảm đi một số lượng lớn các biến thành các tập hợp nhỏ hơn của các nhân tố tổng hợp (nghĩa là sự kết hợp các biến). Tập hợp cuối cùng của nhân tố tổng hợp là kết quả của việc khám phá các mối quan hệ trong dữ liệu và báo cáo chúng khi tìm thấy (nếu có). Tuy nhiên, trong khi kỹ thuật này là khám phá về bản chất (như tên gọi đã được đề xuất), các nhà nghiên cứu thường có sẵn một nền kiến thức ban đầu để định hướng quyết định của họ liệu có bao nhiêu nhân tố tổng hợp trích xuất từ dữ liệu. Ngược lại, phân tích nhân tố khẳng định cho phép kiểm định và chứng minh một nhân tố xác định ban đầu và gán các biến quan sát của nó. Các kỹ thuật thế hệ thứ nhất được áp dụng rộng rãi bởi các nhà nghiên cứu khoa học xã hội. Tuy nhiên, 20 năm qua, ngày càng nhiều nhà nghiên cứu chuyển sang các kỹ thuật thế hệ thứ hai để khắc phục những nhược điểm của phương pháp thế hệ thứ nhất (Phụ lục 1.1). Những phương pháp này, gọi là mô hình phương trình cấu trúc (SEM), cho phép các nhà nghiên cứu kết hợp các biến không quan sát được mà những biến này được PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 2
đo lường gián tiếp bởi các biến quan sát. Ngoài ra, chúng còn tính toán được sai số đo lường trong các biến quan sát. Có hai loại SEM: CB-SEM (Covariance –Based SEM) và PLS-SEM (Partial least squares SEM). CB-SEM chủ yếu được sử dụng để khẳng định (hoặc từ chối) lý thuyết (tức là một tập hợp các mối quan hệ có hệ thống giữa nhiều biến có thể được kiểm tra bằng thực nghiệm). Nó thực hiện bằng cách xác định mô hình lý thuyết đề xuất có thể ước lượng ma trận hiệp phương sai cho một tập hợp dữ liệu mẫu. Ngược lại, PLS-SEM (còn được gọi là mô hình đƣờng dẫn PLS) được sử dụng chủ yếu để phát triển các lý thuyết trong nghiên cứu khám phá. Nó thực hiện việc này bằng cách tập trung giải thích phương sai của các biến phụ thuộc khi kiểm tra mô hình. Chúng tôi sẽ giải thích sự khác biệt này chi tiết hơn nữa trong chương này. PLS-SEM đang mở ra như một kỹ thuật mô hình thống kê, và trong khi có rất nhiều bài báo được công bố về phương pháp và ứng dụng nó vào nhiều trường hợp khác nhau, làm sáng tỏ bản chất cùng vai trò của PLS-SEM trong nghiên cứu khoa học xã hội và hy vọng các nhà nghiên cứu có được một công cụ cho phép họ theo đuổi các cơ hội nghiên cứu bằng những cách mới và khác biệt. 1.2 CÁC CHÚ Ý TRONG VIỆC SỬ DỤNG MÔ HÌNH PHƢƠNG TRÌNH CẤU TRÚC Tùy thuộc vào câu hỏi nghiên cứu và dữ liệu thực nghiệm sẵn có, các nhà nghiên cứu sẽ phải lựa chọn phương pháp phân tích đa biến phù hợp. Cho dù các nhà nghiên cứu sử dụng phương pháp phân tích đa biến thế hệ thứ nhất hay thứ hai, có một số lưu ý cần thiết trong việc quyết định sử dụng phân tích đa biến, đặc biệt là SEM. Quan trọng nhất là năm yếu tố sau đây: (1) biến tổng hợp, (2) sự đo lường, (3) thang đo lường, (4) mã hóa, và (5) phân phối dữ liệu. 1.2.1 Các biến tổng hợp Các biến tổng hợp là sự kết hợp tuyến tính của nhiều biến, được chọn lựa dựa trên các vấn đề nghiên cứu có thể thực hiện được. Quá trình kết hợp các biến liên quan đến việc tính toán một tập các trọng số (giá trị biến), bằng cách nhân trọng số (w1 và w2) với biến quan sát tương ứng (x1 và x2), và tổng hợp chúng. Công thức toán học cho một kết hợp tuyến tính với năm biến được hiển thị như sau (lưu ý rằng giá trị biến có thể được tính toán cho bất kỳ số lượng các biến): Giá trị biến tổng hợp: x1w1 + x2w2 + … + x5w5 , trong đó, x là viết tắt của các biến đơn và w là các trọng số. Tất cả biến x (các câu PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 3
hỏi trong bảng câu hỏi) có phần trả lời từ nhiều đáp viên có thể được sắp xếp trong một ma trận dữ liệu. Phụ lục 1.2 trình bày một ma trận dữ liệu, trong đó i là số lượng câu trả lời (số mẫu thu thập). Giá trị biến được tính cho mỗi người được hỏi thứ i trong mẫu. Phụ lục 1.2
Ma trận dữ liệu
Trường hợp
x1
x2
...
x5
Giá trị biến
1
x11
x21
...
x51
v1
... i
. .. x1i
. .. x2i
. .. ...
. .. x5i
... vi
1.2.2 Đo lƣờng Đo lường là một khái niệm cơ bản trong nghiên cứu khoa học xã hội. Khi chúng ta nghĩ về đo lường, điều đầu tiên nghĩ đến thường là một thước đo/quy tắc, mà nó có thể được sử dụng để đo chiều cao hoặc chiều dài của một đồ nội thất. Nhưng có rất nhiều ví dụ khác về đo lường trong cuộc sống. Khi lái xe, bạn sử dụng công tơ mét để đo tốc độ chiếc xe, máy đo nhiệt để đo nhiệt độ của động cơ, và đồng hồ để xác định còn bao nhiêu nhiên liệu trong xe của bạn. Nếu bạn bị bệnh, bạn sử dụng nhiệt kế để đo nhiệt độ, và khi ăn kiêng, bạn đo cân nặng của mình trên cân sức khỏe. Đo lường là quá trình gán các số cho một biến dựa trên một tập hợp các quy tắc. Các quy tắc này được sử dụng để gán các con số đại diện chính xác cho các biến. Với một số biến, các quy tắc rất dễ làm theo, trong khi với các biến khác, các quy tắc gặp nhiều khó khăn để áp dụng. Ví dụ, nếu biến đó là giới tính, thì rất dễ dàng để gán 1 cho nữ giới và 0 cho nam giới. Tương tự như vậy, nếu biến đó là tuổi hoặc chiều cao thì cũng dễ dàng để gán số. Nhưng nếu biến đó là sự hài lòng hoặc tin tưởng? Đo lường trong những tình huống này khó khăn hơn vì hiện tượng trên rất trừu tượng, phức tạp và không trực tiếp quan sát được. Do đó chúng ta sẽ nói về sự đo lường các biến tiềm ẩn (tức là không quan sát được) hoặc các khái niệm nghiên cứu. Chúng ta không thể đo lường trực tiếp các khái niệm trừu tượng như sự hài lòng hoặc sự tin tưởng. Tuy nhiên, chúng ta có thể đo lường các biến chỉ báo hoặc biến quan sát mà chúng ta đã thống nhất gọi là sự hài lòng hoặc tin tưởng, ví dụ, về mặt thương hiệu, sản phẩm, hoặc công ty. Cụ thể, khi các khái niệm khó đo lường, có một cách tiếp cận là đo lường chúng gián tiếp với một tập hợp các biến chỉ báo được dùng như là các biến đại diện (proxy variables). Mỗi biến quan sát đại diện cho một khía cạnh riêng biệt của một khái niệm trừu tượng lớn hơn. Ví dụ, nếu khái niệm này là sự hài lòng về nhà PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 4
hàng, thì một số biến đại diện có thể được sử dụng để đo lường khái niệm này như sau: 1. Mùi vị của thực phẩm rất tuyệt vời. 2. Sự phục vụ nhanh chóng đáp ứng được mong đợi của tôi. 3. Nhân viên phục vụ rất am hiểu về các món ăn trong thực đơn. 4. Nhạc nền trong nhà hàng dễ chịu. 5. Chất lượng bữa ăn tương xứng so với giá. Bằng cách kết hợp một số biến đo lường để tạo thành một thang đo (hoặc chỉ số Index), chúng ta có thể gián tiếp đo lường khái niệm tổng thể của sự hài lòng về nhà hàng. Thông thường, các nhà nghiên cứu sử dụng một số biến đo lường để tạo thành một thang đo đa biến, gián tiếp đo lường một khái niệm, như sự hài lòng về nhà hàng của ví dụ trên. Một số biện pháp đo lường được kết hợp để tạo thành một điểm tổng duy nhất (tức là điểm số của biến). Trong một số trường hợp, điểm số tổng là một tổng hợp đơn giản của một số biện pháp đo lường. Trong trường hợp khác, điểm số của các đo lường riêng lẻ được kết hợp để tạo thành một điểm tổng, sử dụng quá trình tuyến tính trọng số cho các đo lường riêng lẻ. Logic của việc sử dụng các biến số riêng lẻ để đo lường một khái niệm trừu tượng như là sự hài lòng về nhà hàng sẽ được chính xác hơn. Độ chính xác mang tính dự đoán được cải thiện dựa trên giả định việc sử dụng một số biến quan sát để đo lường một khái niệm đơn lẻ có nhiều khả năng đại diện được cho tất cả các khía cạnh khác nhau của khái niệm. Điều này liên quan đến việc giảm sai số đo lƣờng, đó là sự khác biệt giữa giá trị thực sự của một biến và giá trị thu được bởi một phép đo. Có rất nhiều nguyên nhân dẫn đến sai số đo lường, bao gồm các câu hỏi tối nghĩa trong một cuộc khảo sát, hiểu sai về cách tiếp cận thang đo, và ứng dụng không chính xác phương pháp thống kê. Thật vậy, tất cả các phép đo sử dụng trong phân tích đa biến có khả năng chứa một vài sai số đo lường. Do đó, mục tiêu là giảm sai số đo lường càng nhiều càng tốt. Thay vì sử dụng nhiều biến quan sát, các nhà nghiên cứu đôi khi lựa chọn việc sử dụng các biến đơn để đo lường các khái niệm như sự hài lòng hoặc ý định mua. Ví dụ, chúng ta có thể chỉ sử dụng “Nhìn chung, tôi hài lòng với nhà hàng này” để đo lường sự hài lòng về nhà hàng thay vì sử dụng tất cả 5 biến được mô tả ở trên. Trong khi đây là một cách tốt để làm cho bảng câu hỏi ngắn hơn, nhưng nó cũng làm giảm chất lượng đo lường. Chúng ta sẽ thảo luận về các nguyên tắc cơ bản của đo lường và đánh giá đo lường trong các chương tiếp theo. PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 5
1.2.3 Các thang đo Thang đo là một công cụ với một số câu hỏi đóng đã xác định trước, được sử dụng để có được một câu trả lời cho mỗi câu hỏi. Có bốn loại thang đo, mỗi loại đại diện cho một mức độ đo lường khác nhau gồm: định danh, thứ bậc, khoảng cách, và tỷ lệ. Thang đo định danh là mức thấp nhất của thang đo bởi vì chúng có nhiều hạn chế nhất về các loại phân tích có thể được thực hiện. Một thang đo định danh gán số có thể được sử dụng để xác định và phân loại các đối tượng (ví dụ, con người, công ty, sản phẩm,...) và cũng được gọi là một thang đo phân loại. Ví dụ, nếu một cuộc khảo sát để xác định nghề nghiệp của ông ấy hoặc cô ấy là bác sĩ, luật sư, giáo viên hay kỹ sư,..., thì câu hỏi có thang đo định danh. Thang đo định danh có thể có hai hoặc nhiều phân loại, nhưng mỗi loại phải được loại trừ lẫn nhau, và tất cả các thể loại phải được tính đến. Một con số có thể được gán vào để xác định mỗi thể loại, và những con số có thể được sử dụng để đếm số lượng các trả lời trong mỗi thể loại, hoặc tỷ lệ phần trăm của mỗi loại. Cấp độ cao hơn của thang đo được gọi là thứ bậc. Nếu chúng ta có một biến được đo dựa trên một thang đo thứ bậc chúng ta sẽ biết rằng giá trị của biến đó tăng hoặc giảm, điều này cung cấp những thông tin có ý nghĩa. Ví dụ, nếu chúng ta mã hóa việc sử dụng sản phẩm của khách hàng là: người không sử dụng = 0, người sử dụng ít = 1, và người sử dụng nhiều = 2, chúng ta biết rằng nếu giá trị của các biến về việc sử dụng tang lên, mức độ sử dụng cũng tăng lên. Do đó, đo lường trên một thang đo thứ bậc sẽ cung cấp thông tin về thứ tự trong các quan sát của chúng ta. Tuy nhiên, chúng ta không thể giả định rằng sự khác biệt theo thứ bậc có khoảng cách như nhau. Đó là, chúng ta không biết rằng sự khác biệt giữa “người không sử dụng” và “người sử dụng ít” có tương tự như giữa “người sử dụng ít” và “người sử dụng nhiều” hay không, mặc dù sự khác biệt trong các giá trị (tức là, 0-1 và 1- 2) là bằng nhau. Do đó, không thích hợp để tính toán trung bình hoặc phương sai cho các dữ liệu thứ bậc. Nếu cái gì đó được đo bằng thang đo khoảng, chúng ta có thông tin chính xác về thứ tự xếp hạng của chúng, hơn nữa, chúng ta có thể giải thích tầm quan trọng của sự khác biệt về giá trị một cách trực tiếp. Ví dụ, nếu nhiệt độ là 80°F, chúng ta biết rằng nếu nó giảm xuống đến 75°F, sự khác biệt chính xác là 5°F. Sự khác biệt 5°F này cũng giống như sự gia tăng từ 80°F đến 85°F. “Khoảng cách” chính xác này được gọi là khoảng cách đều nhau và tỷ lệ khoảng cách đều rất cần thiết cho những kỹ thuật phân tích nhất định, chẳng hạn như SEM. Thang đo khoảng không có một điểm 0 tuyệt đối. Nếu nhiệt độ là 0°F, trời có thể lạnh, nhưng nhiệt độ có thể giảm hơn nữa. Giá trị 0 do đó không có nghĩa là không có nhiệt độ. Giá trị của thang đo khoảng thì hầu như bất kỳ loại tính toán PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 6
nào cũng có thể được thực hiện, bao gồm cả giá trị trung bình và độ lệch chuẩn. Hơn nữa, có thể chuyển đổi và mở rộng thang đo khoảng này thành thang đo khoảng khác. Ví dụ, thay vì °F, nhiều quốc gia có thể sử dụng °C để đo nhiệt độ. Trong khi 0°C đánh dấu điểm đóng băng, 100°C mô tả điểm sôi của nước. Ta có thể chuyển đổi nhiệt độ từ °F thành °C bằng cách sử dụng công thức sau: °C= (°F-32) * 5/9. Theo cách tương tự, có thể chuyển đổi dữ liệu (thông qua việc thay đổi tỷ lệ) của một thang đo từ 1 đến 5 thành dữ liệu của thang đo từ 0 đến 100: [(điểm dữ liệu của thang đo từ 1 đến 5) -1] / 4 * 100 Thang đo tỷ lệ cung cấp thông tin nhiều nhất. Nếu một điều gì đó được đo bằng thang đo tỷ lệ, chúng ta biết rằng giá trị 0 có ý nghĩa, nó là một đặc tính cụ thể cho một biến không hiện diện. Ví dụ, nếu một khách hàng mua không sản phẩm (giá trị = 0), thì anh ta, cô ta thực sự không mua sản phẩm. Hoặc, nếu chúng ta không chi tiền vào quảng cáo cho một sản phẩm mới (giá trị = 0), thì chúng ta thực sự không chi tiền. Do đó, điểm không hay gốc của biến là bằng 0. Các đo lường về chiều dài, khối lượng, âm lượng hay thời gian đều sử dụng thang đo tỷ lệ. Với thang đo tỷ lệ, tất cả các tính toán số học đều có thể thực hiện được. 1.2.4 Mã hoá Việc gán số cho biến đo lường để phân loại được gọi là mã hóa (coding). Trong nghiên cứu khảo sát, dữ liệu thường được tiền mã hoá (precoding). Tiền mã hoá là gán các số trước lần trả lời (điểm thang đo) được chỉ định trên bảng câu hỏi. Chẳng hạn như, thang đo đồng ý - không đồng ý 10 điểm thường sẽ gán số 10 là điểm cuối cao nhất “đồng ý” và 1 là điểm cuối thấp nhất “không đồng ý”, các điểm giữa sẽ được mã hóa từ 2 đến 9. Hậu mã hoá (postcoding) là gán số để phân loại cho các câu trả lời sau khi dữ liệu được thu thập. Phần trả lời có thể là câu hỏi mở hoặc đóng được dùng trong khảo sát định lượng hoặc một cuộc phỏng vấn trong nghiên cứu định tính. Mã hóa rất quan trọng trong ứng dụng phân tích đa biến vì nó quyết định khi nào và dạng thang đo nào có thể được sử dụng. Ví dụ, các biến đo bằng thang đo khoảng và tỷ lệ luôn luôn có thể được sử dụng với phân tích đa biến. Tuy nhiên, khi sử dụng thang đo thứ bậc như thang đo Likert (phổ biến trong SEM), các nhà nghiên cứu phải đặc biệt chú ý đến mã hóa để đáp ứng yêu cầu của khoảng cách đều nhau. Ví dụ, khi sử dụng thang đo Likert 5-điểm với các hạng mức: (1) hoàn toàn không đồng ý, (2) không đồng ý, (3) vừa đồng ý vừa không đồng ý, (4) đồng ý, và (5) hoàn toàn đồng ý, hàm ý là “khoảng cách” giữa mức 1 và 2 cũng giống như giữa mức 3 và 4. Ngược lại, cùng một thang đo Likert nhưng sử dụng các mức độ: (1) không đồng ý, (2) vừa đồng ý vừa không PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 7
đồng ý, (3) phần nào đồng ý , (4) đồng ý, và (5) hoàn toàn đồng ý là khoảng cách không đều nhau, vì chỉ có một mức độ có thể nhận được tỷ lệ dưới mức trung tính “vừa đồng ý vừa không đồng ý.” Điều này sẽ tạo nên sự thiên lệch cho các kết quả đầu ra. Một thang đo Likert tốt như ở trên, sẽ trình bày đối xứng qua mức trung gian, đã được xác định rõ ràng cho mỗi mức độ. Như trong thang đo đối xứng, khoảng cách đều nhau sẽ được quan sát rõ ràng hơn hoặc, ít nhất là suy ra. Khi một thang đo Likert được coi là đối xứng và cách đều, thì nó sẽ hoạt động giống như một thang đo khoảng. Vì vậy, trong khi thang đo Likert là thứ bậc, nếu được trình bày tốt nó có khả năng tương tự với cấp độ đo lường khoảng, và các biến tương ứng có thể được sử dụng trong SEM. 1.2.5 Phân phối dữ liệu Khi các nhà nghiên cứu thu thập dữ liệu định lượng, các câu trả lời cho những câu hỏi được báo cáo dưới dạng phân phối dựa trên các câu trả lời có sẵn (đã được xác định trước). Ví dụ, nếu câu trả lời được yêu cầu sử dụng theo thang đo đồng ý – không đồng ý 9 - điểm, phân phối các câu trả lời tương ứng với các mức có sẵn (1, 2, 3,…, 9) có thể được tính toán và trình bày trong bảng hoặc biểu đồ. Phụ lục 1.3 đưa ra một ví dụ về các tần số của một biến x tương ứng. Phụ lục 1.3
Phân phối câu trả lời
Có thể thấy, hầu hết các phản hồi chỉ ra mức điểm 5 trên thang 9-điểm, tiếp theo là điểm 4 và 6, tiếp đến 3 và 7, và vân vân. Nhìn chung, các tần số xuất hiện theo dạng hình chuông, đường cong đối xứng xung quanh giá trị trung bình là 5. Đường cong hình chuông này là phân phối chuẩn mà nhiều kỹ thuật phân tích yêu cầu để cho ra kết quả chính xác. Trong khi nhiều dạng phân phối khác nhau đang tồn tại (ví dụ, phân phối chuẩn, PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 8
nhị thức, Poisson), các nhà nghiên cứu làm việc với SEM thường chỉ cần phân biệt phân phối chuẩn và phân phối không chuẩn. Phân phối chuẩn thường phù hợp, đặc biệt là khi làm việc với CB-SEM. Ngược lại, PLS-SEM thường không có giả định về sự phân phối dữ liệu. Tuy nhiên, vì những lý do được thảo luận trong chương sau, việc xem xét phân phối vẫn rất cần thiết khi làm việc với PLS-SEM. Để đánh giá xem dữ liệu có phân phối chuẩn hay không, các nhà nghiên cứu có thể xem lại các kiểm định thống kê chẳng hạn như kiểm định Kolmogorov-Smirnov và kiểm định Shapiro-Wilk. Ngoài ra, các nhà nghiên cứu có thể kiểm tra hai đo lường của phân bố - độ lệch và độ nhọn (Chương 2) cho phép đánh giá mức độ lệch của dữ liệu so với trạng thái phân phối chuẩn. 1.3 MÔ HÌNH PHƢƠNG TRÌNH CẤU TRÚC VỚI MÔ HÌNH ĐƢỜNG DẪN BÌNH PHƢƠNG TỐI THIỂU RIÊNG PHẦN (PLS-SEM) 1.3.1 Mô hình đƣờng dẫn với các biến tiềm ẩn Mô hình đường dẫn là các biểu đồ hiển thị trực quan các mối quan hệ của giả thuyết và biến, được kiểm tra khi áp dụng SEM. Ví dụ về mô hình đường dẫn sẽ được trình bày ở Phụ lục 1.4. Khái niệm nghiên cứu (construct) (tức là các biến không được đo lường một cách trực tiếp) được thể hiện trong mô hình đường dẫn bằng các hình tròn hoặc hình bầu dục (Y1 đến Y4). Các biến chỉ báo (Indicator), cũng được gọi là các biến đo lƣờng (Item) hoặc các biến quan sát (Manifest variable), là những biến đại diện (Proxy variable) được đo lường trực tiếp, chứa dữ liệu thô. Nó được trình bày trong mô hình đường dẫn bởi các hình chữ nhật (x1 đến x10). Các mối quan hệ giữa các khái niệm nghiên cứu cũng như giữa các khái niệm nghiên cứu và các biến chỉ báo của chúng được thể hiện bằng các mũi tên. Trong PLS-SEM, những mũi tên luôn là một chiều, đại diện cho mối quan hệ trực tiếp. Những mũi tên một chiều được xem như là những mối quan hệ dự báo, với sự hỗ trợ mạnh mẽ của lý thuyết, nó có thể được hiểu là những mối quan hệ nhân quả. Mô hình đường dẫn PLS bao gồm hai yếu tố. Đầu tiên, đó là Mô hình cấu trúc (Structural model) (còn gọi là mô hình bên trong trong PLS-SEM) trình bày các khái niệm nghiên cứu (hình tròn hoặc hình bầu dục). Mô hình cấu trúc cũng hiển thị các mối quan hệ (đường dẫn) giữa các khái niệm nghiên cứu. Thứ hai, đó là Mô hình đo lƣờng (Measurement model) (còn gọi là mô hình bên ngoài trong PLS-SEM) của các khái niệm nghiên cứu, hiển thị các mối quan hệ giữa các khái niệm nghiên cứu và các biến quan sát (hình chữ nhật). PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 9
Phụ lục 1.4
Mô hình đƣờng dẫn đơn giản
Trong Phụ lục 1.4, có hai loại mô hình đo lường: một là các biến tiềm ẩn ngoại sinh - exogenous latent variable (là những khái niệm nghiên cứu mà nó giải thích cho những khái niệm nghiên cứu khác trong mô hình) và một là các biến tiềm ẩn nội sinh endogenous latent variable (là những khái niệm nghiên cứu đang được giải thích trong mô hình). Thay vì đề cập đến mô hình đo lường của các biến tiềm ẩn ngoại sinh và nội sinh, các nhà nghiên cứu thường xuyên tham khảo mô hình đo lường của một biến tiềm ẩn cụ thể. Ví dụ, x1 tới x3 là các biến quan sát được sử dụng trong mô hình đo lường của Y1 trong khi Y4 chỉ có biến quan sát x10 trong mô hình đo lường. Phần sai số (Error term) (ví dụ, e7 hoặc e8 Phụ lục 1.4) được kết nối với khái niệm (nội sinh) và biến đo lường (kết quả) bằng những mũi tên một chiều. Phần sai số đại diện cho phương sai không giải thích được khi mô hình đường dẫn được ước lượng. Trong Phụ lục 1.4, các sai số e7 đến e9 nằm trên những biến quan sát mà mối quan hệ của nó đi từ khái niệm nghiên cứu đến các biến quan sát (tức là biến quan sát đo lường kết quả). Ngược lại, các biến đo lường nguyên nhân x1 tới x6, mối quan hệ đi từ các biến quan sát đến khái niệm nghiên cứu, không có phần sai số. Cuối cùng, đối với khái niệm đơn biến Y4, hướng của các mối quan hệ giữa khái niệm và biến quan sát không quan trọng bằng khái niệm và biến quan sát tương đương. Vì lí do đó, không có phần sai số kết nối với x10. Mô hình cấu trúc cũng chứa phần sai số. Trong Phụ lục 1.4, z3 và z4 có liên quan đến biến tiềm ẩn nội sinh Y3 và Y4 (lưu ý rằng các sai số trên các khái niệm nghiên cứu và các biến đo lường được dán nhãn khác nhau). Ngược lại, các biến tiềm ẩn ngoại sinh chỉ giải thích cho các biến tiềm ẩn khác trong mô hình cấu trúc không có phần sai số. Mô hình đường dẫn được xây dựng dựa trên lý thuyết. Lý thuyết (Theory) là một tập hợp các giả thuyết liên quan một cách hệ thống được phát triển theo phương pháp khoa học, có thể được sử dụng để giải thích và dự báo kết quả. Như vậy, giả thuyết là PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 10
phỏng đoán mang tính cá nhân, trong khi lý thuyết gồm nhiều giả thuyết liên kết với nhau một cách hợp lý và có thể được kiểm tra bằng thực nghiệm. Hai loại lý thuyết cần để xây dựng mô hình đường dẫn là: Lý thuyết đo lƣờng và lý thuyết cấu trúc. Lý thuyết cấu trúc xác định cách thức các khái niệm nghiên cứu thể hiện mối liên quan đến nhau trong mô hình cấu trúc, trong khi lý thuyết đo lường quy định cụ thể cách mỗi khái niệm nghiên cứu được đo lường. 1.3.2 Lý thuyết đo lƣờng Lý thuyết đo lường chỉ rõ cách các biến tiềm ẩn (các khái niệm nghiên cứu) được đo. Nói chung, có hai cách khác nhau để đo lường các biến không quan sát được. Một cách được gọi là đo lƣờng kết quả (reflective measurement) và cách còn lại được gọi là đo lƣờng nguyên nhân (formative measurement). Khái niệm nghiên cứu Y1 và Y2 trong Phụ lục 1.4 được mô phỏng dựa trên mô hình đo lƣờng nguyên nhân (formative measurement model). Lưu ý rằng các mũi tên chỉ hướng đi từ các biến quan sát tới khái niệm nghiên cứu (x1, x2, x3 đến Y1 và x4, x5, x6 đến Y2), chỉ ra (dự báo) mối quan hệ nhân quả theo hướng đó. Ngược lại, Y3 trong hình được mô phỏng dựa trên mô hình đo lƣờng kết quả (reflective measurement model). Với các biến quan sát kết quả, hướng của các mũi tên đi từ khái niệm nghiên cứu đến các biến quan sát, chỉ ra giả định rằng khái niệm nghiên cứu đã dẫn đến sự đo lường (chính xác hơn là sự đồng thay đổi) của biến quan sát. Như đã trình bày trong Phụ lục 1.4, đo lường kết quả có một phần sai số được kết hợp với mỗi biến quan sát, trong khi điều này không xảy ra với đo lường nguyên nhân. Đo lường nguyên nhân được giả định là không có sai số (error free). Cuối cùng, lưu ý rằng Y4 được đo lường chỉ bằng một biến quan sát đơn chứ không phải là đo lường đa biến. Vì thế, mối quan hệ giữa khái niệm nghiên cứu và biến quan sát là không được định hướng. Cách tiếp cận mô hình hóa các khái niệm nghiên cứu (nguyên nhân hay kết quả, đa biến hay đơn biến) là một yếu tố quan trọng trong việc phát triển mô hình đường dẫn. Những cách tiếp cận nhằm mô hình hóa khái niệm nghiên cứu được giải thích chi tiết hơn trong Chương 2. 1.3.3 Lý thuyết cấu trúc Lý thuyết cấu trúc cho thấy cách các biến tiềm ẩn liên quan đến nhau (tức là, nó cho thấy các khái niệm nghiên cứu và mối quan hệ đường dẫn giữa chúng trong mô hình cấu trúc). Các vị trí và thứ tự của các khái niệm nghiên cứu được xác định dựa trên lý thuyết hay kinh nghiệm và kiến thức tích lũy của nhà nghiên cứu. Khi các mô hình PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 11
đường dẫn được phát triển, trình tự là từ trái sang phải. Các biến ở phía bên trái của mô hình đường dẫn là các biến độc lập, và biến bất kỳ ở phía bên phải là biến phụ thuộc. Hơn nữa, các biến bên trái sẽ hiển thị trước và dự đoán các biến bên phải. Tuy nhiên, các biến cũng có thể đóng vai trò là cả biến độc lập và phụ thuộc. Khi các biến tiềm ẩn được dùng như là các biến độc lập, chúng được gọi là các biến tiềm ẩn ngoại sinh (Y1 và Y2). Khi các biến tiềm ẩn được dùng như là các biến phụ thuộc (Y4) hoặc là cả biến độc lập và phụ thuộc (Y3), chúng được gọi là các biến tiềm ẩn nội sinh. Bất kỳ biến tiềm ẩn nào mà chỉ có những mũi tên một chiều đi ra khỏi nó là một biến tiềm ẩn ngoại sinh. Ngược lại, các biến tiềm ẩn nội sinh có thể có mũi tên một chiều đi vào và ra khỏi chúng (Y3) hoặc chỉ đi vào chúng (Y4). Lưu ý rằng các biến tiềm ẩn ngoại sinh Y1 và Y2 không có phần sai số bởi vì các khái niệm nghiên cứu là những thực thể (biến độc lập) giải thích cho biến phụ thuộc trong mô hình đường dẫn. 1.4 PLS-SEM, CB-SEM VÀ HỒI QUY DỰA TRÊN CÁC ĐIỂM TỔNG Có hai phương pháp chính để ước lượng các mối quan hệ trong một mô hình cấu trúc tuyến tính. Một là phương pháp được áp dụng rộng rãi CB-SEM. Hai là PLS-SEM, trọng tâm của cuốn sách này. Mỗi phương pháp thích hợp cho một bối cảnh nghiên cứu khác nhau, và các nhà nghiên cứu cần phải hiểu sự khác nhau để áp dụng đúng phương pháp. Cuối cùng, một số nhà nghiên cứu đã lập luận về việc sử dụng các hồi quy dựa trên điểm tổng, thay vì một vài trọng số biến quan sát được thực hiện bởi PLS-SEM. Cách tiếp cận này thực tế không có giá trị ngoài PLS-SEM. Vì lý do đó, chúng ta chỉ thảo luận điểm tổng một đoạn ngắn và tập trung vào phương pháp PLS-SEM và CB-SEM. Để trả lời các câu hỏi khi nào thì sử dụng PLS-SEM hoặc CB-SEM, các nhà nghiên cứu nên tập trung vào các đặc điểm và mục tiêu giúp phân biệt hai phương pháp. Trong những trường hợp lý thuyết chưa phát triển, các nhà nghiên cứu nên cân nhắc việc sử dụng các PLS-SEM như một cách tiếp cận thay thế cho CB-SEM. Điều này đặc biệt đúng nếu mục tiêu chính của việc áp dụng mô hình cấu trúc là dự báo và giải thích về khái niệm nghiên cứu mục tiêu. Sự khác biệt về mặt khái niệm quan trọng giữa PLS-SEM và CB-SEM liên quan đến cách thức mỗi phương pháp xử lý các biến tiềm ẩn trong mô hình. CB-SEM xem xét các khái niệm nghiên cứu như là các yếu tố chung giải thích sự đồng biến đổi (covariation) giữa các biến quan sát liên quan của nó. Điểm số của những yếu tố chung này không được biết đến và cũng không cần thiết trong việc ước lượng các tham số mô hình. Mặt khác, PLS-SEM sử dụng các đại diện để biểu diễn các khái niệm nghiên cứu PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 12
quan tâm, là trọng số hợp nhất của các biến quan sát cho một khái niệm nghiên cứu cụ thể. Vì lý do này, PLS-SEM hình thành một cách tiếp cận dựa trên sự tổng hợp đến SEM, làm dịu các giả định mạnh mẽ của CB-SEM rằng tất cả sự biến thiên đồng thời giữa một tập hợp các biến quan sát được giải thích bằng các yếu tố chung. Đồng thời, sử dụng các trọng số hợp nhất của các biến quan sát để giải thích các sai số đo lường, do đó làm cho PLS-SEM vượt trội hơn so với hồi quy sử dụng điểm tổng nhiều lần. Trong trường hợp hồi quy điểm tổng, nhà nghiên cứu giả định rằng các biến quan sát đều có trọng số bằng nhau, có nghĩa là mỗi biến quan sát đóng góp như nhau để tạo thành tổng hợp. Xem lại mô tả của chúng ta về các biến tổng ngay từ đầu của chương này, điều này ngụ ý rằng tất cả các trọng số w sẽ được đặt thành 1. Công thức toán học cho sự kết hợp tuyến tính với 5 biến quan sát như sau: Giá trị tổng = 1.x1 +1.x2 +1.x3 +1.x4 +1.x5 Ví dụ, nếu đáp viên cho điểm 4, 5, 4, 6 và 7 cho 5 biến, giá trị tổng tương ứng sẽ là 26. Trong khi việc áp dụng khá dễ dàng, hồi quy bằng cách sử dụng điểm tổng đã làm cân bằng bất kỳ sự khác biệt trong các trọng số biến riêng lẻ. Tuy nhiên, những khác biệt này lại rất phổ biến trong thực tế khi làm nghiên cứu, và đòi hỏi phải bỏ qua những sai lệch đáng kể trong ước lượng tham số. Hơn nữa, tìm hiểu về trọng số của từng biến riêng lẻ cung cấp những hiểu biết rất quan trọng như khi nhà nghiên cứu tìm hiểu về tầm quan trọng của mỗi biến đo lường để tạo thành một tổng hợp, trong một ngữ cảnh nhất định (ví dụ mối quan hệ của nó với các biến hỗn hợp khác trong mô hình cấu trúc). Ví dụ như khi đo lường mức độ hài lòng của khách hàng, nhà nghiên cứu sẽ biết được khía cạnh bao gồm những biến quan sát cụ thể nào sẽ có ý nghĩa đặc biệt đối với việc tạo ra sự hài lòng. Lưu ý quan trọng là biến đại diện (proxy) được tạo ra bởi PLS-SEM không được giả định giống nhau với các khái niệm nghiên cứu mà chúng thay thế. Chúng được công nhận như là một cách tính gần đúng. Kết quả là, một số học giả xem CB-SEM như là một phương pháp trực tiếp và chính xác hơn để đo lường thực nghiệm các khái niệm lý thuyết, trong khi PLS-SEM cung cấp các phép tính xấp xỉ, gần đúng. Tuy nhiên, các học giả khác lại cho rằng quan điểm như vậy khá là thiển cận vì các yếu tố chung trong CBSEM cũng không hẳn là tương đương với các khái niệm lý thuyết, trọng tâm của nghiên cứu. Trên thực tế, luôn tồn tại một khoảng cách lớn về giá trị giữa khái niệm mà nhà nghiên cứu dự định đo lường và khái niệm được sử dụng để đo lường khái niệm cụ thể đó. Trong nghiên cứu khoa học xã hội, xem đo lường như một phép tính xấp xỉ dường như thực tế hơn, làm cho sự phân biệt giữa PLS-SEM và CB-SEM về việc xử lý các khái niệm trở nên có vấn đề. Quan điểm này cũng được hỗ trợ bởi cách CB-SEM được áp PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 13
dụng trong thực tiễn nghiên cứu. Khi sử dụng CB-SEM, các mô hình giả thuyết ban đầu gần như luôn luôn thể hiện sự phù hợp không đầy đủ. Trong phần thảo luận, các nhà nghiên cứu nên từ chối mô hình và xem xét lại nghiên cứu (thường đòi hỏi thu thập dữ liệu mới), đặc biệt khi nhiều biến phải bị xóa đi để đạt được sự phù hợp. Ngoài ra, thường xuyên nhắc lại mô hình lý thuyết phát triển ban đầu nhằm nỗ lực cải thiện các chỉ số phù hợp vượt quá ngưỡng đề xuất. Bằng cách làm như vậy, các nhà nghiên cứu đạt được một mô hình với sự phù hợp có thể chấp nhận, và họ kết luận là chấp nhận lý thuyết. Thật không may, lý thuyết được hỗ trợ này gần như không bao giờ áp dụng được trong thực tế. Thay vào đó, các nhà nghiên cứu phải tham gia vào các nghiên cứu thăm dò khám phá, trong đó các tập con mô hình được sửa đổi với mục đích đạt đến một mô hình thỏa đáng. Tuy nhiên, các mô hình là sản phẩm của sự sửa đổi như vậy thường không tương ứng tốt với các mô hình thực sự và có xu hướng đơn giản hoá. Ngoài những khác biệt trong triết lý đo lường, cách xử lý khác nhau của các biến tiềm ẩn, và cụ thể hơn, sự có sẵn của các điểm biến tiềm ẩn cũng có những hậu quả đối với các lĩnh vực áp dụng của phương pháp. Cụ thể, mặc dù có thể ước tính các điểm biến tiềm ẩn trong khuôn khổ CB-SEM, nhưng các điểm số ước tính này không phải là duy nhất. Đó là, một số vô hạn của các tập hợp điểm biến tiềm ẩn khác nhau, phù hợp với mô hình nhất có thể. Một hệ quả quan trọng của điểm không xác định này là sự tương quan giữa một yếu tố chung và bất kỳ biến nào bên ngoài mô hình nhân tố là không xác định. Đó là, chúng có thể là cao hoặc thấp, tùy thuộc vào tập hợp các điểm số nhân tố nào được chọn. Kết quả là, hạn chế này làm cho CB-SEM cực kỳ không phù hợp để dự báo. Trái lại, một ưu điểm chính của PLS-SEM là nó luôn luôn tạo ra một điểm số cụ thể (nghĩa là xác định) cho từng tổng hợp của từng quan sát, ngay khi các trọng số được thiết lập. Những điểm số xác định này đại diện cho khái niệm được đo, cũng giống như các yếu tố là đại diện cho biến khái niệm trong CB-SEM. Sử dụng các đại diện này như đầu vào, PLS-SEM áp dụng hồi quy bình phương tối thiểu (OLS) với mục tiêu làm giảm thiểu các sai số (tức là phương sai phần dư) của các biến nội sinh. Nói cách khác, PLS-SEM ước lượng các hệ số (tức là các mối quan hệ mô hình đường dẫn) để tối đa hóa giá trị R2 của biến nội sinh (mục tiêu). Tính năng này đạt được mục tiêu dự báo của PLS-SEM. Do đó, PLS-SEM là phương pháp được ưa thích khi mục tiêu nghiên cứu là phát triển lý thuyết và giải thích phương sai (dự báo biến nghiên cứu). Vì lý do này, PLS-SEM được coi là phương pháp SEM dựa vào phương sai. Lưu ý rằng PLS-SEM là tương tự nhưng không tương đương với hồi quy PLS một kỹ thuật phân tích dữ liệu đa biến phổ biến khác. Hồi quy PLS là một phương pháp hồi quy dựa trên việc khám phá các mối quan hệ tuyến tính giữa nhiều biến độc lập với PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 14
một hoặc nhiều biến phụ thuộc. Hồi quy PLS khác với hồi quy thông thường, tuy nhiên, vì trong việc phát triển các mô hình hồi quy, nó xây dựng các yếu tố tổng hợp từ cả nhiều biến độc lập và nhiều biến phụ thuộc bằng cách phân tích thành phần chính. Mặt khác, PLS-SEM dựa trên mối quan hệ liên kết giữa các khái niệm nghiên cứu, cũng như giữa các khái niệm nghiên cứu và các biện pháp đo lường của nó. Một số cân nhắc quan trọng khi quyết định có hay không áp dụng PLS-SEM. Những cân nhắc này cũng có nguồn gốc từ đặc điểm của phương pháp. Các tính chất thống kê của các thuật toán PLS-SEM có các tính năng quan trọng liên quan đến các đặc tính của dữ liệu và mô hình sử dụng. Hơn nữa, các tính chất của các phương pháp PLSSEM cũng ảnh hưởng đến việc đánh giá các kết quả. Có 4 vấn đề quan trọng liên quan đến việc áp dụng các PLS-SEM: (1) dữ liệu, (2) đặc tính mô hình, (3) thuật toán PLSSEM, và (4) các vấn đề đánh giá mô hình. Phụ lục 1.5 tóm tắt các đặc điểm chính của PLS-SEM. Cái nhìn tổng quan ban đầu của những vấn đề này được quy định trong chương 1, và lời giải thích chi tiết hơn được cung cấp trong phần sau của cuốn sách, đặc biệt là khi chúng liên quan đến các thuật toán PLS-SEM và đánh giá kết quả. PLS-SEM hoạt động hiệu quả với cỡ mẫu nhỏ và các mô hình phức tạp và không cần giả định về dữ liệu cơ bản. Ví dụ, khác với CB-SEM dựa trên khả năng phù hợp cực đại (maximum likelihood), CB - SEM đòi hỏi dữ liệu phân phối chuẩn và hồi quy bằng cách sử dụng các điểm tổng, giả định các phần dư có phân phối chuẩn, thì PLS-SEM không đưa ra các giả định về phân phối (phi tham số). Ngoài ra, PLS-SEM có thể dễ dàng xử lý các mô hình đo lường nguyên nhân và kết quả, cũng như khái niệm đơn biến, không có các vấn đề nhận dạng (identification). Do đó, nó có thể được áp dụng trong một loạt các tình huống nghiên cứu. Khi áp dụng PLS - SEM, các nhà nghiên cứu cũng được hưởng lợi từ hiệu quả cao trong ước lượng tham số, được thể hiện ở độ nhạy thống kê (statistical power) lớn hơn so với phương pháp CB - SEM. Độ nhạy thống kê lớn hơn có nghĩa là PLS-SEM có nhiều khả năng nêu ra mối quan hệ đặc biệt có ý nghĩa khi nó thực sự có ý nghĩa thực tế trong tổng thể. Điều này cũng tương tự với các hồi quy dựa trên điểm tổng, bị tụt hậu so với PLS-SEM về mặt độ nhạy thống kê. Tuy nhiên, PLS-SEM cũng có một số hạn chế. Kỹ thuật này không thể áp dụng khi mô hình cấu trúc chứa các vòng lặp nhân quả hoặc các mối quan hệ vòng tròn giữa các biến tiềm ẩn. Các mở rộng của thuật toán PLS-SEM cơ bản chưa được thực hiện trong các gói phần mềm PLS-SEM thông thường, tuy nhiên, vẫn cho phép xử lý mối quan hệ vòng tròn. Hơn nữa, vì PLS-SEM không thiết lập đo lường mức độ phù hợp mô hình, nên việc sử dụng nó để kiểm định và khẳng định lý thuyết là có giới hạn. Tuy nhiên, những nghiên cứu gần đây đã bắt đầu phát triển đo lường sự phù hợp với mô hình PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 15
trong PLS-SEM, vì vậy mở rộng khả năng của phương pháp này. Chỉ số Căn bậc hai phần dƣ trung bình chuẩn hóa - Standardized root mean square residual (SRMR), do sự chênh lệch bình phương giữa các mối quan hệ quan sát được và tương quan mô hình, như một phương tiện để xác nhận giá trị một mô hình. Phương pháp này cũng đã được thực hiện trong phần mềm SmartPLS 3 và sẽ được thảo luận trong phần đánh giá mô hình cấu trúc trong Chương 6. Một đặc điểm khác của PLS-SEM là các ước lượng tham số không tối ưu về tính nhất quán, được gọi là PLS-SEM chệch (Chương 3). Mặc dù CB-SEM chủ trương nhấn mạnh sự khác biệt này giữa hai phương pháp, các nghiên cứu mô phỏng cho thấy rằng sự khác biệt giữa ước lượng CB-SEM và PLS-SEM là rất nhỏ khi các mô hình đo lường đạt được tiêu chuẩn tối thiểu được đề nghị về số lượng nhân tố và hệ số tải nhân tố. Cụ thể, khi các mô hình đo lường có bốn hoặc nhiều nhân tố và hệ số tải nhân tố đáp ứng các tiêu chuẩn chung (>=0.70), thì thực tế không có sự khác biệt giữa hai phương pháp về độ chính xác của tham số. Do đó, sai chệch PLS-SEM được thảo luận rộng rãi không phù hợp thực tế đối với phần lớn các ứng dụng. Quan trọng hơn, sự khác biệt của các ước lượng tham số của PLS-SEM không nên được coi là chệch, nhưng đưa ra một kết quả khác biệt từ cách xử lý khác nhau của các phương pháp về cách đo lường khái niệm (các yếu tố chung so với tổng hợp). Hơn nữa, các nghiên cứu gần đây đã phát triển những sửa đổi của thuật toán PLS-SEM ban đầu, phù hợp với sự khác biệt PLS-SEM. Đáng chú ý nhất, phương pháp tiếp cận PLS nhất quán (PLSc) cung cấp ước lượng mô hình chính xác trong khi duy trì tất cả các điểm mạnh của phương pháp PLS, chẳng hạn như khả năng xử lý các mô hình phức tạp khi kích thước mẫu bị hạn chế, khái niệm đo lường nguyên nhân và các mối quan hệ phi tuyến. Tại
https://www.smartpls.com/documentation/pls-sem-compared-with-cb-sem,
chúng tôi cung cấp một ước tính so sánh của mô hình chấp nhận công nghệ cao sử dụng PLS, PLSc và các CB-SEM dựa trên ước tính về khả năng phù hợp cực đại. So sánh cho thấy rằng PLS, PLSc, và CB-SEM dựa trên khả năng xác suất tối đa có tính tương ứng chặt chẽ, trong khi các công cụ ước lượng CB-SEM thay thế khác mang lại nhiều kết quả khác nhau. Trong những trường hợp nhất định, đặc biệt khi có một chút kiến thức nền tảng về các mối quan hệ mô hình cấu trúc hoặc các phép đo lường khái niệm nghiên cứu hoặc khi nhấn mạnh hơn vào việc khám phá hơn là khẳng định, PLS-SEM là một thay thế hấp dẫn hơn so với CB-SEM. Hơn nữa, khi giả định CB-SEM bị vi phạm về mặt phân phối chuẩn, kích cỡ mẫu tối thiểu, và mô hình phức tạp tối đa, hoặc bất thường về phương PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 16
pháp luận liên quan xảy ra trong quá trình ước lượng mô hình, PLS-SEM là một phương pháp thay thế tốt để kiểm định lý thuyết. Phụ lục 1.6 trình bày quy tắc kinh nghiệm hay còn gọi là quy tắc ngón tay cái (rules of thumb), có thể được áp dụng khi quyết định sử dụng CB-SEM hoặc PLS-SEM. Có thể thấy, PLS-SEM không được khuyến cáo như là một thay thế phổ biến cho CBSEM. Cả hai phương pháp khác nhau ở quan điểm thống kê, được thiết kế để đạt các mục tiêu khác nhau, và dựa vào các triết lý đo lường khác nhau. Do đó không phải kỹ thuật này cao hơn hẳn kỹ thuật kia và không phải kỹ thuật nào cũng thích hợp cho tất cả các tình huống. Nói chung, thế mạnh của PLS-SEM là điểm yếu của CB-SEM, và ngược lại. Điều quan trọng là các nhà nghiên cứu phải hiểu được các ứng dụng khác nhau của mỗi phương pháp để triển khai và sử dụng chúng cho phù hợp. Các nhà nghiên cứu cần áp dụng các kỹ thuật SEM trong trường hợp phù hợp nhất với mục tiêu nghiên cứu, đặc điểm dữ liệu, và thiết lập mô hình của họ.
Phụ lục 1.5 Kích thƣớc mẫu
Đặc điểm chính của PLS-SEM Những đặc điểm dữ liệu Không có các vấn đề nhận dạng với các kích thước mẫu nhỏ Các thống kê nói chung đạt độ nhạy thống kê cấp độ cao với những kích thước mẫu nhỏ. Các kích thước mẫu lớn tăng độ chính xác (ví dụ, tính nhất quán) của ước lượng PLS-SEM.
Sự phân phối
Không có sự giả định phân phối; PLS-SEM là phương pháp phi tham số.
Các giá trị khuyết
Các giá trị khuyết rõ rệt đều ở cấp độ thấp hơn mức hợp lý.
Thang đo lƣờng
Làm việc với dữ liệu tham số, dữ liệu gần như là tham số (thứ bậc) và các biến được mã hóa nhị phân (với các hạn chế nhất định). Có vài hạn chế khi sử dụng dữ liệu phân loại để đo lường các biến tiềm ẩn nội sinh. Những đặc điểm mô hình
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 17
Số lƣợng biến quan sát trong từng mô hình đo lƣờng khái niệm nghiên cứu Các mối quan hệ giữa các khái niệm nghiên cứu và các biến quan sát của chúng Độ phức tạp mô hình
Đo lường khái niệm với đo lường đơn biến và đa biến Dễ dàng kết hợp các mô hình đo lường nguyên nhân và kết quả. Xử lý các mô hình phức tạp với nhiều mối quan hệ mô hình cấu trúc
Thiết lập mô hình
Không vòng lặp nhân quả nào được cho phép trong mô hình cấu trúc
Đặc tính thuật toán của PLS-SEM Mục tiêu Giảm thiểu phương sai không giải thích được (tức là, tối đa giá trị R2) Hiệu quả
Hội tụ sau khi lặp đi lặp lại (thậm chí trong các tình huống với mô hình phức tạp và/ hoặc tập hợp dữ liệu lớn) để đưa ra giải pháp tối ưu; thuật toán hiệu quả
Bản chất của khái niệm nghiên cứu
Được xem như là các đại diện của khái niệm tiềm ẩn được điều tra, được đại diện bởi các biến tổng hợp
Điểm số của khái niệm
Ước lượng các tổ hợp tuyến tính của các biến quan sát Được xác định Sử dụng cho mục đích dự đoán Có thể sử dụng như đầu vào cho phân tích tiếp theo Không ảnh hưởng bởi sự thiếu dữ liệu
Ƣớc lƣợng tham số
Các quan hệ của mô hình cấu trúc nhìn chung đều bị đánh giá thấp và các mối quan hệ của mô hình đo lường nhìn chung được đánh giá cao khi ước lượng dữ liệu từ những mô hình yếu tố chung Tính nhất quán cao Độ nhạy thống kê cao Vấn đề đánh giá mô hình
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 18
Sự đánh giá mô hình tổng thể Không có tiêu chí độ phù hợp mô hình Sự đánh giá mô hình đo lƣờng
Mô hình đo lường kết quả: độ tin cậy và giá trị được đánh giá thông qua nhiều tiêu chí Mô hình đo lường nguyên nhân: đánh giá giá trị, mức ý nghĩa và sự liên quan của các trọng số quan sát, sự đa cộng tuyến
Sự đánh giá mô hình cấu trúc
Sự đa cộng tuyến giữa các tập khái niệm, mức ý nghĩa của hệ số đường dẫn, tiêu chí để đánh giá khả năng dự đoán của mô hình
Phân tích bổ sung
Phân tích ma trận hiệu suất tác động Các ảnh hưởng trung gian Các mô hình thành phần thứ bậc Phân tích đa nhóm Phát hiện và xử lý tính không đồng nhất không quan sát được Sự bất biến mô hình đo lường Các ảnh hưởng điều tiết
Nguồn: Adapted from Hair JF, Ringle CM and Sarstedt M (2011) PLS-SEM: Indeed a Silver Bullet. Journal of Marketing Theory and Practice 19: 139-151. Copyright© 2011 by M. E. Sharpe, Inc. reprinted by permission of the publisher (Taylor & Francis Ltd., http://www.tandfonline.com).
Phụ lục 1.6 Quy tắc kinh nghiệm trong việc chọn lựa giữa PLS-SEM và CB-SEM Sử dụng PLS-SEM khi Mục đích là dự báo các khái niệm nghiên cứu mục tiêu hoặc xác định khái niệm nghiên cứu “dẫn đường”. Khái niệm đo lường nguyên nhân là một phần của mô hình cấu trúc. Lưu ý rằng đo lường nguyên nhân cũng được sử dụng với CB-SEM, nhưng đòi hỏi thay đổi đặc tính kỹ thuật của mô hình (ví dụ: khái niệm nghiên cứu phải bao gồm cả biến quan sát nguyên nhân và kết quả để đáp ứng yêu cầu xác định). Mô hình cấu trúc phức tạp (nhiều khái niệm và nhiều biến quan sát). Kích thước mẫu nhỏ và/ hoặc dữ liệu không phải là phân phối chuẩn. Có kế hoạch sử dụng điểm biến tiềm ẩn trong phân tích tiếp theo. Sử dụng CB-SEM khi Mục đích là kiểm định lý thuyết, khẳng định lý thuyết, hoặc so sánh với các lý PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 19
thuyết thay thế khác. Phần sai số yêu cầu đặc điểm kỹ thuật bổ sung, như là hiệp phương sai. Mô hình cấu trúc có quan hệ vòng tròn. Nghiên cứu yêu cầu bộ tiêu chí đánh giá độ phù hợp mô hình. Nguồn: Adapted from Hair JF, Ringle CM and Sarstedt M (2011) PLS-SEM: Indeed a Silver Bullet. Journal of Marketing Theory and Practice 19: 139-151. Copyright© 2011 by M. E. Sharpe, Inc. reprinted by permission of the publisher (Taylor & Francis Ltd., http://www.tandfonline.com).
1.4.1 Các đặc điểm dữ liệu 1.4.1.1 Yêu cầu kích thƣớc mẫu tối thiểu Đặc điểm dữ liệu như là kích thước mẫu tối thiểu, dữ liệu không chuẩn và thang đo lường (tức là sử dụng các loại thang đo khác nhau) được xem như là lý do bắt đầu thông thường nhất trong việc áp dụng PLS-SEM. Trong khi một vài lập luận nhất quán với khả năng của phương pháp, phần còn lại thì không. Ví dụ, kích thước mẫu nhỏ có lẽ thường bị lạm dụng nhất trong tranh luận với các nhà nghiên cứu sử dụng PLS-SEM với kích cỡ mẫu nhỏ không thể chấp nhận được. Các nhà nghiên cứu thường tin rằng có một “ma thuật” nào đó trong phương pháp PLS-SEM cho phép họ sử dụng một mẫu rất nhỏ (ví dụ dưới 100) để có được các kết quả đại diện cho các tác động tồn tại trong một tổng thể của một vài triệu yếu tố hoặc cá nhân. Không có kỹ thuật phân tích đa biến nào, bao gồm PLS-SEM, có những khả năng “ma thuật” này. Tuy nhiên, kết quả của những sai lệch này đã dẫn đến chủ nghĩa hoài nghi nói chung về việc sử dụng PLS-SEM. Một mẫu là một sự lựa chọn của các yếu tố hoặc các cá thể riêng lẻ từ một tổng thể lớn hơn. Các cá thể được lựa chọn cụ thể trong quá trình lấy mẫu để đại diện cho tổng thể. Một mẫu tốt phải phản ánh sự tương đồng và sự khác biệt được tìm thấy trong tổng thể để có thể suy ra từ mẫu (nhỏ) về đám đông (lớn) tổng thể. Do đó, quy mô tổng thể và đặc biệt biến thể của các biến số trong nghiên cứu ảnh hưởng đến kích cỡ mẫu được yêu cầu trong quá trình lấy mẫu. Ngoài ra, khi áp dụng các kỹ thuật phân tích đa biến, các khuynh hướng mang tính kỹ thuật của mẫu sẽ trở nên phù hợp. Kích thước mẫu tối thiểu sẽ bảo đảm rằng các kết quả của phương pháp thống kê như PLS-SEM có đủ độ nhạy thống kê. Trong những điều này, một kích cỡ mẫu không đủ có thể không tiết lộ một tác động đáng kể nào tồn tại trong tổng thể (kết quả là gây ra sai lầm loại II). Hơn nữa, cỡ mẫu tối thiểu phải đảm bảo rằng các kết quả của phương pháp thống kê là mạnh mẽ và mô hình có thể khái quát được. Kích thước mẫu không đủ có thể dẫn đến các kết quả PLS-SEM có sự khác biệt lớn so với các mẫu khác. Sau đây, chúng ta tập trung vào PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 20
phương pháp PLS-SEM và các yêu cầu kỹ thuật của nó về kích thước mẫu tối thiểu. Tính phức tạp nói chung của mô hình cấu trúc có ảnh hưởng một ít lên yêu cầu kích thước mẫu cho PLS-SEM. Lý do là thuật toán không tính toán tất cả các mối quan hệ trong mô hình cấu trúc trong cùng một lúc. Thay vào đó, nó sử dụng hồi quy OLS để ước lượng các mối quan hệ hồi quy riêng phần của mô hình. Các nghiên cứu ban đầu đã đánh giá một cách hệ thống tính hiệu quả của PLS-SEM với các kích thước mẫu nhỏ và đã kết luận rằng nó thực hiện tốt. Gần đây hơn, nghiên cứu mô phỏng đã chỉ ra rằng PLSSEM là sự lựa chọn tốt khi kích thước mẫu nhỏ. Hơn nữa, so với kỹ thuật dựa trên hiệp phương sai đối lập, PLS-SEM có độ nhạy thống kê cao hơn trong các trường hợp cấu trúc mô hình phức tạp hoặc các kích thước mẫu nhỏ. Tương tự, các giải pháp có thể thu được với PLS-SEM khi các phương pháp khác không hội tụ hoặc các giải pháp không thể chấp nhận được. Ví dụ, những vấn đề thường bị gặp phải khi sử dụng CB-SEM trên những mô hình phức tạp, đặc biệt khi kích cỡ mẫu bị giới hạn. Tương tự, CB-SEM bị các vấn đề nhận dạng và hội tụ khi đo lường nguyên nhân xuất hiện. Không may, vài nhà nghiên cứu tin rằng kích thước mẫu nhỏ không đóng vai trò đặc biệt trong ứng dụng PLS-SEM. Ý kiến này được thúc đẩy bởi quy tắc 10 lần, cho rằng kích thước mẫu nên bằng hoặc lớn hơn: 1. Mười (10) lần số lớn nhất của các biến quan sát nguyên nhân được sử dụng để đo lường khái niệm đơn, hoặc 2. Mười (10) lần số lớn nhất của đường dẫn cấu trúc hướng vào một khái niệm riêng biệt trong mô hình cấu trúc. Quy tắc kinh nghiệm nói rằng kích thước mẫu tối thiểu nên bằng 10 lần số lớn nhất của mũi tên trong biến tiềm ẩn ở mọi vị trí trong mô hình cấu trúc PLS. Trong khi quy định 10 lần đề xuất chỉ dẫn sơ bộ về yêu cầu kích thước mẫu tối thiểu, PLS-SEM cũng như các kỹ thuật thống kê khác - yêu cầu nhà nghiên cứu cân nhắc lại kích thước mẫu với nền tảng mô hình và đặc điểm dữ liệu. Đặc biệt, kích thước mẫu cần thiết nên được xác định bởi phân tích độ nhạy dựa trên một phần mô hình với số lượng lớn nhất của biến dự báo. Vì những kiến nghị kích thước mẫu trong PLS-SEM cơ bản dựa trên đặc tính của hồi quy OLS, các nhà nghiên cứu có thể dựa trên các quy tắc kinh nghiệm khác trong phân tích độ nhạy thống kê cho nhiều mô hình hồi quy bội, cung cấp mô hình đo lường có thể chấp nhận được về mặt hệ số tải ngoài (ví dụ hệ số tải nên ở trên ngưỡng chung là 0.70). Cách khác, các nhà nghiên cứu có thể sử dụng các chương trình như G*Power (miễn phí tại trang http://www.psycho.uni-duesseldorf.de) để thực hiện phân tích độ nhạy PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 21
cụ thể nhằm thiết lập mô hình. Phụ lục 1.7 chỉ ra những yêu cầu cần thiết về kích thước mẫu tối thiếu để phát hiện giá trị R2 nhỏ nhất: 0.10, 0.25, 0.50 và 0.75 ở bất cứ khái niệm biến nội sinh nào trong mô hình cấu trúc với mức ý nghĩa 1%, 5% và 10%, giả định chung việc sử dụng độ nhạy thống kê 80% và mức độ phức tạp cụ thể của mô hình PLS (tức là số lượng tối đa các điểm mũi tên tại một khái niệm nghiên cứu trong mô hình PLS). Ví dụ, khi số lượng tối đa biến độc lập trong mô hình đo lường và mô hình cấu trúc là 5 (năm), sẽ cần 45 quan sát để đạt được độ nhạy thống kê 80% cho việc phát hiện giá trị R2 nhỏ nhất 0.25 (với xác suất sai số 5%).
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 22
Phụ lục 1.7 Cỡ mẫu đề nghị khi sử dụng PLS-SEM với độ nhạy thống kê 80% Mức ý nghĩa
Số mũi tên tối đa ở một khái niệm (số lƣợng biến độc lập)
10%
5%
1%
R2 tối thiểu
R2 tối thiểu
R2 tối thiểu
0.10
0.25
0.50
0.75
0.10
0.25
0.50
0.75
0.10
0.25
0.50
0.75
2
72
26
11
7
90
33
14
8
130
47
19
10
3
83
30
13
8
103
37
16
9
145
53
22
12
4
92
34
15
9
113
41
18
11
158
58
24
14
5
99
37
17
10
122
45
20
12
169
62
26
15
6
106
40
18
12
130
48
21
13
179
66
28
16
7
112
42
20
13
137
51
23
14
188
69
30
18
8
118
45
21
14
144
54
24
15
196
73
32
19
9
124
47
22
15
150
56
26
16
204
76
34
20
10
129
49
24
16
156
59
27
18
212
79
35
21
Nguồn: Cohen (1992): A power primer. Psychological Bulletin 112: 155-519.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 23
1.4.1.2 Đặc điểm dữ liệu Như mọi phân tích thống kê khác, các dữ liệu khuyết đều được xử lý khi sử dụng PLS-SEM. Đối với những giới hạn hợp lý (tức là ít hơn 5% giá trị khuyết trên một quan sát), giá trị khuyết sẽ được lựa chọn xử lý bằng cách thay thế giá trị trung bình, EM (Expectation-maximization - thuật toán tối đa hóa kỳ vọng), và các giá trị lân cận gần nhất kết quả thông thường chỉ khác một ít trong ước lượng PLS. Cách khác, các nhà nghiên cứu có thể lựa chọn xoá tất cả các quan sát có dữ liệu khuyết, tuy nhiên, sự biến đổi trong dữ liệu sẽ giảm và có thể gây nên sự thiên lệch khi các nhóm quan sát nhất định bị xoá một cách có hệ thống. Việc sử dụng PLS-SEM có hai lợi thế chính liên quan đến đặc điểm dữ liệu (tức là phân phối và thang đo). Do đó, trong nhiều tình huống khó khăn và không thể đáp ứng được yêu cầu chặt chẽ của nhiều kỹ thuật đa biến truyền thống (ví dụ, phân phối dữ liệu dạng chuẩn), PLS-SEM là phương pháp thích hợp hơn. Tính linh hoạt của PLS-SEM được mô tả bằng tên “mô hình mềm”. Tuy nhiên, lưu ý ở đây, “mềm” chỉ do sự giả định phân phối và không đề cập đến khái niệm, mô hình, hoặc kỹ thuật ước lượng. Đặc tính thống kê của PLSSEM cung cấp những ước lượng mô hình mạnh mẽ với dữ liệu có đặc tính phân phối chuẩn cũng như cực không chuẩn (tức là độ lệch/độ nhọn). Tuy nhiên, phải ghi nhớ, giá trị ngoại lai, và cộng tuyến làm ảnh hưởng tới hồi quy OLS trong PLS-SEM, và các nhà nghiên cứu nên đánh giá dữ liệu và các kết quả của những vấn đề này. Thuật toán PLS-SEM nhìn chung đòi hỏi dữ liệu dạng số trên thang đo tỷ lệ hoặc thang đo khoảng đối với các quan sát trong mô hình đo lường. Nhưng phương pháp này cũng làm việc tốt với thang đo thứ bậc với điểm dữ liệu cách đều (ví dụ thang đo bán tham số - quasi-metric scale) và dữ liệu mã hoá nhị phân. Cách sử dụng dữ liệu mã hoá nhị phân thường bao gồm các biến kiểm soát phân loại hoặc các biến điều tiết trong mô hình PLSSEM. Nói ngắn gọn, các biến được mã hoá giả (dummy) có thể được tính đến trong mô hình PLS-SEM nhưng đòi hỏi sự chú ý đặc biệt và không nên được sử dụng như là biến phụ thuộc cuối cùng. Phụ lục 1.8 tổng hợp các cân nhắc chính liên quan đến đặc điểm dữ liệu.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 24
Phụ lục 1.8 Những cân nhắc về dữ liệu khi áp dụng PLS-SEM Theo hướng dẫn sơ bộ, kích thước mẫu tối thiểu trong một phân tích PLS-SEM nên bằng hoặc lớn hơn (quy tắc 10 lần) như sau: (1) 10 lần số lớn nhất của các biến quan sát nguyên nhân được sử dụng để đo lường khái niệm đơn, hoặc (2) 10 lần số lớn nhất của đường dẫn cấu trúc hướng vào một khái niệm riêng biệt trong mô hình cấu trúc. Tuy nhiên, các nhà nghiên cứu nên làm theo các khuyến nghị phức tạp hơn như các khuyến cáo của Cohen (1992), cũng như độ nhạy thống kê và ảnh hưởng của kích cỡ đến kết quả. Ngoài ra, các nhà nghiên cứu nên chạy phân tích độ nhạy riêng biệt, sử dụng các chương trình như G*Power. Với những tập dữ liệu lớn (N=250 và lớn hơn), kết quả của CB-SEM và PLS-SEM là rất tương đồng khi một số lượng thích hợp của các biến quan sát (4 hoặc nhiều hơn) được sử dụng để đo lường từng khái niệm (tính nhất quán càng lớn). PLS-SEM có thể xử lý dữ liệu rất không chuẩn (ví dụ mức độ xiên cao). Hầu hết các thủ tục xử lý giá trị khuyết (ví dụ: thay thế trung bình, xóa theo cặp, EM và lấy theo điểm gần nhất) được sử dụng cho các mức dữ liệu bị khuyết hợp lý (ít hơn 5% khuyết cho mỗi biến quan sát) với hiệu quả hạn chế đối với các kết quả phân tích.
1.4.2 Các đặc điểm mô hình PLS-SEM rất linh hoạt trong tính chất mô hình của nó. Thuật toán PLS-SEM đòi hỏi tất cả các mô hình đều không cho phép có mối quan hệ vòng tròn hoặc vòng lặp các mối quan hệ giữa các biến tiềm ẩn trong mô hình cấu trúc. Trong khi mô hình có vòng lặp hiếm khi được định rõ ở nghiên cứu kinh doanh, các đặc điểm này làm giới hạn tính ứng dụng của PLS-SEM nếu mô hình như vậy được yêu cầu. Các yêu cầu đặc điểm mô hình khác đều bắt buộc khi sử dụng CB-SEM, như là giả định phân phối, đều không liên quan đến PLS-SEM. Những khó khăn của mô hình đo lường là một trong những chướng ngại chính trong việc đạt được một giải pháp đối với CB-SEM. Thí dụ, ước lượng của những mô hình phức tạp với nhiều biến tiềm ẩn và/hoặc biến chỉ báo thường là không thể với CB-SEM. Ngược
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 25
lại, PLS-SEM có thể được sử dụng trong nhiều tình huống vì không bị hạn chế bởi sự xác định và các vấn đề kỹ thuật khác. Việc cân nhắc mô hình đo lường kết quả và nguyên nhân là vấn đề chính trong việc áp dụng SEM. PLS-SEM có thể dễ dàng xử lý cả hai mô hình đo lường nguyên nhân và kết quả và được xem xét như cách tiếp cận ban đầu khi mô hình giả thuyết kết hợp với đo lường nguyên nhân. CB-SEM có thể chứa các biến chỉ báo nguyên nhân nhưng để đảm bảo tính xác định của mô hình, chúng phải theo các quy định kỹ thuật chi tiết riêng biệt. Ngược lại, PLS-SEM không có nhiều yêu cầu, và xử lý được mô hình đo lường nguyên nhân mà không gặp phải bất kỳ hạn chế nào. Điều này cũng áp dụng cho các thiết lập mô hình, trong đó các khái niệm nội sinh được đo lường nguyên nhân. Khả năng áp dụng CB-SEM vào các thiết lập mô hình như vậy đã và đang là một cuộc tranh luận đáng kể, nhưng do quá trình ước lượng nhiều bước của PLS-SEM, các phân chia đo lường từ ước lượng mô hình cấu trúc, mà việc đưa vào các khái niệm nội sinh được đo lường nguyên nhân không phải là một vấn đề trong PLS-SEM. Vấn đề khó khăn duy nhất là tồn tại hiện tượng cộng tuyến ở cấp độ cao giữa các biến quan sát của mô hình đo lường nguyên nhân. Cuối cùng, PLS-SEM có khả năng ước lượng những mô hình rất phức tạp. Ví dụ, nếu giả định lý thuyết hoặc khái niệm hỗ trợ những mô hình lớn và dữ liệu đầy đủ có sẵn (tức là đáp ứng yêu cầu kích thước mẫu tối thiếu), PLS-SEM có thể xử lý các mô hình với hầu hết các kích thước mẫu, gồm hàng tá khái niệm nghiên cứu và hàng trăm biến quan sát. Phụ lục 1.9 tóm tắt những quy tắc kinh nghiệm đối với đặc điểm mô hình PLS-SEM.
Phụ lục 1.9 Những cân nhắc mô hình khi chọn PLS-SEM Những yêu cầu về mô hình đo lường là khá linh hoạt. PLS-SEM có thể xử lý cả mô hình đo lường nguyên nhân và kết quả cũng như đo lường đơn biến mà không cần những yêu cầu bổ sung hay ép buộc nào. Sự phức tạp của mô hình nhìn chung không phải là vấn đề đối với PLS-SEM. Miễn là các dữ liệu thích hợp đáp ứng các yêu cầu về cỡ mẫu tối thiểu, sự phức tạp của mô hình cấu trúc hầu như không bị giới hạn.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 26
CHƢƠNG 2 BIẾN NGUYÊN NHÂN & BIẾN KẾT QUẢ 2.1 MÔ HÌNH ĐO LƢỜNG NGUYÊN NHÂN & KẾT QUẢ Khi phát triển các khái niệm nghiên cứu, các nhà nghiên cứu phải xem xét đặc điểm kỹ thuật của 2 mô hình đo lường: mô hình đo lường kết quả và nguyên nhân. Mô hình đo lƣờng kết quả (còn gọi là đo lường Mode A trong PLS-SEM) có một truyền thống lâu đời trong khoa học xã hội và trực tiếp dựa trên lý thuyết thử nghiệm cổ điển. Theo lý thuyết này, các biện pháp đo lường đại diện cho sự tác động (hoặc sự biểu hiện) của một khái niệm nghiên cứu cơ bản. Vì vậy, quan hệ nhân quả từ khái niệm đến các biến đo lường nó (COMP trong Phụ lục 2.2). Biến quan sát kết quả (thỉnh thoảng còn được gọi là effect indicators trong lĩnh vực tâm lý) có thể được xem như là mẫu đại diện cho tất cả biến đo lường thuộc phạm vi của khái niệm nghiên cứu. Vì vậy, đo lường kết quả chỉ ra rằng tất cả các biến quan sát được tạo ra bởi cùng khái niệm nghiên cứu (tức là, nó xuất phát từ cùng một nơi), các biến quan sát liên quan đến một khái niệm nghiên cứu cụ thể cần liên quan chặt chẽ với nhau. Ngoài ra, các biến quan sát riêng biệt cần được hoán đổi cho nhau, và bất kỳ biến quan sát đơn lẻ nói chung có thể được bỏ qua mà không thay đổi ý nghĩa của khái niệm nghiên cứu, miễn là các khái niệm nghiên cứu có đủ độ tin cậy. Thực tế là mối quan hệ đi từ khái niệm nghiên cứu tới biến đo lường của nó ngụ ý rằng, nếu sự đánh giá đặc tính tiềm ẩn thay đổi (do thay đổi tiêu chuẩn so sánh), tất cả các biến quan sát sẽ thay đổi đồng thời. Một tập hợp các đo lường kết quả thường được gọi là một thang đo. Ngược lại, mô hình đo lƣờng nguyên nhân (còn gọi là Mode B trong PLS-SEM) được dựa trên giả định rằng các biến quan sát nguyên nhân tạo ra khái niệm nghiên cứu bằng liên kết tuyến tính. Do đó, các nhà nghiên cứu thường đề cập đến loại mô hình đo lường này như là một tập hợp các biến quan sát nguyên nhân (Index). Một đặc tính quan trọng của các biến quan sát nguyên nhân là chúng không hoán đổi lẫn nhau được, điều này xảy ra với các biến quan sát kết quả. Như vậy, mỗi biến quan sát cho một khái niệm nguyên nhân nắm bắt
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 27
một khía cạnh cụ thể thuộc phạm vi khái niệm nghiên cứu. Tập hợp lại, các biến đo lường xác định ý nghĩa của khái niệm nghiên cứu, trong đó hàm ý rằng việc bỏ qua một biến quan sát có khả năng làm thay đổi bản chất của khái niệm nghiên cứu. Kết quả là, sự mở rộng phạm vi khái niệm nghiên cứu là cực kỳ quan trọng để đảm bảo rằng giá trị nội dung của khái niệm nghiên cứu là đầy đủ. Phụ lục 2.1
Mô hình Biến phản ánh nguyên nhân & Biến phản ánh kết quả
Hiện nay, các nhà nghiên cứu đã bắt đầu phân biệt 2 loại biến quan sát trong đo lường nguyên nhân: biến quan sát nguyên nhân và biến quan sát tổng hợp. Biến quan sát tổng hợp (composite indicators) đáp ứng rộng hơn về định nghĩa mô hình đo lường nguyên nhân ở trên mà trong đó chúng được kết nối theo cách tuyến tính để hình thành một biến (Chương 1), cũng còn được gọi là biến tổng hợp trong bối cảnh SEM. Chính xác hơn, các biến quan sát hình thành đầy đủ biến tổng hợp (tức là, giá trị R2 của biến tổng hợp bằng 1). Biến tổng hợp được xem như là một đại diện cho khái niệm tiềm ẩn, và các biến quan sát không nhất thiết cần phải được thống nhất theo khái niệm. Ngược lại, biến quan sát nguyên nhân (causal indicators) không hình thành nên biến tiềm ẩn nhưng, như tên gọi ngụ ý, “gây ra” nó. Bởi vậy, biến quan sát nguyên nhân phải tương ứng với một định nghĩa lý thuyết của khái niệm đang điều tra. Sự khác biệt tinh tế từ biến tổng hợp có hàm ý quan trọng đối với mô hình của biến tiềm ẩn, nó thật sự không giống như bất kỳ tập hợp biến quan sát nguyên PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 28
nhân có thể nắm bắt được tất cả các khía cạnh của một hiện tượng/sự việc tiềm ẩn. Vì thế, các biến tiềm ẩn được đo lường bằng biến quan sát nguyên nhân có một khoản sai số, đây là khoản chứa đựng tất cả các nguyên nhân khác của biến tiềm ẩn mà không có trong mô hình. Việc sử dụng biến quan sát nguyên nhân là phổ biến trong CB-SEM, cho phép xác định rõ ràng về sai số của biến tiềm ẩn đo lường nguyên nhân. Nhưng trong PLS-SEM thì khác. Thuật toán PLS-SEM chỉ dựa vào khái niệm của biến quan sát tổng hợp bởi do các thuật toán ước lượng mô hình đo lường nguyên nhân. Phụ lục 2.2
Ví dụ về mô hình đƣờng dẫn với 3 khái niệm nghiên cứu
Tóm lại, sự khác nhau giữa biến quan sát nguyên nhân và tổng hợp liên quan tới sự khác nhau trong triết lý đo lường. Biến quan sát nguyên nhân giả định rằng một khái niệm nào đó có thể - ít nhất về cơ bản - được đo lường một cách đầy đủ bằng cách sử dụng một tập biến quan sát và một khoản sai số. Biến quan sát tổng hợp không giả định nhưng xem việc đo lường như một phép tính xấp xỉ của một khái niệm lý thuyết nào đó. Trong nghiên cứu khoa học xã hội, việc xem xét sự đo lường như một phép tính xấp xỉ dường như thực tế hơn, trong đó, từ quan điểm dựa trên các khái niệm, thiên về việc sử dụng biến quan sát tổng hợp hơn là biến quan sát nguyên nhân. Do lợi ích của tính đơn giản và phù hợp với nghiên cứu chuyên sâu trong lĩnh vực này, chúng tôi đề cập tới biến quan sát nguyên nhân khi đang nói
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 29
đến biến quan sát tổng hợp (vì sử dụng trong PLS-SEM) trong phần còn lại của cuốn sách này. Tương tự, chúng tôi nói đến mô hình đo lường nguyên nhân để mô tả mô hình đo lường gồm các biến quan sát tổng hợp. Phụ lục 2.3 minh họa sự khác biệt chính giữa các quan điểm đo lường kết quả và nguyên nhân. Các vòng tròn màu đen minh họa phạm vi khái niệm nghiên cứu, đó là phạm vi nội dung khái niệm được dự định đo lường. Các vòng tròn màu xám đại diện cho phạm vi mỗi biến quan sát nắm bắt. Trong khi đó, ngược lại, phương pháp đo lường kết quả nhằm mục đích tối đa hóa sự chồng chéo giữa các biến quan sát có thể thay thế cho nhau, phương pháp đo lường nguyên nhân nhằm cố gắng lắp đầy được phạm vi khái niệm tiềm ẩn đang khảo sát (vòng tròn màu đen) bởi các biến quan sát nguyên nhân khác nhau (vòng tròn màu xám), với sự chồng chéo nhỏ. Phụ lục 2.3
Sự khác nhau giữa đo lƣờng nguyên nhân và đo lƣờng kết quả
Đo lƣờng kết quả
Đo lƣờng nguyên nhân
Không giống như phương pháp đo lường kết quả trong đó mục tiêu là tối đa hóa chồng chéo giữa các biến quan sát có thể thay thế cho nhau, không có sự kỳ vọng cụ thể nào về mô hình hoặc mức độ của sự tương quan giữa các biến quan sát nguyên nhân. Bởi vì không có “nguyên nhân phổ biến/common cause” đối với các biến đo lường trong khái niệm PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 30
nghiên cứu, không có bất kỳ yêu cầu nào đối với các biến đo lường phải tương quan, chúng nên hoàn toàn độc lập với nhau. Trong thực tế, sự cộng tuyến giữa các biến quan sát nguyên nhân chỉ ra vấn đề lớn đáng chú ý bởi vì sự kết nối các biến quan sát nguyên nhân với khái niệm nghiên cứu có thể trở nên không vững chắc và không có ý nghĩa. Hơn nữa, các biến quan sát nguyên nhân (theo nghĩa của biến quan sát tổng hợp) không có sai số đo lường riêng biệt. Chúng được giả định là không có sai số theo một ý nghĩa thông thường. Các đặc tính này chứa hàm ý rộng đối với sự đánh giá khái niệm đo lường nguyên nhân, điều mà dựa trên một tập hợp tiêu chí hoàn toàn khác biệt so với sự đánh giá đo lường kết quả. Ví dụ, phân tích độ tin cậy dựa vào tương quan biến (độ nhất quán nội tại) có thể loại biến quan trọng và giảm giá trị của thang đo. Nói rộng ra, các nhà nghiên cứu cần phải chú ý hơn tới giá trị nội dung của đo lường bằng cách xác định một cách tốt nhất các biến quan sát đại diện cho phạm vi nội dung (hoặc ít nhất là khía cạnh chính) của khái niệm tiềm ẩn đang nghiên cứu. Nhƣng khi nào chúng ta đo lƣờng khái niệm theo nguyên nhân hoặc kết quả? Không có một câu trả lời rõ ràng cho câu hỏi này vì khái niệm nghiên cứu không hẳn là nguyên nhân hoặc kết quả. Thay vào đó, các đặc điểm phụ thuộc vào khái niệm nghiên cứu và mục tiêu nghiên cứu. Xem xét Phụ lục 2.4, trong đó cho thấy cách khái niệm “Sự hài lòng với khách sạn” có thể được vận hành trong cả hai trường hợp. Phía bên trái của Phụ lục 2.4 cho thấy cách thiết lập mô hình đo lường kết quả. Đây là dạng thiết lập mô hình thích hợp hơn khi một nhà nghiên cứu muốn kiểm định các lý thuyết liên quan đến sự hài lòng. Trong nhiều nghiên cứu lĩnh vực kinh doanh, quản trị, với mục đích là xác định các yếu tố quan trọng nhất dẫn đến sự hài lòng để cuối cùng dẫn tới sự trung thành của khách hàng. Trong trường hợp này, các nhà nghiên cứu nên xem xét các khía cạnh khác nhau của sự hài lòng, chẳng hạn như sự hài lòng với dịch vụ hoặc các nhân viên, như thể hiện ở phía bên phải của Phụ lục 2.4. Ở trường hợp cuối, đặc điểm mô hình đo lường nguyên nhân hứa hẹn hơn bởi vì nó cho phép xác định động cơ khác biệt của sự hài lòng và từ đó có được những khuyến nghị sâu sắc hơn. Điều này đặc biệt áp dụng cho các tình huống mà trong đó khái niệm nghiên cứu tương ứng là ngoại sinh. Tuy nhiên, mô hình đo lường nguyên nhân có thể được sử dụng cho khái niệm nghiên cứu nội sinh khi mà lý thuyết đo lường hỗ trợ đặc điểm chi tiết. Ngoài vai trò một khái niệm nghiên cứu thể hiện trong mô PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 31
hình và những khuyến nghị nhà nghiên cứu muốn đưa ra dựa vào kết quả, đặc tính nội dung của khái niệm nghiên cứu (nội dung phạm vi khái niệm nghiên cứu được nắm bắt) chủ yếu hướng dẫn quan điểm đo lường. Mặc dù vậy, sự quyết định mô hình đo lường nào phù hợp là chủ đề cần cân nhắc cẩn thận ở sự khác nhau về ngành học và không được giải quyết hoàn toàn. Phụ lục 2.4
Sự hài lòng khi khái niệm nghiên cứu đo lường nguyên nhân và kết quả
Mô hình đo lƣờng kết quả
Mô hình đo lƣờng nguyên nhân
Tôi đánh giá cao khách sạn này.
Tôi mong muốn ở lại trong khách sạn này. Tôi giới thiệu khách sạn này cho những người khác.
Dịch vụ tốt.
Y1
Nhân viên thân thiện.
Y1
Phòng ốc sạch sẽ.
Trong Phụ lục 2.5, chúng tôi trình bày một loạt các hướng dẫn mà các nhà nghiên cứu có thể sử dụng để dẫn đến quyết định của mình trong việc đo lường nguyên nhân hoặc kết quả. Lưu ý rằng cũng có những phương tiện thực nghiệm để xác định quan điểm đo lường. Phương pháp phân tích bộ tứ khẳng định (confirmatory tetrad analysis) cho PLS-SEM (viết tắt CTA-PLS), cho phép kiểm định các giả thuyết không (H0) mà các đo lường khái niệm nghiên cứu là mang tính kết quả về bản chất. Bác bỏ giả thuyết không (H0) trong kiểm định bộ tứ hàm ý rằng, các đo lường nguyên nhân nên được sử dụng cho sự vận hành khái niệm nghiên cứu. Rõ ràng, quan điểm định hướng dữ liệu cần phải được bổ sung với các cân nhắc lý thuyết dựa trên hướng dẫn tóm tắt trong Phụ lục 2.5.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 32
Phụ lục 2.5
Hƣớng dẫn lựa chọn dạng mô hình đo lƣờng Tiêu chí
Quyết định
Quan hệ nhân quả giữa biến
Từ khái niệm nghiên cứu
quan sát và khái niệm nghiên
tới biến quan sát: kết quả
cứu
Từ biến quan sát tới khái
Tham khảo Diamantopoulos và
Winklhofer
(2001)
niệm nghiên cứu: nguyên nhân Khái niệm nghiên cứu giải
Nếu đặc tính: kết quả
Fornell
thích đặc tính các biến quan
Nếu kết hợp: nguyên nhân
Bookstein (1982)
Biến quan sát đại diện cho kết
Nếu kết quả: kết quả
Rossiter (2002)
quả hay nguyên nhân của khái
Nếu nguyên nhân: nguyên
và
sát hay là một sự kết hợp của các biến quan sát?
niệm nghiên cứu?
nhân
Có cần thiết khi đánh giá thay
Nếu có: kết quả
đổi đặc tính, tất cả các biến đo
Nếu không: nguyên nhân
Chin (1998)
lƣờng sẽ thay đổi theo cách tƣơng tự (giả sử chúng đƣợc mã hoá nhƣ nhau)? Các biến đo lường có thể hoán
Nếu có: kết quả
Jarvis,
đổi lẫn nhau không?
Nếu không: nguyên nhân
MacKenzie,
và
Podsakoff (2003)
2.2 MINH HỌA TÌNH HUỐNG NGHIÊN CỨU: XÁC ĐỊNH MÔ HÌNH PLS - SEM Trong mô hình ban đầu, chúng tôi đưa ra giả thuyết mô hình đường dẫn để ước lượng các mối quan hệ giữa danh tiếng công ty, sự hài lòng của khách hàng, và lòng trung thành của khách hàng. Ví dụ sẽ cung cấp những hiểu biết về (1) làm thế nào để phát triển mô hình PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 33
cấu trúc đại diện cho các khái niệm/ lý thuyết, (2) thiết lập mô hình đo lường đối với các biến tiềm ẩn, và (3) cấu trúc của dữ liệu thực nghiệm được sử dụng. Sau đó, chúng ta tập trung vào việc thiết lập trên phần mềm SmartPLS 3 khi phân tích PLS-SEM. Áp dụng bƣớc 1: Xác định mô hình cấu trúc Để xác định mô hình cấu trúc, chúng ta phải bắt đầu với một số giải thích cơ bản về mô hình khái niệm / lý thuyết. Mô hình danh tiếng công ty (Corporation reputation). Mục tiêu của mô hình là giải thích sự ảnh hưởng của danh tiếng công ty tới sự hài lòng của khách hàng (CUSA) và cuối cùng là sự trung thành của khách hàng (CUSL). Danh tiếng công ty liên quan đến những giá trị tổng thể của các bên liên quan. Nó được đo lường trên hai phạm vi. Một là, nó đề cập đến những giá trị nhận thức, và khái niệm nghiên cứu là năng lực của công ty (COMP). Hai là, sự chiếm được tình cảm của khách hàng thông qua sự thân thiện của công ty (LIKE). Nghiên cứu gần đây chỉ ra rằng phương pháp này được thực hiện một cách thuận lợi (về góc độ giá trị hội tụ và giá trị dự báo) so với các phương pháp đo lường về danh tiếng khác. Xây dựng một định nghĩa về danh tiếng công ty như là một khái niệm liên quan hành vi, các nhà nghiên cứu đã xác định thêm bốn khía cạnh tiền đề - chất lượng, hiệu quả hoạt động, sức hấp dẫn, và trách nhiệm xã hội của công ty - được đo lường thông qua 21 biến quan sát nguyên nhân. Tóm lại, mô hình danh tiếng công ty giản đơn có hai thành phần chính: (1) các khái niệm mục tiêu quan tâm, cụ thể là CUSA và CUSL (các biến phụ thuộc) và (2) hai nhân tố quan trọng giải thích cho khái niệm danh tiếng công ty là COMP và LIKE (các biến độc lập). Phụ lục 2.6 chỉ ra các khái niệm nghiên cứu và các mối quan hệ của chúng, đại diện mô hình cấu trúc đối với tình huống nghiên cứu PLS-SEM. Để đề xuất một lý thuyết / khái niệm, các nhà nghiên cứu thường xây dựng trên kiến thức nghiên cứu hiện có. Các nhà nghiên cứu thường phát triển giả thuyết cho các khái niệm nghiên cứu và các mối quan hệ đường dẫn của chúng trong mô hình cấu trúc. Ví dụ, hãy xem xét giả thuyết 1 (H1): Sự hài lòng của khách hàng có tác động tích cực đến sự trung thành của khách hàng. PLS-SEM cho phép đưa ra tính thống kê về mức ý nghĩa của mối quan hệ
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 34
giả thuyết. Khi định nghĩa các khái niệm lý thuyết và các mối quan hệ cấu trúc giả thuyết của chúng trong PLS-SEM, điều quan trọng là phải đảm bảo các mô hình không có mối quan hệ vòng tròn (tức là vòng lặp nhân quả) mà theo đó gọi là đệ quy (tức là vòng lặp vô hạn). Một mối quan hệ vòng tròn sẽ xảy ra nếu, chúng ta đảo ngược mối quan hệ giữa COMP và CUSL, khi đó sẽ sinh ra vòng nhân quả COMP → CUSA → CUSL → COMP.
Phụ lục 2.6
Ví dụ mô hình lý thuyết/khái quát (mô hình đơn giản)
COMP
CUSA
CUSL
LIKE
Áp dụng bƣớc 2: Xác định mô hình đo lƣờng Bởi vì các khái niệm nghiên cứu không được quan sát một cách trực tiếp, chúng ta cần phải xác định một mô hình đo lường cho từng khái niệm nghiên cứu. Đặc điểm của các mô hình đo lường (đo lường đơn biến và đa biến, đo lường nguyên nhân và kết quả) dựa trên các nghiên cứu trước. Trong ví dụ đơn giản về ứng dụng PLS-SEM, chúng ta có ba khái niệm (COMP, CUSL, và LIKE) được đo bằng nhiều biến (Phụ lục 2.7). Tất cả ba khái niệm nghiên cứu có mô hình đo lường kết quả như được chỉ ra bởi các mũi tên từ khái niệm nghiên cứu đến các biến quan sát. Ví dụ, COMP được đo bằng ba biến kết quả comp_1, comp_2, và comp_3, mà các biến này liên quan đến các câu hỏi khảo sát (Phụ lục 2.8): “[Công ty] là một đối thủ cạnh tranh hàng đầu trên thị trường”, “Theo như tôi biết, [công ty] được công nhận trên toàn thế giới”, và “Tôi tin rằng [công ty] hoạt động ở
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 35
mức độ cao cấp”. Người trả lời phải đưa ra mức độ không đồng ý hoặc đồng ý với mỗi câu phát biểu theo thang đo 7 điểm, từ 1 = hoàn toàn không đồng ý đến7 = hoàn toàn đồng ý. Khác với COMP, CUSL, và LIKE, khái niệm sự hài lòng của khách hàng (CUSA) được hoạt hóa bởi một biến duy nhất (cusa) có liên quan đến câu hỏi trong cuộc khảo sát: “Khi bạn xem xét kinh nghiệm của bạn với [công ty], bạn hài lòng như thế nào với [công ty]?” Biến đơn được đo bằng thang đo 7 điểm chỉ ra mức độ hài lòng của người trả lời (1 = rất không hài lòng; 7 = rất hài lòng). Biến đơn đƣợc sử dụng do cân nhắc thực tế trong nỗ lực để giảm số lƣợng biến trong bảng câu hỏi. Vì các biến quan sát về sự hài lòng của khách hàng thường rất đồng nhất, sự mất mát trong giá trị tiên đoán so với đo lường đa biến không được xem là nghiêm trọng. Do cusa là biến duy nhất đo lường sự hài lòng của khách hàng, khái niệm nghiên cứu và biến quan sát là tương đương (chỉ ra rằng mối quan hệ giữa khái niệm nghiên cứu và đo lường đơn biến luôn là một trong PLS-SEM). Do đó, sự lựa chọn quan điểm đo lường (đo lường kết quả, nguyên nhân) thì không cần quan tâm và mối quan hệ giữa khái niệm nghiên cứu và biến quan sát là vô hướng. Các dạng mô hình đo lƣờng theo mô hình đơn giản
Phụ lục 2.7
Mô hình đo lƣờng kết quả
Mô hình đo lƣờng kết quả like_1
comp_1 comp_2
COMP
comp_3
like_2
LIKE
like_3
Khái niện nghiên cứu đơn biến
Mô hình đo lƣờng kết quả cusl_1
cusa
CUSA
CUSL
cusl_2 cusl_3
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 36
Phụ lục 2.8
Các biến quan sát cho khái niệm nghiên cứu mô hình đo lƣờng kết quả Năng lực/Competence (COMP)
com_1
[Công ty] là một đối thủ hàng đầu trong thị trường của nó.
com_2
Theo như tôi biết, [công ty] được công nhận trên toàn thế giới.
com_3
Tôi tin rằng [công ty] hoạt động ở mức độ cao cấp Thân thiện/Likeability (LIKE)
like_1
[Công ty] là một công ty mà tôi có thể nhận diện tốt hơn so với các công ty khác.
like_2
[Công ty] là một công ty mà tôi tiếc nhiều nếu nó không tồn lâu hơn so với các công ty khác.
like_3
Tôi coi công ty là một công ty thân thiện. Lòng trung thành của khách hàng/Customer Loyalty (CUSL)
cusl_1
Tôi muốn giới thiệu [công ty] với bạn bè và người thân.
cusl_2
Nếu tôi phải chọn lại, tôi sẽ chọn [công ty] làm nhà cung cấp dịch vụ điện thoại di động của tôi.
cusl_3
Tôi vẫn sẽ là khách hàng của [công ty] trong tương lai.
Lưu ý: Đối với thu thập dữ liệu, tên thực tế của công ty được đưa vào trong dấu ngoặc vuông.
Áp dụng bƣớc 3: Thu thập và kiểm tra dữ liệu Để ước lượng PLS-SEM, dữ liệu được thu thập thông qua các cuộc phỏng vấn qua điện thoại về nhận thức của người trả lời và sự hài lòng của họ với bốn nhà cung cấp mạng di động lớn trên thị trường thông tin di động của Đức. Người được hỏi trả lời các câu hỏi theo thang đo Likert 7 điểm, điểm số lớn hơn biểu thị mức độ đồng ý cao hơn. Trường hợp của cusa, điểm số lớn hơn biểu thị mức độ cao hơn của sự hài lòng. Sự hài lòng và lòng trung thành đã được hỏi đối với các nhà cung cấp dịch vụ của chính người trả lời. Bộ dữ liệu có 344 quan sát (bảng trả lời). Phụ lục 2.9 hiển thị ma trận dữ liệu cho mô hình. Mười (10) cột đại diện cho các biến (các câu hỏi cụ thể trong cuộc khảo sát như đã mô tả trong phần trước) và 344 dòng (các trường hợp) có chứa câu trả lời của mỗi người cho những câu hỏi. Ví dụ, dòng đầu tiên chứa các câu trả lời của người thứ 1 trong khi hàng cuối cùng có chứa các câu trả lời của người thứ 344. Các cột hiển thị các câu trả lời cho 10 câu hỏi khảo sát. Dữ liệu trong chín cột đầu tiên là dành cho các biến liên quan với ba khái niệm nghiên cứu, và cột thứ mười liên quan tới biến đơn đối với CUSA. Tập dữ liệu có chứa thêm các biến liên quan như LIKE, COMP. PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 37
Phụ lục 2.9
Ma trận dữ liệu biến quan sát
Trƣờng
Tên biến com_1
com_2
com_3
like_1
like_2
like_3
cusl_1
cusl_2
cusl_3
cusa
…
1
6
7
6
6
6
6
7
7
7
7
…
2
4
5
6
5
5
5
7
7
5
6
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
344
6
5
6
6
7
5
7
7
7
7
7…
hợp
Nếu bạn đang sử dụng một tập hợp dữ liệu, trong đó một người trả lời không trả lời một câu hỏi cụ thể, bạn cần phải chèn một số khác để thay thế giá trị bị khuyết. Các nhà nghiên cứu thƣờng sử dụng giá trị -99 để biểu thị giá trị khuyết, nhưng bạn có thể sử dụng bất kỳ giá trị khác mà không thường tìm thấy trong tập dữ liệu. Sau đây, chúng tôi cũng sẽ sử dụng -99 để chỉ giá trị khuyết. Ví dụ như điểm dữ liệu đầu tiên của comp _1 là một giá trị khuyết, giá trị -99 sẽ được chèn vào khoảng trống thay vì giá trị 6 mà bạn nhìn thấy trong Phụ lục 2.9. Thủ tục xử lý giá trị khuyết (vd: thay thế trung bình) có thể được áp dụng cho các dữ liệu này (Hair và cộng sự, 2010). Một lần nữa, nếu số lượng các giá trị khuyết tương đối nhỏ (tức là ít hơn 5% trên biến quan sát), chúng tôi khuyến nghị nên thay thế bằng giá trị trung bình thay vì xóa các giá trị khuyết khi chạy PLS-SEM. Hơn nữa, chúng ta cần phải xác định rằng số lượng các giá trị khuyết trên mỗi quan sát không vượt quá 15%. Nếu trường hợp này xảy ra, quan sát tương ứng phải bị loại bỏ khỏi tập dữ liệu. Các dữ liệu ví dụ trong Phụ lục 2.9 (và ví dụ trong sách) có rất ít giá trị khuyết. Chính xác hơn, cusa có một giá trị khuyết (0.29%), cusl_1 và cusl_3 có ba giá trị khuyết (0.87%), và cusl_2 có bốn giá trị khuyết (1.16%). Do đó, thay thế giá trị trung bình có thể được sử dụng. Hơn nữa, không một quan sát nào có hơn 15% giá trị khuyết, vì vậy chúng ta có thể tiến hành phân tích tất cả 344 người trả lời. Để chạy chẩn đoán giá trị ngoại lai, chúng ta chạy một chuỗi biểu đồ hộp sử dụng trong thống kê IBM SPSS. Kết quả chỉ ra một số quan sát có ảnh hưởng nhưng không có giá trị ngoại lai. Hơn nữa, sự không chuẩn của dữ liệu về phân phối lệch và phân phối nhọn không phải là một vấn đề. Giá trị phân phối nhọn và phân phối lệch nằm trong phạm vi chấp
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 38
nhận -1 và +1. Ngoại lệ duy nhất là biến quan sát cusl_2, có một độ lệch bằng -1.3 và do đó thể hiện mức độ không chuẩn nhẹ. Tuy nhiên, mức độ lệch là không nghiêm trọng và vì cusl_2 là một trong ba biến đo lường (kết quả) khái niệm CUSL, độ lệch này so với chuẩn không là vấn đề và biến quan sát được giữ lại. 2.3 TẠO MÔ HÌNH ĐƢỜNG DẪN BẰNG CÁCH SỬ DỤNG PHẦN MỀM SMARTPLS Phần mềm SmartPLS 3 được sử dụng để thực hiện tất cả các phân tích PLS-SEM trong cuốn sách này. Việc thảo luận đề cập tới giới thiệu tổng quan và các chức năng của phần mềm. Phiên bản sinh viên tải miễn phí tại địa chỉ http://www.smartpls.com. Phiên bản này có đầy đủ các chức năng như phiên bản đầy đủ nhưng hạn chế tập dữ liệu với tối đa 100 quan sát. Tuy nhiên, tập dữ liệu trong cuốn sách này có hơn 100 quan sát (chính xác là 344), bạn nên dùng phiên bản chuyên nghiệp SmartPLS, miễn phí 30 ngày dùng thử tại địa chỉ http://www.smartpls.com. Sau thời hạn dùng thử, phí đăng ký sẽ được áp dụng. Phí đăng ký có thời hạn khác nhau (ví dụ 1 tháng hoặc 2 năm) và có thể đặt hàng tại website SmartPLS. Website SmartPLS có chỗ tải phần mềm, gồm cả phần mềm cũ SmartPLS 2 và nhiều phần bổ sung ví dụ như phần giải thích ngắn gọn về PLS-SEM và các chủ đề liên quan đến phần mềm, tài liệu tham khảo, câu trả lời cho những câu hỏi thường gặp, video hướng dẫn sử dụng phần mềm, diễn đàn SmartPLS, cho phép bạn thảo luận các chủ đề với những người khác. SmartPLS có giao diện đồ họa cho phép người dùng ước lượng mô hình đường dẫn PLS. Phụ lục 2.12 cho thấy giao diện đồ họa phần mềm SmartPLS 3, với mô hình đơn giản được đưa ra. Trong phần dưới đây, chúng tôi mô tả cách thiết lập mô hình này để sử dụng phần mềm SmartPLS 3. Trước khi đưa ra mô hình, bạn cần phải có dữ liệu làm cơ sở cho việc chạy mô hình. Dữ liệu sẽ được sử dụng với mô hình danh tiếng có thể được tải về dưới dạng (.csv) hoặc (.txt) theo URL sau đây: http://www.pls-sem.com. SmartPLS có thể sử dụng cả hai định dạng file dữ liệu (.csv hoặc .txt). Thực hiện theo các hướng dẫn trên màn hình để lưu một trong hai tập tin trên ổ cứng của bạn. Nhấp vào Save Target As • • • để lưu dữ liệu vào một thư mục trên ổ cứng của bạn và sau đó bấm Close. Bây giờ chạy phần mềm SmartPLS bằng cách Click vào biểu tượng sau khi cài đặt để chạy SmartPLS và sau đó vào thanh Run để khởi động phần mềm.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 39
Để tạo một công trình nghiên cứu mới, bấm vào File → Create New Project. Trước tiên, nhập tên file vào hộp Name (ví dụ: danh tiếng công ty). Sau khi bấm OK, một công trình mới được tạo ra và xuất hiện trong cửa sổ Project Explorer, ở phía trên bên trái, dưới thanh menu. Tất cả các công trình đã tạo trước đó cũng xuất hiện trong cửa sổ này. Tiếp theo, bạn cần phải chỉ định một tập dữ liệu, trong trường hợp của chúng ta, thì nó là corporate reputation data.csv (hoặc bất cứ tên gì bạn đã tải về). Để làm điều đó, bấm vào nút Doubleclick to import data! ở phía dưới tên công trình vừa tạo, tìm và bấm chọn dữ liệu, rồi nhấn Open. Điều quan trọng là cần lưu ý rằng nếu bạn sử dụng dữ liệu của riêng bạn đặt cho một công trình nghiên cứu sử dụng phần mềm SmartPLS, dữ liệu không được liên quan đến yếu tố chuỗi (ví dụ, ý kiến người trả lời cho những câu hỏi mở). Ví dụ, SmartPLS sẽ hiểu dấu chấm (.) như là yếu tố chuỗi. Trong ví dụ của chúng ta, tập dữ liệu không bao gồm bất kỳ yếu tố chuỗi nào, vì vậy đây không phải là vấn đề. Ở màn hình tiếp theo, bạn có thể điều chỉnh tên của tập dữ liệu. Trong ví dụ này, chúng ta sử dụng tên chính gốc (tức là, Corporate reputation data) và tiến hành bấm OK. SmartPLS sẽ mở thanh tab mới (Phụ lục 2.10), cung cấp thông tin về dữ liệu và định dạng của nó (data view). Phía dưới màn hình xuất hiện một danh sách tất cả các biến và các thông số cơ bản (trung bình, giá trị nhỏ nhất-lớn nhất cũng như số lượng giá trị khuyết). Phía trên bên phải bạn có thể thấy Sample Size cũng như số lượng biến quan sát và giá trị khuyết. Bởi vì chúng ta chưa chỉ rõ cụ thể giá trị khuyết, SmartPLS nhận định rằng không có giá trị khuyết trong tập dữ liệu. Tại phía bên trái màn hình, bạn có thể nhận thấy Delimiter để xác định sự phân cách dấu ở giá trị dữ liệu (dấu phẩy, dấu chấm phẩy, đánh cột hàng dọc, dấu cách /khoảng trống), còn Value Quote Character (không có gì hết, dấu nháy đơn („), dấu nháy kép (“)) trong trường hợp trích giá trị (ví dụ “7”), và Number Format (người Mỹ dùng dấu chấm để tách thập phân hoặc người Châu Âu thì dùng dấu phẩy). Rõ hơn, bạn có thể xác định việc mã hóa giá trị khuyết. Bấm vào None bên cạnh Missing Values.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 40
Phụ lục 2.10 Bảng xuất dữ liệu trên SmartPLS
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 41
Trong cửa sổ sau đó, bạn cần xác định giá trị khuyết. Gõ -99 vào khung trống và bấm OK. SmartPLS cập nhật thống kê mô tả của biến quan sát chứa giá trị khuyết và chỉ ra số lượng giá trị khuyết bên cạnh Total Missing Values. Lưu ý rằng, không như các chương trình thống kê khác chẳng hạn như IBM SPSS Statistics, bạn chỉ có thể qui định một giá trị cho tất cả các giá trị khuyết trong SmartPLS. Vì thế, bạn phải chắc chắn rằng tất cả các giá trị khuyết có cùng mã hóa (ví dụ -99) trong tập dữ liệu gốc. Đó là, bạn cần phải mã hóa tất cả các giá trị khuyết một cách thống nhất, bất kể dạng của chúng (giá trị khuyết do người dùng định nghĩa hoặc giá trị khuyết hệ thống) và lý do bị khuyết (ví dụ người được hỏi từ chối trả lời, người được hỏi không biết câu trả lời; không thể áp dụng được). Bảng bổ sung trong data view hiển thị Indicator Correlations và Raw File với dữ liệu đã đưa vào. Lúc này, bạn cần đóng cửa sổ data view. Lưu ý rằng bạn luôn có thể mở lại data view bằng cách nhấp đúp chuột vào tập dữ liệu (tức là Corporate reputation data) tại mục Project Explorer. Mỗi công trình nghiên cứu có thể có một hoặc nhiều mô hình đường dẫn Path (các tập tin .csv hoặc .txt). Khi thiết lập một công trình nghiên cứu mới, SmartPLS sẽ tự động thêm một mô hình với tên giống như công trình nghiên cứu (tức là Corporate Reputation). Bạn cũng có thể đổi tên các mô hình bằng cách kích chuột phải vào nó. Trong menu mở ra, nhấp vào Rename và gõ vào tên mới cho mô hình. Để phân biệt mô hình giới thiệu của chúng ta với những cái khác về sau, hãy đổi tên nó ở Simple Model và nhấp vào OK. Tiếp theo, nhấp đúp vào Simple Model tại cửa sổ Project Explorer và SmartPLS sẽ mở ra cửa sổ mô hình đồ họa ở bên phải, tại đây bạn có thể tạo một mô hình đường dẫn. Chúng ta bắt đầu với một công trình nghiên cứu mới (trái ngược với một công trình đã lưu), vì vậy cửa sổ mô hình là trống và bạn có thể bắt đầu tạo ra mô hình đường dẫn như thể hiện trong Phụ lục 2.11. Bằng cách nhấp vào Latent Variable trên thanh công cụ (
),
bạn có thể thay thế một khái niệm nghiên cứu mới vào trong cửa sổ mô hình. Khi bạn nhấp trái vào cửa sổ mô hình, một khái niệm nghiên cứu mới được thể hiện bằng vòng tròn đỏ sẽ xuất hiện. Để thêm nhiều khái niệm nghiên cứu, nhấn nút SHIFT và nhấp trái vào biểu tượng trên menu. Số “1” trong biểu tượng thay đổi thành “N” để biểu thị chế độ đã thay đổi. Cách khác, vào menu Edit và bấm vào Add Latent Variable(s). Lúc này, một khái niệm nghiên cứu sẽ xuất hiện mỗi khi bạn nhấp trái vào cửa sổ mô hình. Để thoát chế độ này, bấm vào Select trên thanh menu (
).
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 42
Phụ lục 2.11 Thiết lập mô hình
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 43
Một khi bạn đã tạo xong tất cả các khái niệm nghiên cứu, bạn có thể nhấp trái vào bất kỳ khái niệm nghiên cứu nào để lựa chọn, thay đổi kích cỡ, hoặc di chuyển nó trong cửa sổ mô hình. Để kết nối các biến tiềm ẩn với nhau (tức là vẽ mũi tên đường dẫn), nhấp trái vào Connect trên menu (
). Tiếp theo, nhấp trái vào biến ngoại sinh (độc lập) và di chuyển chuột
qua biến nội sinh (phụ thuộc) mục tiêu. Lúc này, nhấp trái vào biến nội sinh, một mối quan hệ đường dẫn (mũi tên chỉ hướng) sẽ được chèn vào giữa 2 biến (nội sinh và ngoại sinh). Lặp lại thao tác tương tự và kết nối toàn bộ các biến dựa theo cơ sở lý thuyết của bạn. Tương tự việc chèn các biến tiềm ẩn, bạn có thể thêm nhiều đường dẫn bằng cách nhấn SHIFT và bấm vào biểu tượng trên menu. Số “1” trong biểu tượng thay đổi thành “N” để biểu thị chế độ đã thay đổi. Cách khác, vào menu Edit và bấm vào Add Connection(s). Khi bạn hoàn tất, nó sẽ trông như Phụ lục 2.11. Bước tiếp theo là đặt tên các khái niệm nghiên cứu (biến nghiên cứu). Để làm như vậy, nhấp phải vào biến nghiên cứu để mở một menu với nhiều tùy chọn khác nhau và nhấp trái vào Rename. Gõ tên biến vào hộp Rename (tức là COMP) và sau đó bấm OK. Tên COMP sẽ xuất hiện bên dưới biến. Thực hiện theo các bước như trên để đặt tên cho tất cả các biến. Tiếp theo, bạn cần phải gán biến quan sát cho mỗi biến nghiên cứu. Ở phía bên trái của màn hình, có một cửa sổ Indicators cho thấy tất cả các biến quan sát có trong dữ liệu của bạn. Bắt đầu với biến nghiên cứu COMP bằng cách kéo biến quan sát đầu tiên comp_1 từ cửa sổ Indicators và thả nó vào biến nghiên cứu (nhấp chuột trái và giữ, sau đó di chuyển nó đến biến nghiên cứu, sau đó buông tay ra). Sau khi gán biến quan quan sát cho một biến nhiên cứu, nó xuất hiện trong cửa sổ mô hình với một hình chữ nhật màu vàng gắn liền với biến nghiên cứu (kết quả). Việc gán một biến quan sát vào một biến nghiên cứu cũng sẽ làm thay đổi màu của biến nghiên cứu từ đỏ sang xanh. Bạn có thể di chuyển biến quan sát xung quanh, nhưng nó sẽ vẫn gắn liền với biến nghiên cứu (trừ khi bạn xóa nó). Bằng cách kích chuột phải vào biến nghiên cứu và lựa chọn một trong các tùy chọn Align (ví dụ: Indicators Top), bạn có thể sắp xếp biến quan sát. Bạn cũng có thể ẩn biến quan sát bằng cách chọn tùy chọn tương ứng ở menu khi bạn nhấp phải vào nó. Bạn cũng có thể truy cập vào tùy chọn căn chỉnh biến quan sát thông qua Modeling toolbox ở phía phải của cửa sổ mô hình.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 44
Phụ lục 2.12 Mô hình đơn giản với đặt tên và gán dữ liệu
Bằng cách nhấp vào giữa nút, bạn có thể ẩn biến quan sát của biến nghiên cứu đã chọn; nhấp vào các hộp bên cạnh biến nghiên cứu, bạn có thể căn chỉnh các biến quan sát tương ứng. Tiếp tục cho đến khi bạn gán hết tất cả biến quan sát cho các biến nghiên cứu như Phụ lục 2.12. Hãy đảm bảo lưu mô hình bằng cách vào File →Save. Nhấp chuột phải trong khi nó được đặt vào một biến nghiên cứu trong cửa sổ mô hình mở ra một menu với nhiều tùy chọn. Ngoài việc đặt lại tên cho biến nghiên cứu, bạn có thể chuyển đổi mô hình đo lường từ kết quả sang nguyên nhân và ngược lại (Switch between formative/reflective), và truy cập nhiều tùy chọn cao hơn như là thêm tương tác và kết quả bậc hai hoặc lựa chọn một sơ đồ trọng số khác trên biến nghiên cứu như là điểm tổng. Để thêm ghi chú vào cửa sổ mô hình, nhấp trái vào nút Comment (
) trên tranh menu.
Nhấp chuột phải trong khi con trỏ được đặt trên đầu của các phần tử khác cũng mở ra một menu với các chức năng bổ sung. Ví dụ rõ hơn, nếu bạn đặt con trỏ vào cửa sổ Projects Explorer và nhấp phải vào tên công trình nghiên cứu, bạn có thể tạo ra một mô hình mới (Create New Path Model), tạo một công trình nghiên cứu mới (Create New Project), hoặc đưa vào tập dữ liệu mới (Import Data File). Hơn nữa, bạn có thể chọn Copy, Paste, và Delete PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 45
đối với các công trình nghiên cứu và các mô hình xuất hiện trong cửa sổ Project Explorer. Ví dụ, tùy chọn Copy hữu ích khi bạn muốn chỉnh sửa mô hình đường dẫn PLS nhưng muốn giữ thiết lập mô hình ban đầu của bạn. Hãy lưu mô hình trước khi sử dụng tùy chọn Copy. Tùy chọn Import Data File cho phép bạn thêm nhiều tập dữ liệu vào công trình hiện tại (ví dụ, dữ liệu từ các năm khác nhau nếu có sẵn). Bạn cũng có thể xuất ra công trình nghiên cứu bằng cách chọn Export Project. Sử dụng tùy chọn này, SmartPLS sẽ xuất ra toàn bộ công trình nghiên cứu, bao gồm tất cả mô hình và tập dữ liệu trong tập tin .zip. Bạn cũng có thể sử dụng trực tiếp tập dữ liệu có sẵn “ready-to-use” bằng cách vào File → Import Project from Backup File. Bạn cũng có thể dùng tùy chọn này để nhập công trình nghiên cứu liên quan đến ví dụ về danh tiếng công ty. Tập tin này tên là Corporate Reputation.zip. Nghiên cứu này đã sẵn sàng để tải về máy tính của bạn tại địa chỉ: http://www.pls-sem.com. Tải tập tin này và lưu nó vào hệ thống máy tính của bạn. Sau đó, vào File → Import Project from Backup File. SmartPLS cho phép bạn duyệt qua máy tính và chọn công trình đã tải Corporate Reputation.zip để nhập vào phần mềm. Sau khi nhập thành công, nhấp đúp chuột vào mô hình, và mô hình đường dẫn sẽ xuất hiện trong một cửa sổ mô hình mới như trong Phụ lục 2.12.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 46
CHƢƠNG 3 ĐÁNH GIÁ MÔ HÌNH ĐO LƢỜNG KẾT QUẢ
Việc đánh giá mô hình đo lường đo lường kết quả bao hàm độ tin cậy tổng hợp để đánh giá tính nhất quán nội tại, độ tin cậy riêng của từng thang đo/ biến, phương sai trích trung bình (average variance extracted – AVE) nhằm đánh giá giá trị hội tụ. Bên cạnh đó, tiêu chí FornellLarcker và hệ số tải chéo (cross loading) được dùng để đánh giá giá trị phân biệt (discriminant validity). Trong các phần sau, chúng ta sẽ thảo luận về mỗi tiêu chí đánh giá mô hình đo lường kết quả. Phụ lục 3.1 Quy tắc kinh nghiệm đánh giá kết quả PLS-SEM Không sử dụng tiêu chuẩn mức độ phù hợp để đánh giá ước lượng PLS-SEM. Thay vào đó, sử dụng tiêu chí đánh giá phi tham số thông qua kỹ thuật bootstrapping và blindfolding. Bắt đầu quá trình đánh giá bằng việc kiểm tra chất lượng của mô hình đo lường kết quả và phản ánh nguyên nhân (Quy tắc kinh nghiệm tiếp theo trong chương này áp dụng cho mô hình đo lường kết quả, và trong Chương 4 sẽ áp dụng cho mô hình đo lường nguyên nhân).
Nếu các đặc điểm đo lường của khái niệm nghiên cứu được chấp nhận, chúng ta sẽ tiếp tục việc đánh giá kết quả của mô hình cấu trúc. Việc ước lượng đường dẫn (Path estimate) phải có ý nghĩa thống kê và có ý nghĩa. Thêm vào đó, khái niệm nghiên cứu nội sinh (endogenous constructs) trong mô hình cấu trúc (structural model) phải có mức độ giải thích biến thiên cao (high levels of explained variance -R2) (Xem thêm chương 5).
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 47
3.1 Độ tin cậy nhất quán nội tại Tiêu chí đầu tiên được đánh giá là độ tin cậy nhất quán nội tại (Internal Consistency Reliability). Chỉ số Cronbach‟s alpha được sử dụng để đánh giá độ tin cậy bên trong dựa vào sự tự tương quan giữa các biến quan sát. Cronbach‟s alpha giả định tất cả các biến quan sát đều có độ tin cậy như nhau (cùng hệ số tải ngoài). Độ tin cậy của thang đo được đánh giá bằng phương pháp nhất quán nội tại qua hệ số Cronbach‟s Alpha. Hệ số này được tính theo công thức: (
Trong công thức trên,
)(
∑
)
là phương sai của biến quan sát i của một khái niệm nghiên
cứu được đo lường với số lượng M biến quan sát (
, và
là phương sai tổng các
các biến quan sát M của khái niệm được đo lường. Hệ số tin cậy Cronbach‟s Alpha chỉ cho biết các đo lường có liên kết với nhau hay không; nhưng không cho biết biến quan sát nào cần bỏ đi và biến quan sát nào cần giữ lại. Khi đó, việc tính toán hệ số tương quan biến-tổng sẽ giúp loại ra những biến quan sát nào không đóng góp nhiều cho sự mô tả của khái niệm cần đo. Nhưng PLS-SEM sẽ ưu tiên các biến dựa vào độ tin cậy riêng của chúng (individual reliability). Hơn nữa, hệ số Cronbach's alpha tương đối nhạy cảm với số lượng biến quan sát trong từng thang đo và có khuynh hướng đánh giá không đúng độ tin cậy nhất quán nội tại. Do một vài hạn chế của hệ số Cronbach alpha's đối với tổng thể, chúng ta quan tâm tới cách đo lường khác thích hợp hơn, gọi là hệ số tin cậy tổng hợp (composite reliability) ρc. Hệ số này được tính dựa vào những hệ số tải ngoài khác nhau giữa các biến tiềm ẩn và được tính toán theo công thức: (∑ (∑
∑
(
Trong đó li: hệ số tải ngoài chuẩn hóa của biến quan sát i của một khái niệm nghiên cứu cụ thể; ei: sai số đo lường của biến quan sát i; và var(ei): phương sai của sai số đo lường, được tính: var (ei) = 1 – l2i PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 48
Giá trị độ tin cậy tổng hợp này sẽ nằm trong khoảng từ 0†1, với giá trị càng cao, gần với 1 cho thấy mức độ tin cậy càng cao. Nó được hiểu giống như Cronbach‟s alpha. Đặc biệt, với nghiên cứu khám phá (exploratory research), giá trị độ tin cậy từ 0.6†0.7 được chấp nhận, tuy nhiên trong khi với nhiều nghiên cứu khác, giá trị này đòi hỏi phải nằm trong khoảng từ 0.7†0.9 để được chấp nhận (Nunally và Bernstein, 1994). Nếu giá trị này vượt 0.9 (lớn hơn 0.95) được xem như có vấn đề vì khi đó tất cả các biến quan sát (đo lường) đang cùng đo lường 1 hiện tượng và việc này trở nên không phù hợp trong quá trình đo lường khái niệm nghiên cứu (construct). Đặc biệt, điều này sẽ xảy ra trong trường hợp bảng câu hỏi sử dụng câu hỏi dư về ngữ nghĩa trong quá trình đảo vị trí từ ngữ trong câu hỏi nhưng không thay đổi ý nghĩa. Do đó, sẽ mang lại kết quả ngược đối với đánh giá độ chính xác về giá trị nội dung của thang đo (content validity) và có thể làm tăng sai số tương quan, nhiều nhà nghiên cứu đã lưu ý điều này trong thực tế triển khai đánh giá độ tin cậy. Cuối cùng, nếu độ tin cậy tổng hợp có giá trị nhỏ hơn 0.6, điều này cho thấy rằng thiếu độ tin cậy nhất quán nội tại và cần xem xét lại. 3.2 Giá trị hội tụ Giá trị hội tụ (Convergent validity) chính là việc một đo lường có tương quan thuận với các đo lường khác trong cùng một khái niệm đo lường. Sử dụng cùng một mô hình mẫu, biến quan sát của khái niệm đo lường kết quả (reflective construct) sẽ được đo lường bởi nhiều cách tiếp cận, vì thế các câu hỏi về cùng một khái niệm sẽ chia sẻ với nhau tỷ lệ phương sai cao. Để đánh giá giá trị hội tụ, nhà nghiên cứu sẽ xem xét hệ số tải ngoài của các biến quan sát, cũng như giá trị phương sai trích trung bình (average variance extracted - AVE). Nếu hệ số tải ngoài đối với khái niệm càng cao, điều đó có nghĩa là biến kết quả sẽ cùng đo lường chung khái niệm, được gọi chung là độ tin cậy biến quan sát (indicator reliability). Tối thiểu, hệ số tải ngoài của các biến số phải có ý nghĩa thống kê. Quy luật chung là hệ số tải ngoài (chuẩn hóa) phải từ 0.708 trở lên bởi hệ số chuẩn hóa có liên quan tới phương sai. Do đó, bình phương của hệ số tải ngoài chuẩn hóa chỉ ra sự khác biệt trong một biến đo lường (item), được giải thích bởi khái niệm nghiên cứu và phương sai trích từ biến đo lường/biến quan sát. Nguyên tắc chung là biến tiềm ẩn phải được giải thích bởi tối thiểu 50% ý nghĩa của phương sai biến quan sát (indicator’s variance). Điều này cũng hàm ý rằng, phương sai sẽ được chia sẻ PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 49
giữa khái niệm nghiên cứu (construct) và các biến quan sát luôn lớn hơn phương sai của sai số đo lường (measurement error variance). Điều này có nghĩa là, hệ số tải ngoài của từng biến quan sát cao hơn 0.708, và bình phương của số này chính là 0.5. Trong hầu hết mọi trường hợp, 0.70 được xem như gần với 0.708 nên được chấp nhận để sử dụng tính toán. Các nhà nghiên cứu thường sử dụng các hệ số tải ngoài thấp hơn (< 0.7) trong các nghiên cứu về khoa học xã hội, đặc biệt với các thang đo mới hình thành (Hulland, 1999). Nhà nghiên cứu thường cân nhắc rất kỹ ảnh hưởng của các biến bị loại bỏ (effects of item removal) lên độ tin cậy tổng hợp cũng như tính chính xác về giá trị nội dung của khái niệm nghiên cứu (construct's content validity) để ra quyết định có nên bỏ hay giữ lại biến trong trường hợp hệ số tải ngoài nhỏ hơn 0.7. Thông thường, khi thấy hệ số tải ngoài sẽ nằm trong khoảng giữa 0.4 0.7, chúng ta sẽ loại biến khỏi thang đo nếu việc loại bỏ biến này sẽ làm tăng giá trị của độ tin cậy tổng hợp hay giá trị của phương sai trích trung bình AVE nằm trên ngưỡng giá trị đề nghị (suggested threshold value). Ngoài ra, việc loại bỏ biến khỏi thang đo cũng có cách tiếp cận khác khi xem xét ảnh hưởng của việc loại biến tác động tới giá trị nội dung. Những biến quan sát nào có hệ số tải yếu hơn đôi khi được giữ lại do có đóng góp về giá trị nội dung. Những biến có hệ số tải thấp (nhỏ hơn 0.4), thường bị loại khỏi thang đo. Phụ lục 3.2 sẽ minh họa khi nào nên loại bỏ biến trong thang đo dựa vào hệ số tải ngoài.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 50
Phụ lục 3.2 Đánh giá trọng số ngoài
Đánh giá trọng số ngoài
Hệ số tải ngoài < 0.40
Hệ số tải ngoài ≥ 0.40 nhưng < 0.7
Hệ số tải ngoài ≥ 0.70
Xóa biến nhưng cân nhắc sự ảnh hưởng đến giá trị nội dung
Phân tích sự tác động của việc xóa biến lên độ tin cậy nhất quán nội tại
Giữ biến
Việc xóa bớt làm tăng hệ số đo lường trên ngưỡng
Có thể xóa biến nhưng cân nhắc sự ảnh hưởng giá trị nội dung
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Việc xóa bớt không làm tăng hệ số đo lường trên ngưỡng
Giữ biến
Page 51
Một cách đo lường chung đối với giá trị hội tụ lên khái niệm là việc tính giá trị của phương sai trích AVE. Chỉ số này được định nghĩa là tổng giá trị trung bình của bình phương hệ số tải nhân tố của các biến quan sát liên quan đến khái niệm nghiên cứu (tức là, tổng bình phương hệ số tải chia cho số lượng biến quan sát). Vì thế, AVE luôn bằng với phần chung (communality) của khái niệm nghiên cứu. Giá trị AVE được tính theo công thức: (
∑
)
Giá trị AVE từ 0.5 hoặc cao hơn cho thấy, khái niệm nghiên cứu sẽ giải thích nhiều hơn phân nửa phương sai các biến quan sát của nó. Ngược lại, nếu giá trị của AVE nhỏ hơn 0.50, điều này có nghĩa là, trung bình, có nhiều sai số vẫn còn tồn tại trong các biến quan sát hơn là phương sai được giải thích bởi khái niệm nghiên cứu. Hệ số AVE của mỗi khái niệm đo lường kết quả cần phải được đánh giá. Trong ví dụ ở Chương 2, AVE chỉ cần cho các khái niệm về COM, CUSL và LIKE. Đối với khái niệm đơn biến CUSA, AVE không phù hợp để đo lường CUSA bởi hệ số tải lúc này luôn cố định là 1. 3.3 Giá trị phân biệt Giá trị phân biệt (Discriminant validity) chính là việc xem xét một khái niệm có thực sự khác với so với các khái niệm nghiên cứu khác bởi những tiêu chuẩn thực nghiệm. Vì vậy, việc tính toán giá trị phân biệt nhằm chỉ ra rằng một khái niệm nghiên cứu là duy nhất và phản ánh hiện tượng khác biệt so với các khái niệm nghiên cứu khác trong mô hình. Theo truyền thống, các nhà nghiên cứu có hai cách tiếp cận trong việc đo lường giá trị phân biệt được đề nghị. Cách thứ nhất, đánh giá giá trị phân biệt thông qua xem xét hệ số tải chéo (cross loading) của các biến quan sát. Đặc biệt, hệ số tải nhân tố của biến đo lường cần phải lớn hơn tất cả các hệ số tải chéo của các khái niệm nghiên cứu khác. Cách tốt nhất để đánh giá là nhìn vào bảng chéo minh họa hệ số tải với hàng và cột của biến quan sát. Phụ lục 3.3 minh họa phân tích này với một ví dụ có 3 biến tiềm ẩn (Y1, Y2, và Y3), mỗi biến được đo lường bởi 2 quan sát. Có thể thấy, hệ số tải luôn lớn hơn hệ số tải chéo. Ví dụ, x11 cao hơn hệ số tải chéo lên khái niệm Y1 của nó (0.75) nhưng thấp hơn nhiều khi tải lên Y2 (0.49) và Y3 (0.41). PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 52
Trong ví dụ này, phân tích hệ số tải chéo minh họa giá trị phân biệt được thiết lập. Ngược lại, nếu hệ số tải chéo lớn hơn hệ số tải bên ngoài thì giá trị phân biệt gặp vấn đề. Cách thứ hai dựa vào các tiêu chí của Fornell-Larcker. Với sự so sánh căn bậc hai của giá trị AVE với tương quan của biến tiềm ẩn (latent variable). Đặc biệt, căn bậc hai của giá trị phương sai trích trung bình của từng khái niệm phải lớn hơn giá trị tương quan cao nhất của nó với bất kỳ khái niệm nghiên cứu khác (Lưu ý: Điều kiện này nên được hiểu là AVE lớn hơn bình phương của tương quan với bất kỳ khái niệm nghiên cứu nào khác). Lập luận này dựa trên ý tưởng mỗi khái niệm sẽ chia sẻ phương sai với biến quan sát đo lường nó nhiều hơn là với các khái niệm khác. Phụ lục 3.3 Phân tích hệ số tải chéo Y1
Y2
Y3
x11
0.75
0.49
0.41
x12
0.83
0.27
0.35
x21
0.55
0.82
0.60
x22
0.45
0.82
0.42
x31
0.43
0.53
0.87
x32
0.42
0.55
0.84
Phụ lục 3.4 mô tả khái niệm này. Trong ví dụ vừa nêu, giá trị AVE của khái niệm nghiên cứu Y1 và Y2 là 0.55 và 0.65. Giá trị AVE được tính toán bởi bình phương của mỗi hệ số tải nhân tố, tiếp đến là tổng bình phương của 3 hệ số tải, và sau đó là tính giá trị trung bình. Ví dụ, với khái niệm Y1 là 0.6; 0.7 và 0.9, bình phương sẽ cho ra 0.36; 0.49 và 0.81. Sau đó, cộng lại 3 con số này (0.36+0.49+0.81) sẽ ra 1.66, và giá trị trung bình sẽ là 1.66/3 = 0.55. Tương quan giữa khái niệm Y1 và Y2 (được biểu diễn bởi mũi tên 2 đầu nối giữa 2 khái niệm) là 0.8. Bình phương hệ số tương quan này (0.8) sẽ là 64% (64% sự biến thiên của khái niệm này sẽ được giải thích bởi các khái niệm khác). Vì vậy, Y1 giải thích rằng ít có khác biệt về phương sai trong biến đo lường x1, x2 và x3 hơn so với Y2, và điều này cho thấy hai khái niệm (Y1 và Y2), khác nhau về mặt nội dung khái niệm, nhưng không khác nhau theo tiêu chuẩn thực nghiệm. Vì vậy, giá trị phân biệt không được tạo ra. Phụ lục 3.5 sẽ nêu phân tích và trình bày tiêu chí của Fornell – Larcker-với mô hình PLS với 2 biến kết quả (ví dụ Y1 và Y2), một biến nguyên nhân PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 53
(Y3) và 1 biến đơn biến (Y4) (single item construct). Đầu tiên chúng ta sẽ chỉ xem xét biến kết quả dựa vào tiêu chí của Fornell-Larcker. Vì vậy, chúng ta sẽ loại biến Y3 và Y4 trong việc đánh giá vì giá trị AVE không là tiêu chí phù hợp cho đo lường nguyên nhân và đơn biến (formative and single-item measures). Phụ lục 3.4
Hình mô phỏng tiêu chí Fornell-Larcker
Chỉ xem xét biến Y1 và Y2, chú ý rằng căn bậc hai của giá trị AVE cho từng biến luôn nằm trên đường chéo. Những phần tử nằm ngoài đường chéo thể hiện sự tương quan giữa các biến tiềm ẩn. Để tạo ra giá trị phân biệt, căn bậc hai giá trị AVE của mỗi biến (khái niệm) phải lớn hơn tương quan của nó với biến khác. Để đánh giá khái niệm Y2 trong Phụ lục 3.5, chúng ta sẽ so sánh tương quan trên dòng của Y2 và cột của Y2 với căn bậc 2 của AVE (√
của nó.
Chúng ta sẽ tìm thấy ví dụ đo lường mức độ nổi tiếng của doanh nghiệp/uy tín doanh nghiệp (corporate reputation) trong phần sau. Những nghiên cứu gần đây đã chỉ trích sự hiệu quả của hệ số chéo và tiêu chí Fornell – Larcker trong đánh giá giá trị phân biệt. Nó không tiếp cận một cách đáng tin cậy các vấn đề về giá trị phân biệt. Đặc biệt, hệ số chéo không chứng minh được giá trị phân biệt khi hai khái niệm tương quan với nhau hoàn hảo, mà những biểu hiện này không hiệu quả trong nghiên cứu thực nghiệm.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 54
Ví dụ phân tích tiêu chí Fornell – Larcker
Phụ lục 3.5 Y1
Y2
Y3
Y1
AVEY1
Y2
CORRY1Y2
AVEY2
Y3
CORRY1Y3
CORRY2Y3
Mô hình đo lường nguyên nhân
Y4
CORRY1Y4
CORRY2Y4
CORRY3Y4
Y4
Khái niệm đơn biến
Tương tự, tiêu chí Fornell – Larcker thể hiện rất yếu, đặc biệt khi hệ số tải của biến quan sát trong mỗi khái niệm khác biệt nhau ít (vd: tất cả các biến quan sát có hệ số tải thay đổi giữa 0.6 và 0.8). Khi các hệ số tải thay đổi nhiều hơn, tiêu chí Fornell – Larcker thể hiện hiệu quả hơn nhưng nhìn chung vẫn khá tệ. Để khắc phục, các nhà nghiên cứu đề xuất đánh giá qua tỷ lệ đặc điểm dị biệt – đặc điểm đơn nhất (heterotrait – monotrait – HTMT) của các mối tương quan. Nói ngắn gọn, HTMT là tỷ lệ của các mối tương quan giữa các đặc điểm với các mối tương quan bên trong các đặc điểm. HTMT là trung bình của tất cả các mối tương quan của các biến quan sát của từng khái niệm với khái niệm khác (nghĩa là các mối tương quan đặc điểm dị biệt – phương pháp dị biệt/heterotrait – heteromethod correlations) trong sự so sánh với số trung bình của các tương quan bình quân của các biến quan sát đo lường trong một khái niệm (nghĩa là, các mối tương quan đặc điểm dị biệt – đặc điểm đơn nhất; để xem định nghĩa hoàn chỉnh về thống kê của HTMT). Về mặt kỹ thuật, cách tiếp cận HTMT là một sự dự báo về mối tương quan thật sự có thể tồn tại giữa hai khái niệm nếu chúng được đo lường một cách hoàn hảo (nghĩa là nếu nó có thể tin cậy hoàn toàn). Sự tương quan này cũng đề cập đến các mối tương quan mạnh (deattenuated correlation). Một mối tương quan mạnh giữa hai khái niệm (gần đến 1) phản ánh một sự thiếu giá trị phân biệt. Phụ lục 3.6 minh họa cách tiếp cận HTMT. Trung bình đặc điểm dị biệt – đặc điểm đơn nhất (heterotrait – monotrait – HTMT) của các mối tương quan bằng tất cả các cặp tương quan giữa các biến x1, x2, và x3 với x4, x5, và x6 (vùng màu xám trong ma trận cột ở Phụ lục 3.6). Ở ví dụ này, trung bình đặc điểm dị biệt – đặc điểm đơn nhất của các mối tương quan bằng PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 55
0.341. Trung bình mối tương quan đặc điểm đơn nhất (monotrait) – phương pháp dị biệt (heteromethod) bằng trung bình của các cặp tương quan của các biến x1, x2, và x3 trong khái niệm Y1 (nghĩa là 0.712). Tương tự, trung bình mối tương quan đặc điểm đơn nhất (monotrait) – phương pháp dị biệt (heteromethod) bằng trung bình của các cặp tương quan của các biến x4, x5, và x6 (0.409) trong khái niệm Y2. Hệ số HTMT cho mối quan hệ Y1, Y2 sẽ là: HTMT (Y1, Y2) = 0.341 /√
= 0.632
Ngưỡng xác định của HTMT vẫn đang tồn tại trong sự tranh luận, “khi nào thì một sự tương quan gần đến 1?”, các nghiên cứu trước đề nghị ngưỡng giá trị 0.9 nếu các khái niệm trong mô hình đường dẫn khá tương đồng (vd: sự hài lòng mang tính cảm xúc, hài lòng mang tính nhận thức, và lòng trung thành). Nói cách khác, hệ số HTMT lớn hơn 0.9 chứng tỏ hai khái niệm thiếu giá trị phân biệt. Khi hai khái niệm được đánh giá một cách khái quát là có nhiều sự phân biệt, ngƣỡng chấp nhận thấp hơn với giá trị rơi vào khoảng 0.85. Hơn nữa, HTMT hỗ trợ như là một kiểm định giá trị phân biệt dựa trên các phép toán thống kê cơ bản. Tuy nhiên, PLS-SEM không phụ thuộc vào bất kỳ giả định phân phối nào của dữ liệu, các kiểm định thông số ý nghĩa thống kê tiêu chuẩn không được áp dụng dù các thông số này khác 1. Phụ lục 3.6
Mô phỏng cách tiếp cận HTMT x4
x1 x2
Y1
Y2
x5
x3
x6
x1 x2 x3 x4 x5 x6
x1
x2
1 0.770 0.701 0.426 0.423 0.274
1 0.665 0.339 0.345 0.235
x3
1 0.393 0.385 0.250
x4
1 0.574 0.318
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
x5
1 0.335
x6
1
Page 56
Thay vào đó, nhà nghiên cứu phụ thuộc vào quy trình tái lập và phóng đại số mẫu (bootstrapping). Trong bootstrapping, các phân mẫu (subsamples) sẽ được tạo lập ngẫu nhiên (với sự thay thế) từ dữ liệu gốc. Mỗi một phân mẫu sẽ được dùng để ước lượng mô hình. Quy trình này được lặp lại cho đến khi một số lượng phân mẫu lớn được tạo ra, thường vào khoảng 5000 mẫu. Các tham số ước lượng sẽ dựa trên phân mẫu tái lập (thông số HTMT) được rút ra từ sai số chuẩn của ước lượng. Với thông tin này, nó có thể cho biết khoảng tin cậy của ước lượng bootstrap. Khoảng tin cậy là khoảng mà giá trị thật tổng thể HTMT rơi vào, giả định khoảng tin cậy ở đây là 95%. Khoảng tin cậy chứa giá trị 1 chỉ ra rằng thiếu giá trị phân biệt. Ngược lại, nếu giá trị 1 nằm ngoài khoảng tin cậy, có thể kết luận hai khái niệm phân biệt nhau về mặt dữ liệu thống kê. Kể từ khi đánh giá HTMT dựa trên khoảng tin cậy, nên tuân thủ tiêu chí này đầu tiên, đặc biệt bởi vì sự hạn chế của giá trị chéo và tiêu chí Fornell – Larcker. Tuy nhiên, hai tiêu chí này cũng còn được dùng để đánh giá giá trị phân biệt. Nhà nghiên cứu nên làm gì nếu giá trị phân biệt không đƣợc biểu hiện? Có nhiều cách khác nhau để kiểm soát các vấn đề liên quan giá trị phân biệt ở Phụ lục 3.7. Hướng tiếp cận cơ bản duy trì các khái niệm nghiên cứu mà các khái niệm này gây ra các vấn đề về giá trị phân biệt trong mô hình với mục đích chính là tăng hay giảm giá trị trung bình đặc điểm dị biệt – đặc điểm đơn nhất của các mối tương quan. Để làm giảm giá trị HTMT, phải tăng giá trị trung bình tương quan của đặc điểm đơn nhất – phương pháp dị biệt. Có thể loại bớt các biến có tƣơng quan thấp với các biến khác trong cùng khái niệm. Tương tự, các khái niệm đa hướng không đồng nhất (heterogeneous) cũng làm giảm giá trị trung bình tương quan của đặc điểm đơn nhất – phương pháp dị biệt. Trong trường hợp này, khái niệm (vd: chất lượng) có thể phân chia thành hai khái niệm con (vd: chất lượng sản phẩm và chất lượng dịch vụ), có lẽ nên sử dụng khái niệm bậc cao (higher – order constructs) nếu lý thuyết đo lường hỗ trợ cho việc sử dụng này. Những khái niệm đa hướng này sẽ thay thế cho cho khái niệm tổng quát trong mô hình. Tuy nhiên, khi tiếp cận phương pháp này, giá trị phân biệt của khái niệm mới và tất cả những khái niệm khác cần phải được đánh giá lại.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 57
Để làm giảm tương quan trung bình theo phương pháp dị biệt – tương quan dị biệt (heteromethod – heterotrait correlations), một cách có thể đó là (1) loại biến tương quan mạnh với biến khác ở khái niệm khác. Hoặc (2) đánh giá lại những biến quan sát này với khái niệm khác nếu hợp lý về mặt lý thuyết (theoritical plausible). Phụ lục 3.7 Kiểm soát các vấn đề liên quan đến giá trị phân biệt Đánh giá giá trị phân biệt sử dụng tiêu chí HTMT
Giá trị phân biệt được thiết lập
Giá trị phân biệt không được thiết lập
Tiếp tục các phân tích tiếp theo
Giữ nguyên giá trị phân biệt này, không thay đổi các khái niệm gây ra các vấn đề
Giá trị phân biệt không được thiết lập
Giá trị phân biệt được thiết lập
Thiết lập giá trị phân biệt và làm rõ các khái niệm gây ra vấn đề
Tiếp tục các phân tích tiếp theo
Giá trị phân biệt không được thiết lập
Giá trị phân biệt được thiết lập
Loại bỏ mô hình
Tiếp tục các phân tích tiếp theo
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 58
Phải chú ý đến tầm quan trọng của giá trị nội dung khi loại biến chỉ căn cứ trên nền tảng thống kê. Vì vậy, nên cân nhắc cẩn thận và nên sử dụng ít nhất hai chuyên gia đánh giá độc lập quá trình này. Một hướng tiếp cận khác để xử lý vấn đề giá trị phân biệt liên quan đến việc sáp nhập các khái niệm gây ra sự trục trặc này thành một khái niệm chung. Một lần nữa, lý thuyết về đo lường phải hỗ trợ cho bước này. Một khái niệm tổng quát hơn thay thế cho các khái niệm gây ra vấn đề trong mô hình. Bước này có thể kéo theo sự gia tăng hệ số tương quan trung bình của đặc điểm đơn nhất – phương pháp dị biệt hoặc/và giảm hệ số tương quan trung bình của phương pháp dị biệt – đặc điểm dị biệt. Trong Phụ lục 3.8, chúng ta tóm tắt về các tiêu chí được sử dụng để đánh giá độ tin cậy và giá trị của việc đo lường khái niệm kết quả. Nếu các tiêu chí không phù hợp, nhà nghiên cứu có thể quyết định việc loại bỏ những biến quan sát ra khỏi một khái niệm nghiên cứu cụ thể (specific construct) nhằm đạt được tiêu chuẩn đề ra. Tuy nhiên, việc loại bỏ này cần suy xét kỹ lưỡng bởi việc loại bỏ chúng có thể gia tăng độ tin cậy hay giá trị phân biệt, tuy nhiên việc loại bỏ này cũng đồng thời cũng làm suy giảm tính chính xác về giá trị nội dung trong quá trình đo lường. Phụ lục 3.8 Những quy tắc kinh nghiệm trong việc đánh giá mô hình đo lƣờng kết quả
Độ tin cậy nhất quán nội tại (Internal consistency reliability): giá trị độ tin cậy tổng hợp nên lớn hơn 0.70 (với nghiên cứu khám phá, chấp nhận giá trị từ 0.6÷0.7. Cân nhắc khi dùng Cronbach‟s alpha ở ngưỡng thấp và độ tin cậy tổng hợp ở ngưỡng cao như các chỉ số để đo lường giá trị độ tin cậy nhất quán nội tại. Độ tin cậy biến quan sát (Indicator reliability): chỉ số độ tin cậy ngoài (outer reliability) nên lớn hơn 0.70. Những biến quan sát có hệ số tải từ 0.4÷0.7 nên cân nhắc bị loại khi mà việc loại bỏ này dẫn đến sự gia tăng giá trị độ tin cậy tổng hợp và chỉ số AVE trên ngưỡng giới hạn. Giá trị hội tụ: chỉ số AVE nên lớn hơn 0.5. Giá trị phân biệt: - Sử dụng tiêu chí HTMT để đánh giá giá trị phân biệt trong PLS – SEM. - Khoảng tin cậy thống kê của HTMT không nên chứa giá trị 1 cho tất cả các sự kết hợp của các khái niệm. - Phụ thuộc vào cách đánh giá truyền thống, một chỉ số tải ngoài của một biến quan sát nên cao hơn hệ số tải chéo của nó với các khái niệm khác. Hơn thế nữa, căn bậc hai của AVE của mỗi khái niệm nên lớn hơn hệ số tương quan cao nhất của nó với bất kỳ khái niệm nào trong mô hình (tiêu chí Fornell – Larcker).
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 59
3.4 MINH HỌA TÌNH HUỐNG NGHIÊN CỨU– MÔ HÌNH ĐO LƢỜNG KẾT QUẢ Sử dụng thuật toán PLS-SEM Chúng ta lại tiếp tục với ví dụ về đo lường mức độ nổi tiếng của doanh nghiệp (corporate reputation). Trong chƣơng 3, chúng tôi đã giải thích làm thế nào để ước lượng với mô hình đường dẫn PLS Path và thu được kết quả bằng cách mở báo cáo mặc định (default report) của phần mềm SmartPLS 3.0. Đầu tiên, chúng ta sẽ phải mở mô hình đơn giản đánh giá mức độ nổi tiếng của doanh nghiệp (simple corporate reputation model) và chạy mô hình bằng cách nhấp chọn biểu tượng ở trên cùng hoặc chọn vào mục Calculate → PLS Algorithm trên thanh công cụ. Để có báo cáo, click trái vào menu thả xuống (pull-down menu) tại phía trên cùng của màn hình và chọn Default Report. Trước khi phân tích kết quả, chúng ta cần kiểm tra nhanh có hay là không tính hội tụ trong thuật toán (ví dụ, các tiêu chí dừng thuật toán đã đạt được và không phải là số vòng lặp lớn nhất (not the maximum number of iterations). Vào PLS → Calculation Results → Stop Criterion Changes. Phụ lục 3.9 sẽ cho thấy số vòng lặp trong thuật toán PLS-SEM. Con số này sẽ nhỏ hơn con số lớn nhất của vòng lặp (ví dụ: 300) mà chúng ta đã định sẵn trong thuật toán PLS-SEM. Tại phía đáy bên trái của Phụ lục 3.9, chúng ta thấy rằng thuật toán sẽ hội tụ sau vòng lặp 9 (Iteration 9). Nếu thuật toán PLS (PLS-SEM algorithm) không hội tụ trong khoảng ít hơn 300 vòng lặp (300 interations) (được cài đặt bởi phần mềm), thuật toán sẽ không tìm ra được kết quả ổn định. Tình trạng này hầu như không bao giờ xảy ra. Nhưng nếu nó xảy ra, hai vấn đề cần chú ý. (1) Chọn tiêu chí dừng (Stop criterion) ở mức quá nhỏ (1.0E-10) mà sự thay đổi nhỏ trong các hệ số đo lường của mô hình sẽ cản trở thuật toán PS-SEM dừng lại. (2) Dữ liệu cung cấp bất thường và cần kiểm tra kỹ lại. Ví dụ, kích cỡ mẫu quá nhỏ hay một biến quan sát có nhiều giá trị giống hệt nhau (tức là, cùng điểm dữ liệu, dẫn đến kết quả là thiếu tính biến thiên).
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 60
Phụ lục 3.9
Bảng tiêu chí dừng trong SmartPLS
Khi mô hình hội tụ, chúng ta cần xem các kết quả tính toán để đánh giá mô hình đo lường kết quả gồm: Hệ số tải ngoài (Outer loadings), Độ tin cậy tổng hợp (Composite Reliability, Hệ số Cronbach Alpha, Phƣơng sai trích trung bình (AVE), Giá trị phân biệt (Discriminant Validity). Những thông tin khác sẽ được tìm hiểu trong Chƣơng 4 và Chƣơng 5, khi chúng ta mở rộng mô hình đơn giản bằng việc thêm đo lường nguyên nhân (formative measures) và kiểm định mô hình cấu trúc (Structural model).
Đánh giá mô hình đo lƣờng kết quả - Reflective Measurement Model Evaluation Mô hình về mức độ nổi tiếng của doanh nghiệp giản đơn bao gồm 3 biến tiềm ẩn (COMP, CUSL và LIKE) và 1 khái niệm đơn biến (CUSA). Với mô hình này, chúng ta cần ước lượng mối quan hệ giữa biến tiềm ẩn kết quả và các biến quan sát của nó (hệ số tải ngoài outer loadings). Phụ lục 3.10 cho thấy kết quả của hệ số tải ngoài (outer loadings) sau khi vào Final Results → Outer Loadings. Tất cả các chỉ số Outer loadings của các khái niệm COMP, CUSL và LIKE đều cao hơn giá trị cho ph p (threshold) là 0.708. Biến quan sát comp_2 có độ tin cậy biến thấp nhất là 0.638 = 0.79852 (hệ số tải ngoài: 0.7985), trong khi đó biến cusl_2 có độ tin cậy biến cao nhất là 0.841= 0.917322 (hệ số tải ngoài: 0.91732). Vì vậy, tất cả các biến quan sát cho 3 khái niệm kết quả (reflective constructs) đều lớn hơn giá trị tối thiểu cho phép (ngưỡng) đối với hệ số tải ngoài. PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 61
Phụ lục 3.10
Outer Loadings
Để đánh giá giá trị tin cậy tổng hợp của đo lường, nhấp chuột trái vào Construct Reliability và Validity ở dưới tab Quality Criteria. Phụ lục 3.11 mô tả biểu đồ cột thể hiện các giá trị tin cậy tổng hợp của các khái niệm. Các cột hiện màu xanh dương báo hiệu giá trị đạt ngưỡng (tức là 0.7). Biểu đồ màu xanh lá báo hiệu giá trị vượt ngưỡng. Biểu đồ màu đỏ biểu thị giá trị dưới ngưỡng 0.7. Trong ví dụ minh họa, các giá trị tin cậy đều vượt ngưỡng. Click vào tab Matrix để thấy các giá trị cụ thể. Giá trị độ tin cậy tổng hợp của COMP là 0.865, 0.899 (CUSL), và 0.899 (LIKE) chứng tỏ cả 3 đều có độ tin cậy nhất quán nội tại cao. Lưu ý rằng, giá trị độ tin cậy tổng hợp của khái niệm đơn biến CUSA là 1. Nhưng chúng ta không thể nói rằng giá trị 1 này cho thấy thang đo đảm bảo độ tin cậy tuyệt đối.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 62
Phụ lục 3.11
Độ tin cậy tổng hợp
Chọn Quality Criteria → Construct Reliability and Validity giúp chúng ta lựa chọn biểu đồ giá trị Cronbach‟s Alpha cho tất cả các khái niệm (Phụ lục 3.12). Tất cả các thanh màu xanh lá cây nói lên các khái niệm đều trên ngưỡng 0.7. Cụ thể, hệ số Cronbach‟s Alpha (0.776 cho COMP, 0.831 cho CUSL, và 0.831 cho LIKE) có thể hiển thị bằng cách click chuột vào thẻ Matrix. CUSA là khái niệm đơn biến nên việc đánh giá Cronbach‟s Alpha là vô nghĩa. Phụ lục 3.12
Cronbach’s Alpha
Việc đánh giá giá trị hội tụ (convergent validity) sẽ dựa trên giá trị AVE bằng cách vào Quality Criteria → Construct Reliability and Validity trong báo cáo kết quả. Phụ lục 3.13 minh họa kết quả Construct Reliability and Validity dạng biểu đồ cột. Trong ví dụ này, PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 63
giá trị AVE của COMP là 0.681, CUSL là 0.748, và LIKE là 0.747, tất cả đều lớn hơn mức tối thiểu 0.5. Vì vậy, cả 3 khái niệm này đều có độ hội tụ cao. Phụ lục 3.13
Average Variance Extracted (AVE)
Cuối cùng, kiểm tra giá trị phân biệt bằng cách vào Discriminant Validity dưới thẻ Quality Criteria, SmartPLS 3 đề xuất nhiều lựa chọn để đánh giá giá trị phân biệt của các khái niệm. Theo điều kiện tiêu chí Fornell-Larcker căn bậc hai của AVE (√
) cho từng khái
niệm (construct) nên lớn hơn giá trị tƣơng quan cao nhất của khái niệm này với các khái niệm khác trong mô hình (so sánh A
v i bình phư ng tư ng quan gi a các biến). Phụ lục
3.14 minh họa kết quả theo tiêu chí Fornell-Larcker với √
của khái niệm phản ánh kết
quả trên đường chéo và tương quan giữa các khái niệm trong phần tam giác bên dưới. Phụ lục 3.14
Tiêu chí Fornell-Larcker
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 64
Ví dụ, khái niệm COMP có giá trị √
là 0.827, chúng ta cần so sánh số này với tất cả
giá trị tương quan trong cột COMP. Lưu ý với CUSL, chúng ta cần so sánh các tương quan trong cả dòng và cột. Tóm lại, chúng ta có kết quả √
cho từng khái niệm có giá trị trong
ngoặc đơn như sau: COMP (0.827), CUSL (0.873), và LIKE (0.888). Chúng ta thấy rằng, tất cả các giá trị tính toán đều cao hơn tương quan của các khái niệm này với các biến tiềm ẩn trong mô hình. Cách khác có thể được dùng để kiểm tra giá trị phân biệt đó là thông qua hệ số tải chéo (chọn Cross loadings trong phần Discriminant Validity). Giá trị phân biệt được tạo ra khi hệ số tải của biến quan sát lên khái niệm cao hơn tất cả hệ số tải chéo của nó lên các khái niệm khác. Phụ lục 3.15 cho thấy hệ số tải và hệ số tải chéo của mỗi biến quan sát. Ví dụ biến comp_1 có hệ số tải lớn nhất (0.891) khi đo lường khái niệm COMP, trong khi đó, tất cả hệ số tải chéo (cross - loadings) với các khái niệm khác thì tương đối thấp (ví dụ: hệ số tải của comp_1 lên CUSA chỉ đạt 0.425). Tóm lại, hệ số tải ch o cũng như tiêu chí của FornellLarcker cung cấp bằng chứng về giá trị phân biệt của khái niệm. Phụ lục 3.15
Hệ số tải chéo (Cross – Loadings)
Tuy nhiên, cần chú ý rằng trong nghiên cứu ứng dụng, tiêu chí Fornell – Larcker hoặc tải chéo không cho phép phát hiện các vấn đề của giá trị phân biệt. Vì vậy, một sự lựa chọn PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 65
khác đáng tin cậy hơn đó là tiêu chí HTMT. Giá trị phân biệt trong bảng kết quả xuất hiện bảng Heterotrait – Monotrait (HTMT). Phụ lục 3.16 chỉ ra giá trị HTMT cho tất cả các cặp khái niệm trong một ma trận. Thẻ kế kiếp minh họa giá trị HTMT trong biểu đồ cột, sử dụng 0.85 nhƣ là ngƣỡng phù hợp. Phụ lục 3.16
Giá trị HTMT
Có thể thấy, tất cả các giá trị HTMT đều nhỏ hơn nhiều so với ngưỡng 0.85, thậm chí đối với CUSA và CUSL, hai khái niệm này được xem dưới quan điểm lý thuyết là gần như tương đồng. Nhớ lại rằng ngưỡng giá trị đối với các khái niệm tương đồng là 0.9. Thêm vào đó, để xác định tỷ lệ HTMT, nên kiểm định xem các giá trị HTMT có khác 1 có ý nghĩa thống kê hay không. Yêu cầu này phải được trải qua đánh giá khoảng tin cậy bằng phương pháp boostrap. Để chạy quy trình boostrapping, chúng ta quay trở lại, chọn Calculate → Bootstrapping. Trong hộp thoại như Phụ lục 3.17, click chọn các lựa chọn như hình minh họa. Phải chắc chắn là đã chọn Complete Bootstrapping, không giống như Basic Bootstrapping. Cuối cùng, chọn Start Calculation. Sau khi chạy Boostrapping, mở bảng báo cáo kết quả. Vào Quality Criteria → Heterotrait – Monotrait (HTMT) và click trái vào thẻ Confidence Interval Bias Corrected. Menu xổ xuống như Phụ lục 3.18 chỉ các giá trị HTMT được tính với sự phóng đại mẫu lên 5000 (cột Sample Mean (M)). Chú ý kết quả ở Phụ lục 3.18 sẽ khác với kết quả của bạn và nó sẽ thay đổi mỗi khi chạy bootstrapping. Lý do chính là bootstrapping dựa trên quy trình tái lập mẫu có thay thế, do đó, mỗi lần chạy là mỗi lần mẫu thay thế khác nhau. Sự khác biệt về kết PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 66
quả bootstrapping là rất nhỏ, tuy nhiên, nó cung cấp bằng chứng mẫu phóng đại đã được tạo lập (vd: 5000). Phụ lục 3.17
Boostrapping Options in SmartPLS
Cột 2.5% và 97.5% chỉ ra ngưỡng giới hạn thấp và cao của 95% (chệch – hiệu chỉnh và tích lũy) khoảng tin cậy. Có thể thấy, khoảng tin cậy không bao gồm con số 1. Ví dụ, ngưỡng giới hạn thấp và cao của HTMT cho mối quan hệ giữa CUSA và COMP là 0.181 và 0.621. Như kỳ vọng, giá trị này chứng minh giá trị phân biệt so với ngưỡng 0.85. Phụ lục 3.18
Khoảng tin cậy cho HTMT
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 67
Phụ lục 3.19 tổng kết các kết quả của mô hình đo lường kết quả. Có thể thấy, tất cả các tiêu chí đánh giá mô hình đều đạt, cung cấp bằng chứng cho độ tin cậy và giá trị.
Tổng kết cho mô hình đo lƣờng kết quả
Phụ lục 3.19
Giá trị hội tụ - Convergent Validity
Biến tiềm ẩn Latent Variable
Biến quan sát Indicators
Hệ số tải Loadings
> 0.70
COMP
CUSL
LIKE
Độ tin cậy của biến quan sát Indicator Reliability
> 0.50
comp_1
0.858
0.736
comp_2
0.798
0.637
comp_3
0.818
0.669
cusl_1
0.833
0.694
cusl_2
0.917
0.841
cusl_3
0.843
0.711
like_1
0.879
0.773
like_2
0.87
0.757
like_3
0.843
0.711
AVE
Độ tin cậy nhất quán nội tại Internal Consistency Reliability Độ tin cậy tổng hợp Composite Reliability
Giá trị phân biệt Discriminant Validity
Cronbach's Alpha
> 0.50
0.60-0.90
0.60-0.90
Khoảng tin cậy bên trong HTMT Không chứa giá trị 1
0.681
0.865
0.776
Chấp thuận
0.748
0.899
0.831
Chấp thuận
0.747
0.899
0.831
Chấp thuận
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 68
CHƢƠNG 4 ĐÁNH GIÁ MÔ HÌNH ĐO LƢỜNG NGUYÊN NHÂN
Nhiều nhà nghiên cứu sử dụng không đúng tiêu chí đánh giá mô hình đo lường kết quả để đánh giá chất lượng của đo lường nguyên nhân trong PLS-SEM, điều này được công bố bởi các nghiên cứu PLS-SEM trong các lĩnh vực về tiếp thị và quản trị chiến lược. Tuy nhiên, các tiêu chí đánh giá thống kê cho thang đo lường kết quả không thể được chuyển trực tiếp vào mô hình đo lƣờng nguyên nhân nơi mà các biến có khả năng đại diện cho biến độc lập mang tính nguyên nhân của khái niệm nghiên cứu và do đó không nhất thiết phải có sự tương quan cao. Hơn nữa, các biến nguyên nhân được giả định là không có sai số (error free), có nghĩa là khái niệm độ tin cậy nhất quán nội tại sử dụng không phù hợp. Việc đánh giá giá trị hội tụ và giá trị phân biệt của mô hình đo lường nguyên nhân khi sử dụng tiêu chí tương tự với những thứ liên quan với mô hình đo lường kết quả là không có ý nghĩa. Thay vào đó, các nhà nghiên cứu nên tập trung vào việc thiết lập giá trị nội dung trước khi đánh giá thực nghiệm các khái niệm nghiên cứu đo lường nguyên nhân. Bước này đòi hỏi đảm bảo rằng các biến quan sát nguyên nhân chứa đựng/nắm bắt tất cả (hoặc ít nhất là điểm chính) các mặt của khái niệm nghiên cứu. Trong việc tạo ra các khái niệm nghiên cứu nguyên nhân, vấn đề giá trị nội dung được đề cập trong đặc điểm nội dung, trong đó nhà nghiên cứu xác định rõ phạm vi nội dung các biến được dự định đo lường. Các nhà nghiên cứu phải liệt kê một tập hợp toàn diện các biến quan sát thể hiện tất cả những gì liên quan đến phạm vi của khái niệm nghiên cứu nguyên nhân. Thất bại trong việc xem xét tất cả các khía cạnh của khái niệm nghiên cứu (tức là các biến quan sát có liên quan) dẫn đến sự loại trừ các phần quan trọng của chính khái niệm nghiên cứu. Trong phần này, đánh giá của các chuyên gia giúp bảo đảm rằng có một tập hợp thích hợp các biến quan sát được sử dụng. Ngoài những lý do cụ thể cho việc vận hành khái niệm nghiên cứu nguyên nhân (Chương 2), các nhà nghiên cứu nên tiến
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 69
hành xem xét tài liệu kỹ lưỡng và đảm bảo nền tảng lý thuyết hợp lý khi phát triển các phép đo. Việc đánh giá kết quả PLS-SEM nên tính đến việc xem xét các khía cạnh này. Trong chương 4, chúng ta kiểm tra các kết quả thực nghiệm PLS-SEM của các mô hình đo lường nguyên nhân theo quy trình nêu tại Phụ lục 4.1. Bước đầu tiên liên quan đến việc đánh giá giá trị hội tụ của các mô đo lường nguyên nhân thông qua mối tương quan giữa khái niệm nghiên cứu đo lường nguyên nhân với đo lường kết quả của cùng khái niệm nghiên cứu (Bước 1). Ở cấp độ biến quan sát, câu hỏi đặt ra là liệu biến quan sát có thực sự mang lại sự đóng góp vào thước đo nguyên nhân bởi chứa đựng ý nghĩa dự kiến hay không. Có hai tình huống mà các nhà nghiên cứu nên xem xét một cách chi tiết đó là liệu một biến quan sát cụ thể có nên nhập vào thang đo hay không: Thứ nhất, thông tin của biến quan sát có thể là dư thừa nếu nó thể hiện mối tương quan cao với các biến quan sát khác của cùng khái niệm nghiên cứu. Điều này đòi hỏi việc kiểm tra sự đa cộng tuyến giữa các biến quan sát (Bước 2). Thứ hai, một biến quan sát nguyên nhân có thể đóng góp không đáng kể cho khái niệm nghiên cứu cả tương đối và tuyệt đối. Khía cạnh thứ hai có thể đánh giá bằng cách kiểm tra (thống kê) mức ý nghĩa và sự liên quan của các biến quan sát nguyên nhân (Bước 3). Phụ thuộc vào kết quả của Bước 2 và Bước 3, bạn cần xem lại các bước đã làm, bắt đầu với việc thiết lập giá trị hội tụ của biến quan sát nguyên nhân.
4.1 Bƣớc 1: Đánh giá Giá trị hội tụ Giá trị hội tụ là mức độ một đo lường tương quan tích cực với các đo lường khác (vd: đo lường kết quả) của cùng khái niệm nghiên cứu khi sử dụng các biến quan sát khác nhau. Vì thế, khi đánh giá các mô hình đo lường nguyên nhân, chúng ta phải kiểm định liệu khái niệm đo lường nguyên nhân có quan hệ ở mức cao với đo lường kết quả của cùng khái niệm nghiên cứu hay không. Dạng phân tích này cũng là được gọi là phân tích phần dƣ (redundancy analysis). Việc phân tích phần dư bắt nguồn từ những thông tin trong mô hình là dư thừa có nghĩa rằng nó được tính đến trong khái niệm nghiên cứu nguyên nhân và một lần nữa lại được tính đến trong khái niệm nghiên cứu kết quả.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 70
Phụ lục 4.1
Qui trình đánh giá các mô hình đo lƣờng nguyên nhân
Bƣớc 1
Đánh giá giá trị hội tụ của mô hình đo lường nguyên nhân
Bƣớc 2
Đánh giá mô hình đo lường nguyên nhân về vấn đề cộng tuyến
đo lường nguyên nhân Bƣớc 3
Đánh giá ý nghĩa và sự liên quan của các biến quan sát nguyên nhân
Cụ thể, phải sử dụng khái niệm đo lường nguyên nhân như là một biến tiềm ẩn ngoại sinh dự đoán một biến tiềm ẩn nội sinh thực hiện thông qua một hoặc nhiều biến quan sát kết quả (Phụ lục 4.2). Độ mạnh của hệ số đường dẫn nối hai khái niệm nghiên cứu là biểu hiện của giá trị của các biến quan sát nguyên nhân trong việc khai thác khái niệm nghiên cứu cần quan tâm. Lý tưởng nhất, độ lớn bằng 0.80 hoặc ít nhất là 0.70 trở lên là điều mong muốn cho đường dẫn giữa Ylnguyên nhân và Ylkết quả, điều này chuyển thành giá trị R2 là 0.64 hoặc ít nhất là 0.50. Nếu các phân tích cho thấy thiếu giá trị hội tụ (tức là giá trị R2 của Ylkết quả < 0.50), thì biến quan sát nguyên nhân của khái niệm Ylnguyên nhân không đóng góp đủ mức độ cho nội dung dự định của nó. Khái niệm nghiên cứu nguyên nhân cần phải chắt lọc lý thuyết/khái niệm bằng cách trao đổi và / hoặc bổ sung thêm các biến quan sát. Lưu ý rằng để thực hiện phương pháp này, các biến tiềm ẩn kết quả phải được xác định trong giai đoạn thiết kế nghiên cứu và đưa vào bộ sưu tập dữ liệu cho việc nghiên cứu. Để xác định các đo lường kết quả phù hợp với khái niệm nghiên cứu hay không, các nhà nghiên cứu có thể nhờ đến thang đo từ nghiên cứu trước đó, sổ tay thang đo cung cấp các thang đo có sẵn. Tuy nhiên, tập hợp của các đo lường đa biến không phải mang lại kết quả như mong muốn, bởi vì chúng làm tăng độ dài bảng khảo sát. Khảo sát dài dòng có khả năng dẫn đến việc trả lời một cách mệt mỏi, giảm tỷ lệ hồi đáp, và gia tăng giá trị khuyết. Hơn nữa, thiết lập công
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 71
cụ đo lường kết quả thì không có sẵn, và việc xây dựng một thang đo mới thì khó khăn và tốn thời gian. Phụ lục 4.2
Phân tích phần dƣ để đánh giá giá trị hội tụ
x1 x5 x2 Y1 nguyên nhân
Y1 kết quả
x6
x3
x7 x4
Một cách khác là sử dụng một biến bao trùm (toàn thể) mà nó tóm tắt bản chất của khái niệm biến quan sát nguyên nhân để đo lường. Đối với ví dụ PLS-SEM về danh tiếng công ty trong Chương 2, một phát biểu bổ sung, “Hãy đánh giá mức độ mà [công ty] hoạt động theo ý thức xã hội”, đã được phát triển và được đo trên thang đo từ 0 (hoàn toàn phản đối) đến 10 (hoàn toàn đồng ý). Câu hỏi này có thể được sử dụng như một khái niệm đơn biến nội sinh để xác nhận đo lường nguyên nhân về trách nhiệm xã hội của doanh nghiệp (CSOR). Sau đó trong chương này, chúng tôi giải thích cách đánh giá toàn bộ dữ liệu cho ví dụ PLS-SEM về danh tiếng công ty và cách tiến hành quy trình đánh giá mô hình đo lường nguyên nhân. Lưu ý rằng trong khi sử dụng biến đơn không được khuyến khích, cụ thể trong bối cảnh nghiên cứu PLSSEM, vai trò của chúng trong phân tích phần dư là khác nhau bởi vì các biến đơn được xem như là đại diện cho khái niệm đang xem xét. Nói cách khác, mục tiêu không phải là để nắm bắt đầy đủ phạm vi nội dung của khái niệm nghiên cứu mà chỉ xem xét các yếu tố nổi bật của nó, được coi là tiêu chuẩn so sánh cho tiếp cận đo lường nguyên nhân của khái niệm nghiên cứu. 4.2 Bƣớc 2: Đánh giá mô hình đo lƣờng nguyên nhân về vấn đề cộng tuyến Không giống như các biến quan sát kết quả, mà cơ bản là thay đổi được, mối tương quan cao không phải là điều mong đợi giữa các biến trong mô hình đo lường nguyên nhân. Trong thực tế, mối tương quan cao giữa hai biến quan sát nguyên nhân, cũng được gọi là sự cộng PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 72
tuyến (collinearity), có thể chứng minh qua các vấn đề phương pháp luận và quan điểm diễn dịch. Lưu ý rằng khi hơn hai biến quan sát có liên quan, tình huống này được gọi là sự đa cộng tuyến (multi-collinearity). Để dễ dàng bình luận, chúng ta chỉ đề cập đến cộng tuyến trong thảo luận sau đây. Hình thức nghiêm trọng nhất của đa cộng tuyến xảy ra nếu hai (hoặc nhiều hơn) biến quan sát nguyên nhân được nhập vào trong cùng một khối biến với cùng mức chính xác thông tin trong chúng (tức là chúng hoàn toàn tương quan). Tình huống này có thể xảy ra bởi vì cùng một biến được nhập vào hai lần hoặc bởi vì một biến là một sự kết hợp tuyến tính của các biến khác (vd: một biến là bội số của một biến khác như thang đo hàng đơn vị và thang đo hàng nghìn đơn vị). Trong trường hợp này, PLS-SEM không thể ước lượng một trong hai hệ số (một ma trận đơn xuất hiện trong khi ước lượng mô hình; xem lại Chương 2). Vấn đề cộng tuyến cũng có thể xuất hiện trong mô hình cấu trúc (Chương 5) nếu các biến thừa được sử dụng như là biến đơn duy nhất để đo lường hai (hoặc nhiều hơn) khái niệm nghiên cứu. Nếu điều này xảy ra, các nhà nghiên cứu cần phải loại bỏ các biến thừa. Trong khi sự cộng tuyến hoàn toàn hiếm khi xảy ra, thì cộng tuyến ở mức cao phổ biến hơn nhiều. Mức độ cao của sự cộng tuyến giữa các biến quan sát nguyên nhân là những vấn đề cốt yếu bởi vì chúng có ảnh hưởng đến việc ước lượng trọng số và mức ý nghĩa thống kê. Cụ thể hơn, trong thực tế, mức độ cộng tuyến cao thường ảnh hưởng đến kết quả phân tích ở hai khía cạnh. Đầu tiên, sự cộng tuyến làm tăng sai số chuẩn và do đó làm giảm khả năng chứng minh rằng trọng số ước lượng khác biệt đáng kể so với giá trị 0. Đây là vấn đề đặc biệt trong phân tích PLS-SEM dựa trên cỡ mẫu nhỏ hơn, trong đó sai số chuẩn nói chung là lớn hơn do sai số lấy mẫu. Thứ hai, mức độ cộng tuyến cao có thể dẫn đến các trọng số không được ước lượng chính xác, và còn thêm dấu bị đảo ngược. Ví dụ sau đây (Phụ lục 4.3) minh họa sự đảo ngược dấu do mối tương quan cao giữa hai biến quan sát nguyên nhân. Xem xét ma trận tương quan trong Phụ lục 4.3 (phía bên phải), lưu ý rằng các biến x1 và x2 đều tương quan dương với khái niệm nghiên cứu Y1 (tương ứng 0.38 và 0.14), nhưng có một tương quan cao hơn (0.68). Mặc dù cả hai tương quan hai biến của các biến là dương với khái niệm nghiên cứu Y1 trong tình huống này, và cả hai biến này đều tương quan dương, khi ước PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 73
lượng tham số cuối cùng được tính trong giai đoạn cuối của thuật toán (Chương 2), trọng số ngoài của x1 là dương (0.53), trong khi trọng số ngoài của x2 là âm (-0.17) như trong Phụ lục 4.3 (bên trái). Điều này chứng tỏ một tình huống mà mức độ cộng tuyến cao làm đảo ngược dấu của biến yếu hơn (tức là biến quan sát ít tương quan với khái niệm nghiên cứu), điều này có thể dẫn đến việc giải thích sai về kết quả và kết luận sai. Phụ lục 4.3
Ma trận tƣơng quan minh chứng sự cộng tuyến
Mô hình đo lường nguyên nhân x1
0.53
Y1 x2
Ma trận tương quan Y1 x1 x2
Y1 1.00 0.38 0.14
x1
x2
1.00 0.68
1.00
-0.17
4.3 Cách đánh giá sự cộng tuyến và xử lý với các mức tới hạn Để đánh giá mức độ cộng tuyến, các nhà nghiên cứu nên tính toán dung sai (tolerance) (TOL). Dung sai đại diện cho lượng biến thiên (phương sai) của một biến quan sát nguyên nhân không được giải thích bởi các biến quan sát khác trong cùng một khối. Ví dụ, trong cùng một khối biến quan sát nguyên nhân, dung sai của biến thứ nhất x1 có thể thu được trong hai bước sau: 1. Lấy biến quan sát nguyên nhân đầu tiên x1 và hồi quy nó với tất cả các biến còn lại trong cùng một khối. Tính toán tỷ lệ biến thiên của x1 kết hợp với các biến quan sát còn lại ( Rx2 ). 1
2. Tính toán dung sai cho biến x1 ( TOLxs ) bằng việc sử dụng 1 - Rx2 . Ví dụ nếu các 1
biến khác giải thích 75% sự biến thiên của biến đầu tiên (tức là Rx2 = 0.75), dung 1
sai cho x1 là 0.25 ( TOLxs = 1.00 – 0.75 = 0.25). Một phép đo lường liên quan đến cộng tuyến là hệ số phóng đại phƣơng sai (VIF), được xác định là nghịch đảo của dung sai (tức là, VIFxs = 1 / TOLxs ). Do đó, giá trị dung sai PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 74
0.25 đối với x1 ( TOLxs ) chuyển sang giá trị VIF là 1/0.25 = 4.00 cho x1 ( VIFxs ). Thuật ngữ VIF có nguồn gốc từ căn bậc hai của VIF (√
) là mức độ mà sai số chuẩn đã bị tăng lên do sự
hiện diện của cộng tuyến. Trong ví dụ trên, giá trị VIF bằng 4.00 hàm ý rằng sai số chuẩn đã được tăng gấp đôi (√ = 2.00) do cộng tuyến. Tương tự, giá trị TOL và VIF được tính toán cho mỗi biến quan sát trên mô hình đo lường nguyên nhân. Cả hai thống kê cộng tuyến mang theo cùng một thông tin, nhưng báo cáo giá trị VIF đã trở thành tiêu chuẩn thực tiễn. Trong bối cảnh PLS-SEM, giá trị dung sai bằng 0.20 hoặc thấp hơn và giá trị VIF bằng 5 và cao hơn chỉ ra một vấn đề cộng tuyến tiềm năng (Hair và cộng sự, 2011). Rõ ràng hơn, các mức bằng 5 chỉ ra rằng 80% sự biến thiên của biến được giải thích bởi các biến quan sát nguyên nhân còn lại gắn liền với cùng một khái niệm nghiên cứu. Bên cạnh VIF, người ta cũng có thể xem xét sử dụng các chỉ số điều kiện (CI) để đánh giá sự hiện diện của mức cộng tuyến tới hạn trong các mô hình đo lường nguyên nhân. Tuy nhiên, CI khó diễn giải và không có trong phần mềm PLS-SEM. Một cách tiếp cận thay thế khác đánh giá cộng tuyến đó là tƣơng quan 2 biến. Tuy không phổ biến trong thực tế, nhưng tương quan hai biến quan sát cao hơn 0.6 đã dẫn đến vấn đề cộng tuyến với các biến quan sát nguyên nhân trong mô hình đường dẫn PLS. Nếu mức độ cộng tuyến là rất cao, được chỉ ra bởi giá trị VIF bằng 5 hoặc cao hơn, nên xem xét loại bỏ một trong các biến tương ứng. Tuy nhiên, điều này đòi hỏi các biến còn lại vẫn nắm bắt đủ nội dung của khái niệm nghiên cứu từ quan điểm lý thuyết. Kết hợp tuyến tính các biến thành một biến đơn (mới) tổng hợp (tức là một thước đo Index) – chẳng hạn như sử dụng các giá trị trung bình, giá trị trung bình trọng số, hoặc điểm số nhân tốlà những lựa chọn khác để khắc phục vấn đề cộng tuyến. Tuy nhiên, bước sau đây không phải không có vấn đề vì tác động riêng biệt của các biến trở nên xáo trộn, mà có thể có những hậu quả xấu cho các giá trị nội dung của thước đo. Cách khác, thiết lập các khái niệm bậc cao nguyên nhân – nguyên nhân là một giải pháp để giải quyết vấn đề cộng tuyến, nếu lý thuyết đo lường hỗ trợ một bước.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 75
Phụ lục 4.4 hiển thị quá trình đánh giá cộng tuyến trong các mô hình đo lường nguyên nhân dựa trên VIF. Trọng số ngoài trong các mô hình đo lường nguyên nhân cần được phân tích mức ý nghĩa của chúng và phù hợp chỉ khi cộng tuyến không ở mức độ tới hạn. Khi điều này không phải là trường hợp và các vấn đề cộng tuyến không thể được khắc phục, người ta không thể sử dụng và giải thích kết quả của các trọng số ngoài trong mô hình đo lường nguyên nhân. Kết quả là, đo lường nguyên nhân phải bị bác bỏ. Thậm chí mặc dù nó vẫn có thể phân tích mối quan hệ giữa các khái niệm nghiên cứu với nhau trong mô hình cấu trúc (Chương 5). Tuy nhiên, trong tình huống như vậy, nhà nghiên cứu có thể muốn cân nhắc hay bỏ qua việc vận hành mô hình đo lường nguyên nhân. 4.4 Bƣớc 3: Đánh giá ý nghĩa và mức độ liên quan của các biến quan sát nguyên nhân Một tiêu chí quan trọng khác để đánh giá sự đóng góp của một biến quan sát nguyên nhân và mức độ liên quan của nó, gọi là trọng số ngoài của nó. Trọng số ngoài là kết quả của hồi quy bội với điểm số biến tiềm ẩn như là biến phụ thuộc và biến quan sát nguyên nhân như các biến độc lập (xem thuật toán PLS-SEM trong Chương 2). Bởi vì khái niệm nghiên cứu được hình thành bởi các biến nguyên nhân phụ thuộc như là một sự kết hợp tuyến tính của các điểm số biến và trọng số ngoài trong mô hình đo lường nguyên nhân, chạy như phân tích hồi quy bội cho ra một giá trị R2 là 1.0. Tức là, 100% khái niệm nghiên cứu được giải thích bởi các biến quan sát. Đây là đặc điểm phân biệt phổ biến các biến quan sát nguyên nhân (tổng hợp) từ các biến nhân quả trong CB-SEM. Trong trường hợp sau, các biến khái niệm không tự động giải thích đầy đủ các biến quan sát (nhân quả) của nó. Giá trị của các trọng số ngoài được tiêu chuẩn hóa và có thể được so sánh với nhau. Chúng được sử dụng để xác định sự đóng góp tƣơng đối (relative contribution) của mỗi biến tới khái niệm nghiên cứu, hoặc tầm quan trọng tương đối của nó đến hình thành các khái niệm nghiên cứu. Các giá trị ước lượng của trọng số ngoài trong các mô hình đo lường nguyên nhân thường nhỏ hơn so với hệ số tải ngoài của các biến kết quả. Câu hỏi quan trọng phát sinh là các biến nguyên nhân có thực sự góp phần vào việc hình thành khái niệm nghiên cứu hay không. Để trả lời câu hỏi này, chúng ta phải kiểm định nếu các trọng số ngoài trong mô hình đo lường nguyên nhân có sự khác biệt đáng kể so với giá trị 0 PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 76
bằng thủ tục bootstrapping (lưu ý rằng bootstrapping cũng đóng một vai trò rất quan trọng trong việc đánh giá các hệ số đường dẫn của cấu trúc mô hình; Chương 5). Chúng tôi sẽ giải thích thủ tục bootstrapping chi tiết hơn ở phần sau. Phụ lục 4.4
Đánh giá sự cộng tuyến trong mô hình đo lƣờng nguyên nhân bằng hệ số VIF
Đánh giá mức độ cộng tuyến trong mô hình đo lường nguyên nhân
Ngưỡng không cộng tuyến (VIF < 5)
Phân tích ý nghĩa trọng số ngoài và giải nghĩa đóng góp tương đối & tuyệt đối của biến nguyên nhân
Ngưỡng cộng tuyến (VIF ≥ 5)
Xử lý vấn đề cộng tuyến
Ngưỡng không cộng tuyến (VIF < 5)
Phân tích ý nghĩa trọng số ngoài và giải nghĩa đóng góp tương đối & tuyệt đối của biến nguyên nhân
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Ngưỡng cộng tuyến (VIF ≥ 5)
Loại bỏ mô hình đo lường nguyên nhân
Page 77
Điều quan trọng là cần lưu ý rằng các giá trị của trọng số biến nguyên nhân bị ảnh hưởng bởi các mối quan hệ khác trong mô hình. Do đó, khái niệm nguyên nhân ngoại sinh có thể có nội dung và ý nghĩa khác nhau tùy thuộc vào các khái niệm nội sinh sử dụng như là kết quả. Điều này cũng được gọi là trùng lắp giải thích (interpretational confounding) và đại diện cho một tình huống trong đó theo kinh nghiệm quan sát ý nghĩa giữa các khái niệm và các đo lường khác của nó với ý nghĩa về mặt áp đặt lý thuyết. Kết quả như vậy là không mong muốn vì chúng hạn chế khái quát hóa các kết quả. Do đó, so sánh khái niệm nguyên nhân trên một số mô hình đường dẫn PLS với thiết lập khác nhau (ví dụ các biến tiềm ẩn nội sinh khác nhau) nên được tiếp cận với sự cẩn trọng. 4.5 Hàm ý về số lƣợng biến quan sát đƣợc sử dụng dựa trên trọng số của biến quan sát Với số lượng lớn hơn các biến quan sát nguyên nhân được sử dụng để đo lường một khái niệm nghiên cứu, nhiều khả năng là một hoặc nhiều biến quan sát sẽ có trọng số ngoài thấp hoặc thậm chí không có ý nghĩa. Không giống như các mô hình đo lường kết quả, mà trong đó số lượng các ít biến quan sát có mang về kết quả đo lường kém đi, đo lường nguyên nhân có một giới hạn cho trước về số lượng các biến quan sát có thể giữ lại một trọng số có ý nghĩa thống kê. Cụ thể, khi biến quan sát được giả định là không tương quan, trọng số ngoài tối đa có thể là 1/√ , trong đó n là số lượng biến quan sát. Ví dụ, với 2 (hoặc 5 hoặc 10) biến quan sát không tương quan, trọng số ngoài tối đa có thể là 1/√ = 0.707 (hoặc 1/√ = 0.447 hay 1/√
= 0.316). Tương tự như vậy, tùy theo trọng số tối đa có thể với sự rút gọn số lượng các
biến quan sát, giá trị trung bình của trọng số ngoài giảm đáng kể với số lượng lớn các biến đo lường. Do đó, nhiều khả năng biến quan sát nguyên nhân thêm vào sẽ trở nên không có ý nghĩa. Để đối phó với các tác động tiềm năng của một số lượng lớn các biến quan sát, các nhà nghiên cứu đề xuất nhóm các biến thành hai hoặc nhiều khái niệm nghiên cứu riêng biệt. Cách tiếp cận này tất nhiên đòi hỏi các nhóm biến được liên kết về tính khái niệm và việc lập nhóm có ý nghĩa từ một quan điểm lý thuyết và khái niệm. Ví dụ, các biến quan sát của khái niệm nghiên cứu hiệu quả (performance), mà chúng tôi giới thiệu như một khái niệm nghiên cứu dẫn tới danh tiếng của công ty trong chương này (xem Phụ lục 4.13), có thể được chia thành hai bộ, PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 78
như trong Phụ lục 4.5. Các biến quan sát đo lường “[công ty] là một công ty được quản lý rất tốt” (perf_1) và “[công ty] có một tầm nhìn rõ ràng về tương lai” (perf_5) có thể được sử dụng như là các biến quan sát kết quả của một khái niệm nghiên cứu riêng biệt gọi là năng lực quản lý (management competence). Tương tự như vậy, các biến quan sát “[công ty] là một công ty ổn định về kinh tế” (perf_2), “Tôi đánh giá rủi ro kinh doanh đối với [công ty] là khiêm tốn nhất so với các đối thủ cạnh tranh của nó” (perf_3), và “Tôi nghĩ rằng [công ty] có tiềm năng tăng trưởng” (perf_4) có thể được sử dụng như là các biến quan sát kết quả của một khái niệm nghiên cứu thứ hai được dán nhãn hiệu quả kinh tế. Một cách khác là tạo ra một mô hình thành phần thứ bậc nguyên nhân - nguyên nhân. Thành phần bậc hai của chính nó (hiệu quả) thì được hình thành bởi thành phần bậc nhất đo lường nguyên nhân (năng lực quản lý và hiệu quả kinh tế) (Phụ lục 4.5). Phụ lục 4.5 perf_1
perf_5
Ví dụ về khái niệm nghiên cứu bậc cao Năng lực quản lý
perf_1
perf_2
Hiệu quả
perf_3
perf_2 perf_4
perf_3
Hiệu quả kinh tế
perf_5
perf_4
4.6 Xử lý trọng số biến quan sát không có ý nghĩa Trọng số biến quan sát không có ý nghĩa không nên đƣợc diễn giải nhƣ là chỉ số chất lƣợng của mô hình đo lƣờng kém. Thay vào đó, các nhà nghiên cứu cũng nên xem xét sự đóng góp tuyệt đối (hoặc quan trọng tuyệt đối) của biến quan sát nguyên nhân cho khái niệm PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 79
nghiên cứu của nó - tức là thông tin mà một biến quan sát cung cấp mà không cần xem xét bất kỳ biến quan sát nào khác. Đóng góp tuyệt đối được tính bằng hệ số tải ngoài của biến quan sát nguyên nhân, luôn được cung cấp cùng với trọng số biến quan sát. Khác với trọng số ngoài, hệ số tải ngoài bắt nguồn từ các hồi quy đơn của mỗi biến quan sát lên khái niệm nghiên cứu tương ứng của nó (trong PLS-SEM tương đương với mối tương quan hai biến (bivariate correlation) giữa biến quan sát và khái niệm nghiên cứu). Khi trọng số ngoài của một biến quan sát là không có ý nghĩa nhưng hệ số tải ngoài của nó cao (tức là trên 0.50), biến quan sát cần được hiểu là quan trọng tuyệt đối chứ không phải là quan trọng tương đối. Trong tình huống này, các biến nhìn chung sẽ được giữ lại. Nhưng khi một biến có trọng số không có ý nghĩa và hệ số tải ngoài dưới 0.50, các nhà nghiên cứu nên quyết định xem có nên giữ lại hay xóa các biến bằng việc kiểm định tính phù hợp theo lý thuyết của nó và sự chồng chéo nội dung tiềm năng với biến khác của cùng một khái niệm nghiên cứu. Nếu các lý thuyết dẫn đường của khái niệm nghiên cứu ủng hộ mạnh mẽ việc giữ lại biến quan sát (thí dụ bằng cách đánh giá chuyên gia), nó nên được giữ trong mô hình đo lường nguyên nhân. Nhưng nếu khái niệm không ủng hộ mạnh mẽ liên hệ bao hàm của biến, biến quan sát không có ý nghĩa nên được gỡ bỏ khỏi các phân tích sâu hơn. Ngược lại, nếu hệ số tải ngoài thấp (dưới 0.10) và không có ý nghĩa, không có sự ủng hộ thực nghiệm đối với sự phù hợp của biến trong việc đưa ra nội dung cho thước đo nguyên nhân. Do đó, một biến quan sát như vậy cần được loại bỏ khỏi mô hình đo lường nguyên nhân. Từ quan điểm thực nghiệm, sự loại bỏ các biến quan sát nguyên nhân không đáp ứng mức ngưỡng về góc độ đóng góp của chúng hầu như không có ảnh hưởng lên các ước lượng tham số khi ước lượng lại mô hình. Tuy vậy, các biến quan sát nguyên nhân không nên bị loại bỏ một cách dễ dàng dựa trên cơ sở là các kết quả thống kê. Trước khi loại bỏ một biến khỏi mô hình đo lường nguyên nhân, bạn cần phải kiểm tra sự liên quan của nó từ việc quan sát giá trị nội dung. Một lần nữa, bỏ qua một biến quan sát nguyên nhân có nghĩa là bạn bỏ qua một số nội dung của khái niệm nghiên cứu. Phụ lục 4.6 tóm tắt quá trình ra quyết định để giữ hoặc xóa các biến quan sát nguyên nhân.
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 80
Phụ lục 4.6
Quá trình ra quyết định về việc giữ lại hoặc xóa bỏ biến quan sát nguyên nhân
Kiểm định ý nghĩa trọng số ngoài
Trọng số ngoài có ý nghĩa
Trọng số ngoài không có ý nghĩa Phân tích hệ số tải ngoài của biến quan sát nguyên nhân
Tiếp tục diễn dịch về độ lớn tương đối và tuyệt đối của trọng số tải ngoài Hệ số tải ngoài < 0.5
Hệ số tải ngoài > 0.5
Kiểm định ý nghĩa của hệ số tải ngoài biến quan sát nguyên nhân
Giữ biến quan sát mặc dù nó không có ý nghĩa
Hệ số tải ngoài < 0.5 và không có ý nghĩa
Hệ số tải ngoài < 0.5 nhưng có ý nghĩa
Xóa biến quan sát nguyên nhân
Cân nhắc kỹ việc loại bỏ biến quan sát nguyên nhân
PLS-SEM cơ bản (phiên bản 2 của Hair & cộng sự, 2016)
Page 81
Tóm lại, việc đánh giá mô hình đo lường nguyên nhân đòi hỏi phải thiết lập giá trị hội tụ đo lường, đánh giá cộng tuyến của các biến, và phân tích sự đóng góp tương đối và tuyệt đối của các biến, bao gồm cả mức ý nghĩa của chúng. Phụ lục 4.7 tổng kết các quy tắc kinh nghiệm để đánh giá các mô hình đo lường nguyên nhân. Phụ lục 4.7
Quy tắc kinh nghiệm để đánh giá các biến quan sát đo lƣờng nguyên nhân
• Đánh giá giá trị hội tụnhân của khái niệm nghiên cứu nguyên nhân bằng cách kiểm tra mối tương quan nguyên của nó với đo lường thay thế khác của khái niệm nghiên cứu, sử dụng các đo lường kết quả hoặc một biến đơn bao trùm (phân tích phần dư). Mối tương quan giữa các khái niệm nghiên cứu nên từ 0.70 trở lên. • Sự cộng tuyến của các biến quan sát: Giá trị VIF của mỗi biến quan sát phải nhỏ hơn 5. Nếu không, hãy cân nhắc loại bỏ các biến quan sát, kết hợp các biến quan sát vào một thang đo đơn, hoặc tạo ra các khái niệm nghiên cứu bậc cao để xử lý các vấn đề về cộng tuyến. • Kiểm tra trọng số ngoài của mỗi biến quan sát (tầm quan trọng tương đối) và hệ số tải ngoài (tầm quan trọng tuyệt đối) và sử dụng bootstrapping để đánh giá ý nghĩa của chúng. • Khi trọng số của biến quan sát có ý nghĩa, có sự ủng hộ thực nghiệm để giữ lại biến quan sát. • Khi trọng số của biến quan sát không có ý nghĩa nhưng hệ số tải biến tương ứng là khá cao (nghĩa là >0.50) hoặc có ý nghĩa thống kê, biến quan sát thường được giữ lại. • Nếu trọng số của biến quan sát không có ý nghĩa và hệ số tải ngoài tương đối thấp (nghĩa là