Một số phần mềm phân tích thống kê trong hoạt động giảng dạy và nghiên cứu khoa học thuộc khối ngành Quản trị kinh doanh, Marketing và Quan hệ công chúng

Dữ liệu và phân tích dữ liệu là một trong những hoạt động rất quan trọng trong hoạt động nghiên cứu và giảng dạy của các giảng viên, nhà nghiên cứu thuộc khối các ngành khoa học nói chung và ngành khoa học kinh doanh nói riêng. Chính vì vậy, phần mềm phân tích số liệu là một công cụ không thể thiếu đối với các nhà nghiên cứu, các nhà thống kê và nhiều nghiên cứu viên ở các lĩnh vực. Việc sử dụng phần mềm phân tích thống kê là yêu cầu bắt buộc với các nghiên cứu sử dụng phương pháp định lượng nhằm đơn giản hóa quá trình xử lý dữ liệu và chạy mô hình.

Hiện nay, trên thế giới có rất nhiều phần mềm chuyên dụng phục vụ cho việc xử lý và phân tích số liệu thống kê. Việc lựa chọn sử dụng phần mềm phụ thuộc vào đặc điểm của dữ liệu nguồn và khả năng của người sử dụng phần mềm. Ngoài ra, mỗi phần mềm đều có đặc trưng, điểm mạnh, điểm yếu riêng. Do vậy người sử dụng cần phải nắm bắt từng loại phần mềm để lựa chọn ứng dụng phù hợp cho mình. Và để lựa chọn được phần mềm phù hợp thì những người nghiên cứu cần xác định tác dụng của các phần mềm phân tích dữ liệu:

  1. Phần mềm phân tích là công cụ hỗ trợ cho việc thực hiện các ước lượng, tính toán nhanh chóng trong quá trình phân tích dữ liệu.
  2. Các phần mềm này đều dựa trên các công thức toán học, thống kê chung. Vì vậy, kết quả các phân tích dữ liệu trên các phần mềm khác nhau đều cho ra kết quả giống nhau, nếu có sự khác biệt thì sự khác biệt này rất nhỏ.

Với mục tiêu giúp các cán bộ, giảng viên, sinh viên có thể nắm rõ các đặc trưng, ưu nhược điểm của từng loại phần mềm để từ đó có cơ sở lựa chọn phần mềm phù hợp cho mình, tôi xin phép được giới thiệu tóm lược một số phần mềm phân tích thống kê phổ biến trên thế giới hiện nay:

1. PHẦN MỀM SAS (STATISTICAL ANALYSIS SYSTEMS)
SAS là phần mềm áp dụng ngôn ngữ lập trình để phân tích số liệu với trên 60 phương thức áp dụng cho phân tích phương sai, hồi qui, phân tích tổng hợp, và phân tích đa biến. SAS là phần mềm được nhiều nhà nghiên cứu có trình độ cao ưa thích bởi sức mạnh và khả năng lập trình của nó. Và đây cũng là phần mềm được đánh giá là khó học nhất. Để sử dụng SAS, người sử dụng phải viết chương trình để thao tác dữ liệu và thực hiện các phân tích dữ liệu của mình. Điểm gây khó khăn ở đây là người sử dụng phải biết tìm lỗi ở đâu và cách fix lỗi nếu chương trình bị mắc lỗi.

* Ưu điểm:
– SAS rất mạnh trong lĩnh vực quản lý dữ liệu, cho phép người dùng thao tác dữ liệu hầu như với mọi cách có thể. SAS có thể làm việc với nhiều file dữ liệu cùng một lúc từ đó giảm đi tính phức tạp trong chuẩn bị dữ liệu đối với những nhiệm vụ phân tích đòi hỏi phải làm việc với nhiều file dữ liệu cùng một lúc. SAS có thể quản lý những file dữ liệu khổng lồ lên đến 32.768 biến và số lượng bản ghi là rất lớn chỉ phụ thuộc vào kích cỡ của đĩa cứng.
– Đối với phân tích thống kê, sức mạnh lớn nhất của SAS có thể tìm thấy trong phân tích ANOVA, phân tích mô hình hỗn hợp và phân tích nhiều chiều. SAS có các công cụ vẽ đồ thị mạnh nhất (SAS/Graph) so với các chương trình còn lại.

* Nhược điểm:
– Mất nhiều thời gian để học và hiểu được cách quản lý dữ liệu của SAS.
– Nhiều nhiệm vụ quản lý phức tạp của nó lại được thực hiện bằng những lệnh đơn giản trong SPSS và STATA.
– Hạn chế đối với hồi qui logistic kiểu thứ tự và kiểu phạm trù (vì các lệnh này là đặc biệt khó) và các phương pháp ước lượng mạnh.
– Hỗ trợ một phần cho phân tích dữ liệu theo lược đồ mẫu, nhưng hạn chế hơn so với STATA.

2. Phần mềm STATA
STATA là một chương trình được nhiều nhà nghiên cứu ưa thích vì nó vừa dễ học có nhiều khả năng. STATA sử dụng các lệnh trực tiếp, có thể vào mỗi lệnh ở một thời điểm để thực hiện hoặc có thể soạn thảo thành một chương trình bao gồm nhiều lệnh cho một nhiệm vụ và thực hiện cùng một lúc. Thậm chí, nếu mắc lỗi trong chương trình thì có thể nhận biết và sửa chữa dễ dàng.

* Ưu điểm:
– Cho phép thực hiện các thao tác phức tạp về dữ liệu một cách dễ dàng.
– Sức mạnh lớn nhất của STATA là hồi qui (rất dễ sử dụng các công cụ đoán nhận hồi qui), hồi qui logistic (những bổ sung mới làm đơn giản hoá việc giải thích kết quả hồi qui logistic, còn hồi qui logistic thứ tự và hồi qui logistic phạm trù là rất dễ thực hiện).
– STATA cũng có nhiều phương pháp ước lượng mạnh rất dễ sử dụng, bao gồm cả hồi qui mạnh và hồi qui với sai số chuẩn mạnh, và nhiều lệnh ước lượng khác kèm theo sai số chuẩn mạnh.
– STATA cũng trội hơn về lĩnh vực phân tích dữ liệu theo lược đồ mẫu, cho khả năng áp dụng chúng trong phân tích số liệu điều tra bởi các công cụ hồi qui, hồi qui logistic, hồi qui poisson, hồi qui probit,…
– Các đồ thị STATA còn có chức năng bổ sung cho phân tích thống kê, thí dụ như có nhiều lệnh làm đơn giản hoá việc tạo ra các đồ thị chẩn đoán hồi qui.
– Cú pháp của các lệnh đồ thị là dễ sử dụng nhất trong số ba bộ chương trình và cũng là mạnh nhất. Các đồ thị STATA có chất lượng cao và chất lượng xuất bản cũng cao.

* Nhược điểm:
– STATA không có khả năng quản lý dữ liệu mạnh như SAS nhưng các lệnh quản lý dữ liệu của nó có nhiều sức mạnh, và rất đơn giản. Tuy nhiên, mỗi thời điểm STATA chỉ làm việc được với một file dữ liệu, vì vậy những nhiệm vụ xử lý cần nhiều file dữ liệu cùng một lúc đối với STATA là phức tạp hơn.
– Điểm yếu nhất của STATA là khả năng phân tích phương sai và phân tích nhiều chiều truyền thống như phân tích phương sai nhiều chiều, phân tích nhóm tổ. Ngoài ra, các đồ thị của STATA không thể chỉnh sửa bằng bộ hiệu đính đồ thị.

3. Phần mềm IBM SPSS (IBM Statistical Package for the Social Sciences)
SPSS là một bộ chương trình mà nhiều người sử dụng ưa thích do nó rất dễ sử dụng. SPSS có một giao diện giữa người và máy cho phép sử dụng các menu thả xuống để chọn các lệnh thực hiện. Khi thực hiện một phân tích chỉ đơn giản chọn thủ tục cần thiết và chọn các biến phân tích và bấm OK là có kết quả ngay trên màn hình để xem xét. SPSS cũng có một ngôn ngữ cú pháp có thể học bằng cách dán cú pháp lệnh vào cửa sổ cú pháp từ một lệnh vừa chọn và thực hiện, nhưng nói chung khá phức tạp và không trực giác. Phiên bản mới nhất hiện nay

* Ưu điểm:
– SPSS có một bộ soạn thảo dữ liệu tương tự như excel, bộ soạn thảo cho phép vào các dữ liệu và mô tả các thuộc tính của chúng, vì vậy SPSS khá dễ sử dụng.
– Sức mạnh lớn nhất của SPSS là các kỹ thuật phân tích phương sai (SPSS cho phép thực hiện nhiều loại kiểm định tác động riêng biệt) và phân tích nhiều chiều (thí dụ phân tích phương sai nhiều chiều, phân tích nhân tố, phân tích nhóm tổ).
– SPSS có một giao diện người dùng rất đơn giản để tạo ra các đồ thị và khi đã tạo được một đồ thị, nhờ giao diện này mà người sử dụng có thể tuỳ ý hiệu chỉnh đồ thị cũng như hoàn thiện chúng. Các đồ thị có chất lượng rất cao và có thể copy hoặc export vào các tài liệu khác, thí dụ như Word hoặc Powerpoint phục vụ cho việc biểu diễn số liệu nghiên cứu.

* Nhược điểm:
– Cái yếu nhất của SPSS là khả năng xử lý đối với những vấn đề ước lượng phức tạp và do đó khó đưa ra được các ước lượng sai số đối với các ước lượng này.
– SPSS cũng không hỗ trợ các công cụ phân tích dữ liệu theo lược đồ mẫu.
– SPSS không có công cụ quản lý dữ liệu thật mạnh.
– SPSS xử lý mỗi file dữ liệu ở một thời điểm và không phải là rất mạnh khi thực hiện các nhiệm vụ phân tích cần làm việc với nhiều file dữ liệu cùng một lúc. Các file dữ liệu có thể có đến 4096 biến và số lượng bản ghi chỉ bị giới hạn trong dung lượng của đĩa cứng.
– Ngôn ngữ cú pháp của SPSS phức tạp hơn so với STATA, nhưng lại có phần đơn giản hơn, ít mạnh hơn SAS.

4. Phần mềm AMOS
AMOS được viết tắt từ Analysis of Moment Structures (Phân tích cấu trúc mô măng) là phần mềm của IBM cùng với phần mềm IBM SPSS. AMOS được sử dụng để thực hiện phân tích mô hình cấu trúc tuyến tính Structural Equation Modeling (SEM). SEM cũng có những tên gọi khác như Analysis of Covariance Structures (Phân tích cấu trúc hiệp phương sai), hay Causal Modeling (mô hình nhân quả). AMOS (còn gọi là SPSS AMOS) là công cụ để xây dựng các mô hình cấu trúc (SEM) để phân tích các mô hình với độ chính xác hơn các kỹ thuật thống kê đa biến tiêu chuẩn. Điều này không thể thực hiện được nếu chỉ sử dụng phần mềm SPSS trong trường hợp mô hình có nhiều biến phụ thuộc và trung gian.

* Ưu điểm:
– Thể hiện các phân tích và chỉ số dưới dạng hình ảnh đồ họa.
– Được sử dụng để xác định, ước lượng, đánh giá, và trình bày mô hình nghiên cứu trong một giao diện trực quan để kiểm định mối quan hệ giữa các biến số giả thuyết.
– Có thể được sử dụng để phân tích CFA, kiểm định SEM, phân tích Bootstrap, phân tích đa nhóm, phân tích tác động của biến điều tiết, biến trung gian.

* Nhược điểm:
Ưu điểm cũng là nhược điểm của AMOS. Khi mô hình nghiên cứu là phức tạp, nhà nghiên cứu cần phải tạo ra nhiều hình ảnh phân tích. Đây là 1 điều vô cùng tẻ nhạt với các nhà nghiên cứu.

5. Phần mềm R
R là phần mềm (cũng gọi là ngôn ngữ lập trình R) để phân tích dữ liệu. Khác với các phần mềm trên R là một phần mềm hoàn toàn miễn phí. Tuy miễn phí, nhưng chức năng của R không thua kém các phần mềm thương mại. Tất cả những phương pháp, mô hình mà các phần mềm thương mại có thể làm được thì R cũng có thể làm được. R có lợi thế là khả năng phân tích biểu đồ tuyệt vời.

* Ưu điểm:
– Số 1 trong các phần mềm miễn phí.
– R có khả năng phân tích biểu đồ tuyệt vời mà không 1 phần mềm nào có thể so sánh.
– R gắn liền với giới học thuật, hầu hết những mô hình thống kê mới nhất đều được hỗ trợ bởi R.
– Chạy được trên nhiều hệ điều hành

* Nhược điểm:
– R sử dụng câu lệnh chứ không dùng menu. Điều này gây bất tiện với những người sử dụng ban đầu. Tuy nhiên, R lại rất phù hợp với những người nắm căn bản của toán học.
– Người dùng phải có hiểu biết sâu về kinh tế lượng, thống kê và khả năng lập trình vì trong phân tích đòi hỏi người dùng phải dùng các mã code để thực hiện các bước ước lượng và kiểm định hay phân tích các vấn đề cần thiết trong dữ liệu.

6.  Phần mềm SmartPLS (Smart Partial least squares)
Smart PLS là một ứng dụng phần mềm cho mô hình đường dẫn (đồ họa) với các biến tiềm ẩn (LVP). Phần mềm này sử dụng phương pháp tối thiểu của từng phần tử (PLS) cho phân tích LVP. SmartPLS ứng dụng cách tiếp cận phương pháp PLS trong ước lượng mô hình SEM (PLS-SEM). Với hơn 2.500 trích dẫn trong các ấn phẩm học thuật, SmartPLS là một trong những công cụ phần mềm hàng đầu trong việc ứng dụng cách tiếp cận phương pháp PLS trong ước lượng mô hình SEM (PLS-SEM).

* Ưu điểm:
– Khá đơn giản và trực quan cho người mới sử dụng.
– So với AMOS, SmartPLS tỏ ra có ưu thế hơn về sự đơn giản, trực quan, thân thiện cho người sử dụng.
– Với những người mới nghiên cứu, SmartPLS gây được ấn tượng mạnh bởi sự gọn nhẹ và trực quan so với các phần mềm cùng loại mà vẫn đảm bảo sự hiệu quả trong ước lượng mô hình.

* Nhược điểm: Phần mềm này được áp dụng với những nghiên cứu có qui mô nhỏ.

Nói tóm lại, các nhà nghiên cứu không nên quá đặt nặng việc sử dụng phần mềm nào mà nên quan tâm đến mục tiêu phân tích trước hết. Như đã trình bày ở trên, các phần mềm chỉ là công cụ phục vụ cho việc phân tích dữ liệu nghiên cứu. Các phần mềm chỉ là sự khác biệt và tiện lợi cũng như update nhanh hơn nhau thôi, do đó lựa chọn phần mềm nào phụ thuộc vào sự thuần thục của người sử dụng và khả năng hiểu rõ mô hình để thực hiện chính xác các thuật toán thống kê trong mỗi phần mềm.

TS. Lê Phước Cửu Long
Bộ môn Quản trị thông tin marketing, Khoa Thương mại điện tử & Truyền Thông

Chia sẻ