Thứ Tư, 10 tháng 9, 2014

Học SPSS Online - Phép biến đổi và thao tác trên dữ liệu

Hôm nay nhóm MBA Đại Học Bách Khoa  giới thiệu đến các bạn một số phép biến đổi và thao tác trên dữ liệu, bao gồm mã hóa lại biến, đếm, lựa chọn case, compute...


Mã hóa lại (Recode)
• Recode là công cụ dùng để mã hóa lại các giá trị trong một biến thành các giá trị mã hóa mới phù hợp với đòi hỏi của quá trình phân tích dữ liệu
• SPSS cung cấp cho ta hai loại Recode là Recode trên cùng một biến (Recode into same variables) và recode vào biến khác (Recode into different variable).
• Mã hóa lại trên cùng một biến (Recode into same variables) :Recode trên cùng một biến là mã hóa lại những giá trị trong một biến hiện hữu thành những giá trị mới và các giá trị mới này sẽ nằm ngay trong biến hiện hữu và thay thế các giá trị cũ trên biến đó.  Chọn transform/recode từ thanh menu chính. Ở đây ta lựa chọn Recode into same variable để tiến hành định lại giá trị của biến trên cùng một biến.

• Chuyển các biến cần mã hóa lại sang hộp thoại variables, nhấn thanh Old and New Values để chuyển các giá trị cũ cần thay đổi thành các giá trị mới. Ta có hộp thoại Old and New values


Ví dụ, những giá trị là 1 chúng ta sẽ chuyển tất cả thành 2.
• Old value dùng để khai báo giá trị cũ cần chuyển đổi. Giá trị cũ này có thể là một giá trị đơn lẻ(Value), một giá trị khuyết mặc định hay giá trị khuyết khai báo (System-missing or User- missing), một dãy các giá trị (Range), hoặc toàn bộ các giá trị nào đó trong biến (All other values).
• New value dùng để khai báo giá trị mới sẽ thay thế cho giá trị cũ tương ứng. Nhấn thanh Add để lưu sự chuyển đổi này. Các giá trị chuyển đổi có thể sửa chữa hoặc loại bỏ bằng cách di chuyển vệt tối đến biểu thức thể hiện sự chuyển đổi trong hộp thoại Old->New và nhấn thanh Change cho sự thay đổi hoặc Remove để loại bỏ

 Mã hóa lại vào một biến khác (Recode into different variables)
• Trong trường hợp định lại các giá trị hiện tại của một biến thành các giá trị mới trong một biến mới ta sẽ lựa chọn transform/recode/into different variable
• Chuyển tên biến cần định lại giá trị vào trong hộp thoại variables. Khai báo tên biến mới và nhãn biến mới sẽ chứa các giá trị vừa được mã hóa lại trong hộp thoại Output variable. Nhấn thanh change để xác nhận sự khái báo này. Ở đây là sẽ thay đổi , tạo thêm biến CONGVIECNEW từ biến CONGVIEC3.
• Các công cụ If và Old and New Values cũng có ý nghĩa và thao tác tương tự như trường hợp định lại giá trị cho cùng một biến, đã được đề cập ở phần trên.



Lựa chọn các quan sát (Select Cases)
• Công cụ Select Cases đưa ra một vài phương pháp cho phép ta lựa chọn ra những nhóm nhỏ các trường hợp quan sát dựa trên tiêu chuẩn hay điều kiện cụ thể
• Chọn Data/select cases từ menu, sau đó chọn điều kiện CONGVIEC1=1 như khung màu đen trong hình. Sau đó nhấn OK, kết quả là các dòng mà có giá trị CONGVIEC1 khác 1 bị gạch chéo, các dòng còn lại không bị ảnh hưởng như trong hình màu vàng. Từ lúc này, các tính toán chỉ tính trên các dòng màu vàng.


Công cụ tính toán giữa các biến (Compute)



Công cụ compute được dùng để tính toán giữa các giá trị trong các biến và kết quả sẽ được lưu giữ trong một biến mới hoặc là một biến khác sẳn có hoặc biến chứa đựng giá trị đang tính toán. Ta truy xuất công cụ compute variable từ transform trên thanh menuCông cụ tính toán giữa các biến (Compute)
• Target variable chứa đựng tên biến sẽ nhận giá trị được tính. Ta có thể khái báo kiểu và gán nhãn cho các giá trị của biến bằng cách nhấn vào thanh Type&lable.
• Ô Numeric Expression chứa đựng các biểu thức số được dùng để tính giá trị cho biến đích (biến chứa đựng giá trị mới), biểu thức này có thể dùng tên các biến sẵn có, các hằng, các toán tử và các hàm số. Chúng ta co thể soạn các biểu thức tính toán vào thẵng ô Numeric Expression, và có thể sữ dụng các công cụ được hiển thị trong hộp thoại như các phiếm (+), (-), Function,…
• Công cụ if dùng để định ra những điều kiện cần thiết kèm theo trong tính toán nếu có


Công cụ đếm (Count)



• Công cụ này được dùng để tạo ra một biến mới chứa kết quả số lần xuất hiện (số đếm) của một giá trị hay nhiều giá trị được chỉ định ra trong danh sách các biến được chọn trong ơ variables trong mỗi trường hợp. Từ menus ta chọn Transform/count within cases
• Một biến mới sẽ được tạo ra khi ta thực hiện thủ tục Count gọi là biến đích (Taget variable) sẽ chứa đựng giá trị cộng dồn mỗi khi gặp được giá trị cần đếm trong một hoặc nhiều biến đã được khai báo trước trong hộp thoại Numeric variables.

Trích dẫn một phần theo Ngô Thái Hưng
Học SPSS online ở SAI GON, liên hệ nhóm MBA
( Nhóm MBA , hotrospss@gmail.com) 

Học SPSS, các màn hình chính trong SPSS: data view,variables view, output view

Hôm nay nhóm Thạc Sĩ QTKD giới thiệu đến các bạn các thành phần cơ bản nhất của SPSS
Học SPSS phải đi từ căn bản, sau đó mới đến các phần phân tích nâng cao, như là hồi quy bội, phân tích nhân tố.


Màn hình quản lý dữ liệu (data view):
• Cột (Column): Đại diện cho biến quan sát. Mỗi cột sẽ chứa đựng tất cả các câu trả lời trong một câu hỏi được thiết kế trong bảng câu hỏi
• Hàng (Row): Đại diện cho một trường hợp quan sát (người trả lời), Ta phỏng vấn bao nhiêu người (tùy thuộc vào kích thước mẫu) thì ta sẽ có bấy nhiêu hàng. Mỗi hàng chứa đựng tất cả những câu trả lời (thông tin) của một đối tượng nghiên cứu
• Ô giao nhau giữa cột và hàng (cell): Chứa đựng một kết quả trả lời tương ứng với câu hỏi cần khảo sát (biến) và một đối tượng trả lời cụ thể (trường hợp quan sát)



Màn hình quản lý biến (variables view)
• Tên biến (name): Là tên đại diện cho biến, tên biến này sẽ được hiển thị trên đầu mỗi cột trong màn hình dữ liệu
• Loại biến (type): Thể hiện dạng dữ liệu thể hiện trong biến. Dạng số, và dạng chuỗi
• Số lượng con số hiển thị cho giá trị (Width): Giá trị dạng số được phép hiển thị bao nhiêu con số.
• Số lượng con số sau dấu phẩy được hiển thị (Decimals)
• Nhãn của biến (label): Tên biến chỉ được thể hiện tóm tắc bằng ký hiệu, nhãn của biến cho phép nêu rõ hơn về ý nghĩa của biến.
• Giá trị trong biến (Values): Cho phép khai báo các giá trị trong biến với ý nghĩa cụ thể (nhãn giá trị)
• Giá trị khuyết (Missing): Do thiết kế bảng câu hỏi có một số giá trị chỉ mang tính chất quản lý, không có ý nghĩa phân tích, để loại bỏ các biến này ta cần khai báo nó như là giá trị khuyết (user missing). SPSS mặc định giá trị khuyến (system missing) là một dấu chấm và tự động loại bỏ các giá trị này ra khỏi các phân tích thống kê.
• Kích thướt cột (columns): Cho phép khai báo độ rộng của cột
• Ví trí (align): Vị trí hiển thị các giá trị trong cột (phải, trái, giữa)
• Dạng thang đo (measures): Hiển thị dạng thang đo của giá trị trong biến



 Màn hình hiển thị kết quả (output)
• Các phép phân tích thống kê sẽ cho ra các kết quả như bảng biểu, đồ thị và các kết quả kiểm nghiệm, các kết quả này sẽ được truy xuất ra một màn hình, và được lưu giữ dưới một tập tin khác (có đuôi là .SPV). Màn hình này cho phép ta xem và lưu giữ các kết quả phân tích





Khái niệm về biến và các giá trị trong biến

 Biến là tập hợp những trả lời cho một câu hỏi.

  Phân loại biến theo số lượng câu trả lời:
• Biến một trả lời: Biến dành cho câu hỏi có một trả lời
• Biến nhiều trả lời: Các biến dành cho nhiều câu trả lời có thể có trong một câu hỏi nhiều trả lời

 Phân loại biến theo kiểu dữ liệu:

• Thang đo định danh (Nominal Scale):
Trong dạng thang đo này các con số được sử dụng đơn thuần như một giá trị xác định sự khác biệt cho các  câu trả lời, các giá trị quan sát có ý nghĩa khác biệt nhau. Đối với loại thang biểu danh các giá trị số được sử dụng như là ký số nhận dạng và không có giá trị về một thứ tự cao thấp và và độ lớn giữa các con số

• Thang đo thứ tự (Ordinal Scale): Trong dạng thang đo này dữ liệu được xắp xếp các giá trị quan sát theo một thứ tự cao thấp nhất định, nhưng không diễn tả được độ lớn giữa vị trí cao thấp giữa các con số. Tóm lại thang đó thứ tự bao gồm cả thông tin về biểu danh đồng thời cung cấp luôn mối quan hệ theo thứ tự giữa các giá trị nhưng không đo được khoảng cách giữa các giá trị đó.

• Thang đó khoảng cách (Internal Scale): Giống như đặc tính của thang đo thứ tự, tuy nhiên đối với thang đó khoảng cách cho phép ta đo được khoảng cách giữa các giá trị. Tuy nhiên do thang đo khoảng cách không xác định được điểm 0 chung (giống như thang đo nhiệt độ) do đó ta chỉ có thể nói giá trị này lớn hơn giá trị kia bao nhiêu đơn vị nhưng không thể kết luận giá trị này lớn hơn giá trị kia bao nhiêu lần.

• Thang đo tỷ lệ (ratio): Đây là thang đo có đủ các đặc tính thứ tự và khoảng cách. Ngoài ra việc xác định ra tỷ số chênh lệch giữa các giá trị là có thể thức hiện do ở thang đo này điểm 0 được xác định một cách có ý nghĩa.

Trích dẫn theo Ngô Thái Hưng
( Nhóm MBA , hotrospss@gmail.com)