370 likes | 703 Views
INTRODUCTION TO SPSS. Bố cục bài trình bày. Tổng quan về SPSS Cách mã hóa, nhập và chỉnh sửa dữ liệu Một số câu lệnh biến đổi dữ liệu Một số phép phân tích cơ bản và cách đọc kết quả Vẽ biểu đồ. I. Tổng quan về SPSS. SPSS là gì? Ứng dụng của SPSS Cách mở, tạo và lưu file SPSS
E N D
Bố cục bài trình bày • Tổng quan về SPSS • Cách mã hóa, nhập và chỉnh sửa dữ liệu • Một số câu lệnh biến đổi dữ liệu • Một số phép phân tích cơ bản và cách đọc kết quả • Vẽ biểu đồ
I. Tổng quan về SPSS • SPSS là gì? • Ứng dụng của SPSS • Cách mở, tạo và lưu file SPSS • Cửa sổ Variable View, Data View
SPSS là gì? • SPSS là tên viết tắt của “Statistical Product and Service Solutions” • Năm 1968, Norman H. Nie, C. Hadlai (Tex) Hull và Dale H. Bent đã phát triển SPSS • Hiện nay, SPSS là một trong những phần mềm phân tích số liệu phổ biến và mạnh nhất với trên 250.000 khách hàng trên toàn thế giới
1.2. Ứng dụng của SPSS • SPSS giúp lưu trữ và quản lý dữ liệu • SPSS là công cụ hữu hiệu để thực hiện phân tích các số liệu trong khoa học xã hội, khoa học tự nhiên và kinh tế. • SPSS có thể đọc được các file dữ liệu dạng .xls, .txt, .dat, …
1.3. Cách mở, tạo và lưu file SPSS • Mở file SPSS: File Open Data… • Tạo file SPSS: File Open New Data • Lưu file SPSS: File Save as…
1.4. Cửa sổ Variable View, Data View • Cửa sổ Variable View: • Sử dụng cửa sổ Variable View: Chọn Variable View tab • Biểu diễn các thông tin về biến như tên biến, dạng biến, các giá trị, thang đo • Dùng để mã hóa biến • Các dòng là các biến số • Các cột là các thuộc tính của biến số: ví dụ: tên biến, nhãn biến, kiểu dữ liệu • Có thể chỉnh sửa trực tiếp vào cửa sổ này
1.4. Cửa sổ Variable View, Data View • Cửa sổ Data View: • Sử dụng cửa sổ Data View: Chọn Data View tab • Biểu diễn dữ liệu • Dùng để nhập, chỉnh sửa dữ liệu • Các dòng là các trường hợp. Mỗi dòng thể hiện số liệu của một quan sát hay một bảng hỏi • Các cột là các biến số. Mỗi dòng thể hiện một biến số hay một đặc điểm được đo lường • Các ô là các giá trị. Mỗi ô chứa một giá trị của một biến số của một quan sát • Có thể chỉnh sửa trực tiếp vào cửa sổ này
1.5. Thanh Menu Bar • File: thực hiện các chức năng với file như mở, đọc, lưu file,… • Edit: thực hiện các chức năng chỉnh sửa file: copy, paste, tìm kiếm và thay thế • View: có thể thay đổi hình thức hiển thị của dữ liệu. Chức năng phố biến nhất là Value Labels • Data: các chức năng định dạng, nhập dữ liệu: sắp xếp, trộn, đặt điều kiện • Transform: thay đổi dạng dữ liệu có sẵn bằng lệnh mã hóa lại biến, tính toán,… • Analyze: thực hiện tất cả các phép phân tích đối với các biến số • Graphs: vẽ biểu đồ • Help: Trợ giúp
2.1. Các loại câu hỏi • Có nhiều tiêu chí phân chia các loại câu hỏi • Một số dạng câu hỏi cần chú ý khi sử dụng SPSS: • Câu hỏi đóng: câu hỏi đã được cho sẵn phương án trả lời • Câu hỏi lựa chọn: chỉ được chọn 1 phương án trả lời duy nhất • Câu hỏi tùy chọn: được chọn nhiều phương án trả lời • Câu hỏi mở: cho phép người trả lời tự do cung cấp thông tin
Cách mã hóa một số loại câu hỏi • Đối với câu hỏi lựa chọn: mã hóa thành một biến với nhiều phương án trả lời (giá trị) • Đối với câu hỏi tùy chọn: mã hóa mỗi lựa chọn thành từng biến (từng câu hỏi nhỏ) với các giá trị cho sẵn • Đối với câu hỏi mở: mã hóa thành biến trong đó phương án trả lời do người nhập ghi theo bảng hỏi
2.2. Mã hóa bảng hỏi • Bảng hỏi được mã hóa vào cửa sổ Variable View • Khi mã hóa bảng hỏi cần chú ý các yếu tố sau: • Đặt tên biến (Name) • Kiểu dữ liệu (Type) • Độ dài (Width) • Phần thập phân (Decimals) • Nhãn biến (Label) • Giá trị (Values) • Giá trị khuyết thiếu (Missing) • Thang đo (Measure)
Đặt tên biến (Name) • Tên biến được nhập trực tiếp vào ô “Name” ở cửa sổ Variable View • Các yêu cầu của tên biến: • Không quá 64 ký tự • Tên biến phải bắt đầu bằng một chữ cái, các ký tự sau đó có thể là bất kỳ chữ số tự nhiên, số La Mã, dấu chấm, hoặc các ký tự đặc biệt như @, $, _ , # • Không được để dấu cách hoặc các ký tự đặc biệt (? ! ‘ và *) trong tên biến
Các yêu cầu của tên biến • Tên biến không được phép trùng lặp • Tên biến không được kết thúc bằng dấu chấm câu • Tên biến không nên kết thúc bằng dấu gạch dưới • Tên biến có thể dùng chữ hoa hoặc chữ thường hoặc cả hai tùy theo mục đích của người sử dụng • Tên biến thường được đặt theo số câu trong bảng hỏi
Các kiểu dữ liệu (Type) • Các kiểu dữ liệu cơ bản: • Dữ liệu kiểu số (numeric): • Sử dụng các số đếm • Xuất hiện trong các câu hỏi đóng và các câu hỏi mở dùng biến liên tục • Dữ liệu kiểu chữ (string): • Sử dụng các chữ cái • Thường xuất hiện trong câu hỏi mở về ý kiến của người trả lời • Các kiểu dữ liệu khác: số thập phân, ngày tháng,… • Tất cả các biến đều được giả định là dữ liệu kiểu số. Người sử dụng có thể vào Type để thay đổi kiểu dữ liệu
Độ dài của biến và phần thập phân • Độ dài của biến (Width): • Quy định độ dài của các biến số được phép nhập vào file SPSS. • Tùy thuộc vào độ dài của biến số mà đặt width cho phù hợp • Phần thập phân (Decimals): • Quy định phần thập phân được nhập vào file SPSS • Phần thập phân được mặc định là 2 (0,00) • Đối với các biến dạng chữ, phần thập phân được mặc định là 0
Nhãn biến (Label) • Cụ thể hóa thông tin về biến số • Được nhập trực tiếp vào cửa sổ Variable View • Có thể gõ không dấu hoặc gõ tiếng Việt • Độ dài: tối đa là 256 ký tự • Nhãn biến có thể sử dụng dấu cách và một số ký tự đặc biệt không được sử dụng ở tên biến • Các quy tắc đặt nhãn biến: • Tóm tắt ngắn gọn, đầy đủ nội dung câu hỏi • Lựa chọn những từ khóa quan trọng
Giá trị (Values) • Dùng để mô tả các giá trị của biến số (các phương án trả lời của câu hỏi) • Độ dài tên giá trị không quá 60 ký tự • Không thể đặt giá trị cho những biến kiểu chữ dài hơn 8 ký tự
Giá trị khuyết thiếu (Missing) • Missing là các giá trị khuyết thiếu trong bảng hỏi • Các loại missing: 2 loại • Missing system: • Là missing do các bước nhảy trong bảng hỏi hoặc do người được hỏi không trả lời • Khi nhập số liệu, missing hệ thống thường được bỏ trống • Missing user – define: • Là missing người điều tra tự đặt do phương án trả lời của người trả lời không phù hợp với thông tin mà người điều tra mong muốn • Được gán cho một giá trị nào đó.
Giá trị khuyết thiếu (Missing) • Missing có thể là bất kỳ giá trị nào do người sử dụng tự đặt • Đối với các biến liên tục, missing thường được gán giá trị âm hoặc bỏ trống. Ví dụ: tuổi, thu nhập,… • Không thể gán giá trị missing cho dữ liệu kiểu chữ dài hơn 8 ký tự • Có thể quy định tối đa 3 giá trị missing độc lập cho một biến số
Giá trị khuyết thiếu (Missing) • Đối với các dữ liệu kiểu số: có thể quy định giá trị missing trong một khoảng giá trị nào đó • Đối với dữ liệu kiểu chữ không quá 8 ký tự, tất cả các chữ hoặc các ô trống đều được coi là có giá trị nếu không định nghĩa đó là giá trị missing. Để định nghĩa đó là giá trị missing, gõ một dấu cách (a single pace) trong bất kỳ ô nào ở Discrete missing values
Các loại thang đo (Measure) • Có 4 loại thang đo cơ bản: thang định danh, thang khoảng, thang thứ bậc, thang tỷ lệ • Trong SPSS: có 3 loại thang đo: thang định danh, thang thứ bậc, thang tỷ lệ (thang khoảng + thang tỷ lệ)
Các loại thang đo trong SPSS • Thang tỷ lệ: • Các giá trị được sắp xếp theo một trật tự thứ bậc • Các giá trị phải là các chữ số theo dạng khoảng hoặc dạng tỷ lệ • Ví dụ: tuổi, thu nhập,… • Thang thứ bậc: • Các giá trị được sắp xếp theo một trật tự thứ bậc Ví dụ: Cao –Trung bình - Thấp • Có thể sử dụng các biến dạng chữ hoặc dạng số cho thang thứ bậc nhưng dữ liệu dạng số được dùng phổ biến hơn. • Đối với các thang thứ bậc dạng chữ, trật tự các chữ cái được giả định là phản ánh một trật tự giữa các hạng • Thang định danh: • Các giá trị của thang không thể hiện trật tự thứ bậc • Ví dụ: 1 = nam; 2 = nữ • Có thể sử dụng dữ liệu dạng số hoặc dạng chữ
Một số nguyên tắc chọn lựa thang đo trong SPSS • Dữ liệu kiểu chữ được xếp vào thang định danh • Dữ liệu kiểu chữ hoặc kiểu số được gán sẵn cho giá trị được xếp vào thang thứ bậc • Biến liên tục có ít hơn 24 số hạng được xếp vào thang thứ bậc • Biến liên tục có nhiều hơn 24 số hạng được xếp vào thang tỷ lệ (24 số hạng này là mặc định nhưng vẫn có thể thay đổi tùy theo chủ ý của người sử dụng: Edit Option Interative)
3. Cách nhập và chỉnh sửa dữ liệu • Cách nhập dữ liệu: • Chọn cửa sổ Data View • Dữ liệu được nhập trực tiếp vào cửa sổ Data View • Sử dụng Value Labels: xem giá trị khi nhập • Chỉnh sửa dữ liệu nhập sai: • Sửa trực tiếp vào ô chứa giá trị nhập sai tại cửa sổ Data View
Chèn thêm biến, trường • Chèn biến mới: chọn Insert Variable Data Insert Variable • Chèn thêm trường: chọn Insert Cases Data Insert Cases
Bài tập 1 • Mã hóa bảng hỏi stock • Chèn thêm biến, trường
3.1. Sort Cases • Tác dụng: dùng để sắp xếp các giá trị của một biến theo trật tự tăng hoặc giảm • Câu lệnh: Data Sort Cases
3.2. Merge Files • Tác dụng: nối các file SPSS thành một file tổng hợp • Có 2 cách: nối thêm trường (cases) hoặc nối thêm biến (variables). • Yêu cầu: • Nối thêm biến, giữa các file cần có một biến chung và biến này phải được sort theo cùng một trật tự • Nối thêm trường: các file phải chung bảng mã hóa • Câu lệnh: Data Merge Files
Bài tập • Merge cases • Merge variables