1 / 26

Cỡ mẫu

Cỡ mẫu. Tại sao phải tính cỡ mẫu. Một câu hỏi luôn đặt ra với nhà nghiên cứu là cần phải điều tra bao nhiêu đơn vị mẫu để nó đại diện và có thể suy rộng cho tổng thể, để phân tích có ý nghĩa và kết quả nghiên cứu có giá trị về mặt khoa học?. Làm thế nào để xác định cỡ mẫu?.

cora-briggs
Download Presentation

Cỡ mẫu

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Cỡ mẫu

  2. Tại sao phải tính cỡ mẫu • Một câu hỏi luôn đặt ra với nhà nghiên cứu là cần phải điều tra bao nhiêu đơn vị mẫu để nó đại diện và có thể suy rộng cho tổng thể, để phân tích có ý nghĩa và kết quả nghiên cứu có giá trị về mặt khoa học?

  3. Làm thế nào để xác định cỡ mẫu? • Một cách đơn giản và dễ nhất là dựa vào các nghiên cứu có cùng nội dung đã được thực hiện trước đó để lấy mẫu. • Có thể hỏi ý kiến các chuyên gia, những người có kinh nghiệm thực hiện các dự án điều tra khảo sát. • Có thể tính toán theo công thức tính mẫu.

  4. Công thức tính cỡ mẫu • Với trường hợp cỡ mẫu lớn và không biết tổng thể.

  5. Tính cỡ mẫu • Trong đó: n= là cỡ mẫu z= giá trị phân phối tương ứng với độ tin cậy lựa chọn (nếu độ tin cậy 95% thì giá trị z là 1,96…) p= là ước tính tỷ lệ % của tổng thể q = 1-p thường tỷ lệ p và q được ước tính 50%/50% đó là khả năng lớn nhất có thể xảy ra của tổng thể. e = sai số cho phép (±3%, ±4%, ±5%...)

  6. Ví dụ • Tính cỡ mẫu của một cuộc trưng cầu ý kiến trước một cuộc bầu cử với độ tin cậy là 95% với giá trị z tương ứng là 1.96, sai số cho phép là nằm trong khoảng +5%. Giả định p*q lớn nhất có thể xảy ra là 0.5*0.5. • Cỡ mẫu sẽ được tính là:

  7. Cỡ mẫu

  8. Tính cỡ mẫu

  9. Tiếp Ở đó • N = số lượng đơn vị trong tổng thể. • P = tỷ lệ tổng thể. • Q = 1-P, • k= sai số cho phép.

  10. Tính cỡ mẫu • Nếu tổng thể nhỏ và biết được tổng thể thì dùng công thức sau: Với n là cỡ mẫu, N là số lượng tổng thể, e là sai số tiêu chuẩn

  11. Ví dụ • Tính cỡ mẫu của một cuộc điều tra với Tổng thể là N= 2000, độ chính xác là 95%, sai số tiêu chuân là +- 5%. -- cỡ mẫu sẽ được tính là:

  12. Ví dụ

  13. Bảng cỡ mẫu

  14. Bảng cỡ mẫu (tiếp)

  15. Bảng cỡ mẫu (tiếp)

  16. Trọng số

  17. Trọng số • Có nhiều cuộc điều tra bạn phải sử dụng trọng số trong phân tích dữ liệu. • Trọng số này phải được tính toán. • Bạn cần phải hiểu rõ về trọng số này. • Mục đích sử dụng trọng số: đại diện cho tổng thể tốt hơn.

  18. Trọng số • Trong số được tính bằng phân số nghịch đảo của phân số chọn mẫu: • W= N/n

  19. Tại sao lại sử dụng trọng số • Chọn mẫu phân tầng không tỷ lệ. • Hiệu chỉnh với những trường hợp không trả lời điều tra. • Hiệu chỉnh với thiết kế mẫu mà xác suất lựa chọn đơn vị mẫu không ngang nhau. • Trong hậu phân tầng. • Ví dụ: Nếu đơn vị điều tra X có khả năng được lựa chọn bằng một nửa đơn vị Y có, thì đơn vị X sẽ có trọng số là 2 để có cơ hội bằng đơn vị Y.

  20. Ví dụ • Trong ví dụ về lựa chọn 100 sinh viên trong đó có 50 sinh viên dân tộc kinh và 50 sinh viên dân tộc thiểu số từ mẫu 2000 sinh viên với 100 sinh viên dân tộc thiểu số. • Như vậy sinh viên xác suất lựa chọn của sinh viên dân tộc thiểu số là ½ trong khi của dân tộc kinh là 1/38. Để phù hợp với sự phân bố tỷ lệ của tổng thể, ta phải sử dụng trọng số.

  21. Trọng số • Với ví dụ trên, thì phân tầng nhóm sinh viên dân tộc kinh sẽ có trọng số là 38 và sinh viên dân tộc thiểu số sẽ có trọng số là 2.

  22. Ví dụ • Tổng thể: 2500 hộ gia đình thuộc nhóm nghèo và 1200 hộ gia đình thuộc nhóm giàu. • Một cuộc điều tra được thực hiện với 2 phân tầng: phân tầng hộ giàu và phân tầng hộ nghèo. • Mỗi phân tầng lựa chọn 100 hộ gia đình. • Mẫu đã lựa chọn nhiều hơn so với tỷ lệ của phân tầng hộ giàu.

  23. Ví dụ • Nếu chúng ta tính trung bình thu nhập của hộ gia đình theo mẫu thì thu nhập quá cao so với thực tế. • Để ước lượng thu nhập trung bình của dân cư không bị sai lệch, chúng ta cần gia trọng khu vực hộ giàu thấp ít hơn khu vực hộ nghèo. • Việc này có thể thực hiện dễ dàng với Stata.

  24. Ví dụ. • Giả thiết rằng, trung bình thu nhập của nhóm hộ nghèo là 12000$, và của nhóm hộ giàu là 25000$. • Trung bình thu nhập không có trọng số: {100 x 12000$+100 x 25000$}/200=$18,500 • Trung bình có trọng số: - Trọng số nhóm hộ nghèo: W1= 2500/100=25 - Trọng số nhóm hộ giàu: W2= 1200/100=12 - {100 x 1200$ x 25 + 100 x 2500$ x 12}/ {100 x 25+ 100 x 12}= 16,216.20$ • Chúng ta có thể thấy rằng thực hiện gia trọng sẽ chính xác hơn so với thực tế vì trong mẫu có quá nhiều hộ thuộc phân tầng hộ giàu.

  25. Bài tập Một cuộc khảo sát các nhà đầu tư chứng khoán với số lượng là 1000 nhà đầu tư. Thu được kết quả như sau: 100 nhà đầu tư có vốn <100 triệu đồng. 300 nhà đầu tư có vốn từ 100-500tr đồng. 600 nhà đầu tư cố vốn từ 500tr trở lên.

  26. Bài tập • Khi lấy thông tin từ ủy ban chứng khoán quốc gia thì thấy tỷ lệ phân bố như sau: • 20% nhà đầu tư có vốn < 100tr đồng • 60% nhà đầu tư có vốn 100-500tr đồng. • 20% nhà đầu tư có vốn > 500tr đồng. • Hãy tính trọng số kết quả thu được để số liệu phù hợp với thực tế?

More Related