170 likes | 365 Views
Bài tập 1. Kết qủa sau đây là số đo của 20 quan sát về thời gian trang điểm của phụ nữ: 34 24 10 16 52 76 33 31 46 24 18 26 57 32 25 48 22 48 29 19 Xác định giá trị trung bình và các giá trị phần tư Xác định giá trị interquartile range. Xây dựng đồ thị (modified) boxplot của dữ liệu
E N D
Bài tập 1 • Kết qủa sau đây là số đo của 20 quan sát về thời gian trang điểm của phụ nữ: 34 24 10 16 52 76 33 31 46 24 18 26 57 32 25 48 22 48 29 19 • Xác định giá trị trung bình và các giá trị phần tư • Xác định giá trị interquartile range. • Xây dựng đồ thị (modified) boxplot của dữ liệu • Vẽ biểu đồ histogram
Bài tập 2 The carbon monoxide in cigarettes is thought to be hazardous to the fetus of a pregnant woman who smokes. In a study of this theory, blood drawn from pregnant women before and after smoking a cigarette. Measurements were made of the percent of blood hemoglobin bound to carbon monoxide as carboxyhemoglobin (COHb). The results for ten women are shown the table. Blood COHb (%) Subject Before After Increase 1 1.2 7.6 6.4 2 1.4 4.0 2.6 3 1.5 5.0 3.5 4 2.4 6.3 3.9 5 3.6 5.8 2.2 6 0.5 6.0 5.5 7 2.0 6.4 4.4 8 1.5 5.0 3.5 9 1.0 4.2 3.2 10 1.7 5.2 3.5 • Calculate the mean and standard deviation of the INCREASE in COHb. • b. Calculate the mean COHb before and the mean after. Is the mean increase equal to the increase in means? • c. Construct a stem-and-leaf diagram of the increase in COHb. • Use the diagram to determine the median increase.
igf.txt data: ANOVA • Số liệu • Tên dataset: igf.txt • Tên các biến: id, age, sex, weight, height, ethnicity, igfi, igfbp3, als, pinp, ictp, p3np • Vấn đề: • Có sự khác biệt gì về igfi, igfbp3, als, pinp và p3np giữa các nhóm sắc tộc (ethnicities) hay không. • Việc làm: • Đọc igf.txt vào R • Tiến hành phân tích mô tả cho từng sex và từng ethnicity bằng biểu đồ • Phân tích phương sai (ANOVA) để giải quyết vấn đề
Histogram of weight 15 10 Frequency 5 0 40 45 50 55 60 weight
Tần số 15 10 5 0 Cân nặng 40 45 50 55 60 Hình 1.1. Đồ thị Histogram của cân nặng
insulin.txt: multiple regression analysis • Số liệu: • Tên dataset: insulin.txt • Tên các biến: id sex age bmi abd subsca supra triceps hc wc hdl ldl tc tg diast syst insulin glucose ir logir • Vấn đề: Yếu tố nào có liên quan đến ir hay logir • Việc làm: • Đọc insulin.txt vào R • Phân tích mô tả về mối liên hệ giữa các biến số • Phân tích hồi qui tuyến tính đa biến (multiple linear regression) và BMA để tìm các yếu tố liên quan.
cafe.csv: ANOVA • Số liệu: • Tên dataset: cafe.csv • Tên các biến: subject product session burnt caramel smoky earthy cigarette chocolate rottenwood woody butter vanille milky intensity • Vấn đề: Khác biệt về intensity giữa các loại cà phê (product) • Việc làm: • Đọc cafe.csv vào R • Phân tích mô tả về mối liên hệ giữa các biến số • Phân tích ANOVA.
https://docs.google.com/document/d/10Tb7O0rml472maACVWBTMtdRCUYvuw6Zmqzo3BRhOno/edit?hl=en_GB&authkey=CKP3veEKhttps://docs.google.com/document/d/10Tb7O0rml472maACVWBTMtdRCUYvuw6Zmqzo3BRhOno/edit?hl=en_GB&authkey=CKP3veEK