59 0 2MB
ĐẠI HỌC Y DƯỢC TP. HỒ CHÍ MINH – KHOA Y TẾ CÔNG CỘNG
HƯỚNG DẪN SỬ DỤNG STATA CƠ BẢN Học phần: Thống kê y học Huỳnh Ngọc Vân Anh Bộ môn Thống kê y học và Tin học
1
Mục tiêu:
2
Sau khi học xong bài này, học viên có khả năng:
1. Nêu được các chức năng chính của phần mềm Stata. 2. Sử dụng được chức năng nhập số liệu trực tiếp bằng phần mềm Stata. 3. Thực hiện được các thao tác tạo biến số mới, tạo nhãn, dán nhãn. 4. Thực hiện được thống kê mô tả bằng các câu lệnh sum, tab1, bysort.
1. Giới thiệu về Stata
3
1.Giới thiệu phần mềm Stata:
4
Thanh tiêu đề Thanh menu Thanh công cụ Cửa sổ variable (Cửa sổ Biến số)
Cửa sổ review (Cửa sổ lưu trữ)
Cửa sổ result (Cửa sổ kết quả) Cửa sổ command (Cửa sổ lệnh)
1.Giới thiệu phần mềm Stata:
5
Thanh menu Thanh công cụ
Thanh menu: File: Mở tập tin số liệu
Data: Xóa biến số, tạo biến mới, hiệu chỉnh số liệu Graphics: Vẽ đồ thị
Statistics: Thực hiện thống kê Window: Mở các cửa sổ của Stata
Help: Trợ giúp khi sử dụng phần mềm Stata
1.Giới thiệu phần mềm Stata: 1
2 3
4 5 6
7
8 9 10 11
6
Thanh menu Thanh công cụ
Thanh công cụ: 1. Open file: Mở tập tin 2. Save: Lưu tập tin 3. Print Results: In kết quả
4. Begin/close log: Bắt đầu/kết thúc ghi biên bản kết quả 5. Start Viewer: Bắt đầu sử dụng cửa sổ Viewer 6. Bring graph windows to Front: Đưa cửa sổ đồ họa ra trước
1.Giới thiệu phần mềm Stata: 1
2 3
4 5 6
7
8 9 10 11
7
Thanh menu Thanh công cụ
Thanh công cụ: 7. Do-file Editor: Biên soạn tập tin chương trình 8. Data Editor: Biên tập số liệu (sửa chữa, thêm bớt số liệu)
9. Data Browser: Duyệt số liệu (xem nhưng không sửa chữa) 10. Clear – more – condition: xoá lệnh more để tiếp tục chương trình 11. Break: Ngưng tập tin chương trình
1.Giới thiệu phần mềm Stata: Có 2 cách sử dụng lệnh:
1. Con trỏ chuột với giao diện đồ họa (Graphic Interface) 2. Gõ lệnh trực tiếp vào cửa sổ lệnh VD: sum tuoi, tab1 gioi
8
1.Giới thiệu phần mềm Stata: Biểu thức đại số: Biểu thức: axb
Trong Stata: di a*b
a b
di a/b
a2
di a^2
a axb=c
di sqrt(a) di a*b==c
Đúng
Sai
1 0
9
2. Lưu trữ và kết quả phân tích bằng Stata
10
2.Cách lưu và xem kết quả: 1
Chọn ổ đĩa để lưu tập tin log
2
3
Đặt tên tập tin 4
11
2.Cách lưu và xem kết quả:
12
Thông báo cho biết biên bản kết quả phân tích sẽ được lưu lại tại tập tin “C:\Users\ADMIN\Desktop\baitap.smcl”
2.Cách lưu và xem kết quả:
Xem lại biên bản Chấm dứt việc lưu kết quả đã lưu kết quả
13
3. Nhập liệu, tạo biến mới, tạo nhãn và dán nhãn bằng Stata
14
15
3.1.Nhập liệu: Hãy nhập số liệu dưới đây vào Stata: stt
ten
gioi
namsinh chieucao cannang hamax hamin
1
LHT
Nu
1968
157
50
120
80
2
HVB
Nam
1973
153
58
160
100
3
NKC
Nu
1966
166
54
140
80
4
TVT
Nam
1969
156
61
140
90
5
HTL
Nam
1967
155
48
150
100
6
NTMT Nu
1965
150
61
120
70
7
DNH
Nu
1967
152
54
120
80
8
TTT
Nam
1969
154
55
120
60
9
DVD
Nam
1958
156
54
130
80
10 TGK
Nam
1973
154
41
100
70
3.1.Nhập liệu: Hãy nhập số liệu dưới đây vào Stata:
16
3.1.Nhập liệu:
17
Đổi tên biến số:
Đổi tên biến số
3.1.Nhập liệu: Đổi tên biến số:
rename têncũ tênmới VD: rename var1 stt
18
3.1.Nhập liệu:
19
Tạo nhãn của biến số:
Tạo nhãn của biến số
label variable tênbiến nhãnbiến VD: label variable gioitinh gioi_tinh
3.1.Nhập liệu:
20
Tạo nhãn giá trị:
Tạo nhãn giá trị
1
21
3.1.Nhập liệu: Tạo nhãn giá trị:
2 3 4 5 6
22
3.1.Nhập liệu: Tạo nhãn giá trị:
7 8 9
10
3.1.Nhập liệu: Tạo nhãn giá trị:
23
Dán nhãn giá trị:
11
3.1.Nhập liệu:
24
Tạo nhãn giá trị: label define nhãn # “Nhãn 1” # “Nhãn 2”
label define gioitinh 1 Nam 0 Nu Dán nhãn giá trị: label value biếnsố nhãn
label value gioi gioitinh
3.2.Tạo biến số mới: Tạo biến số mới: 1. Tạo biến tuổi, biết rằng tuổi tính bằng cách lấy năm hiện tại (2017) – năm sinh (namsinh). 2. Tạo biến cao huyết áp, biết rằng cao huyết áp khi huyết áp tâm thu (hamax) ≥140 hoặc huyết áp tâm trương (hamin) ≥90. 3. Tạo biến béo phì, biết rằng béo phì khi chỉ số khối cơ thể (BMI) ≥23.
25
26
3.2.Tạo biến số mới: Tạo biến số mới:
1
2
4
3
5
6
3.2.Tạo biến số mới: Tạo biến số mới: 1. Tạo biến tuổi: gen biếnmới = điều kiện cho biến mới gen tuoi = 2017 - namsinh 2. Tạo biến cao huyết áp: gen cha = hamax >= 140 | hamin >=90
label define cokhong 1 Co 0 Khong label value cha cokhong
27
3.2.Tạo biến số mới: Tạo biến số mới: 3. Tạo biến béo phì: gen bmi = cannang/(chieucao/100)^2 gen beophi = bmi >=23 label value beophi cokhong
28
4. Thống kê mô tả bằng Stata
29
4.Thống kê mô tả: Hãy trả lời các câu hỏi sau: 1. Giá trị trung bình của tuổi, huyết áp tâm thu, huyết áp tâm trương, cân nặng, chiều cao, BMI là bao nhiêu? 2. Có bao nhiêu nam tham gia nghiên cứu? Bao nhiêu người bị cao huyết áp? Bao nhiêu người bị béo phì?
3. Chỉ số BMI trung bình ở những người cao huyết áp và không cao huyết áp là bao nhiêu? 4. Tỷ lệ cao huyết áp trong những người nữ là bao nhiêu? Tỷ lệ cao huyết áp trong những người nam là bao nhiêu?
30
Câu 1:
31
Giá trị trung bình của tuổi, huyết áp tâm thu, huyết áp tâm trương, cân nặng, chiều cao, BMI
là bao nhiêu? sum tuoi cannang chieucao hamax hamin bmi
32
Câu 1: 1 2
3
4
Câu 1: Biến định lượng 5
6
33
34
Câu 2: Có bao nhiêu nam tham gia nghiên cứu? Bao nhiêu người bị cao huyết áp? Bao nhiêu
người bị béo phì? tab1 gioitinh cha beophi
-> tabulation of gioitinh gioi_tinh
Freq.
Percent
Cum.
Nu Nam
4 6
40.00 60.00
40.00 100.00
Total
10
100.00
cha
Freq.
Percent
Cum.
Khong Co
6 4
60.00 40.00
60.00 100.00
Total
10
100.00
-> tabulation of cha
-> tabulation of beophi beophi
Freq.
Percent
Cum.
Khong Co
5 5
50.00 50.00
50.00 100.00
Total
10
100.00
35
Câu 2: 1 2 3 4
36
Câu 2: Biến định tính 5
6
37
Câu 3: Chỉ số BMI trung bình ở những người cao huyết áp và không cao . bysort cha: sum bmi huyết áp là bao nhiêu?
bysort cha : sum bmi -> cha = Khong Variable
Obs
Mean
bmi
6
22.23947
Variable
Obs
Mean
bmi
4
22.35455
Std. Dev. 3.294348
Min
Max
17.28791
27.11111
Min
Max
19.59646
25.06575
-> cha = Co Std. Dev. 2.970256
38
Câu 3: 1 2
3
4
39
Câu 3:
5 6 7 8
Biến phân nhóm
9
40
Câu 4:
Tỷ lệ cao huyết áp trong những người nữ là bao nhiêu? Tỷ lệ cao huyết áp trong những người nam là bao nhiêu? -> gioitinh = Nu
bysort gioi : tab1 cha
-> tabulation of cha cha
Freq.
Percent
Cum.
Khong Co
3 1
75.00 25.00
75.00 100.00
Total
4
100.00
cha
Freq.
Percent
Cum.
Khong Co
3 3
50.00 50.00
50.00 100.00
Total
6
100.00
-> gioitinh = Nam -> tabulation of cha
.
41
Câu 4: 1 2 3 4
42
Câu 4:
5
6 7
8
Biến phân nhóm
9
TÓM TẮT CÂU LỆNH THỐNG KÊ MÔ TẢ BẰNG STATA
43
Câu lệnh thống kê mô tả trong Stata: 44
− Mở
tập tin số liệu:
use “Ổ đĩa:\Folder chứa data\data.dta”, clear
use “C:\DATA\ivf.dta”, clear − Log
lưu trữ kết quả:
log using “Ổ đĩa:\Folder chứa file\file.doc”, text replace
log using “C:\DATA\ketqua.doc”, text replace − Tắt
file log: log close
Câu lệnh thống kê mô tả trong Stata: 45
− Đổi
tên biến số: rename biếncũ biếnmới
rename var2 gioitinh − Đổi
nhãn biến số:
label variabale biếnsố nhãnbiến label variabale gioitinh gioi_tinh − Tạo
nhãn giá trị:
label define nhãn # “nhãn 1” # “nhãn 2”
label define gioi 1 Nam 0 Nu
Câu lệnh thống kê mô tả trong Stata: 46
− Dán
nhãn giá trị:
label value biếnđịnhtính nhãn label value gioitinh gioi − Biến
số định lượng:
sum biếnđịnhlượng sum hamax hamin tuoi bmi − Biến
số định tính:
tab1 biếnđịnhtính tab1 gioitinh cha beophi
Câu lệnh thống kê mô tả trong Stata: 47
− Thống
kê phân tầng cho biến số định lượng:
bysort biếnphântầng : sum biếnđịnhlượng
bysort cha : sum bmi − Thống
kê phân tầng cho biến số định tính:
bysort biếnphântầng : tab1 biếnđịnhtính bysort cha : tab1 beophi