Dari
11 field numeric, yang mana saja yang distribusi datanya NORMAL dan yang mana yang distribusinya TIDAK
NORMAL.
VARIABEL
|
Mn/md/mo
|
KS
|
Skewness
|
histogram
|
QQ-p St-leaf
|
Box plot
|
KESIMPULAN
|
Umur
|
N
|
TN
|
TN
|
TN
|
TN
|
TN
|
TN-TN-TN
|
TB
|
N
|
TN
|
TN
|
TN
|
TN
|
N
|
N
|
BB
|
TN
|
TN
|
TN
|
TN
|
TN
|
N
|
TN
|
SISTOL
|
N
|
TN
|
TN
|
N
|
TN
|
TN
|
N
|
DIASTOL
|
N
|
TN
|
TN
|
TN
|
TN
|
TN
|
TN
|
HB1
|
N
|
TN
|
TN
|
TN
|
TN
|
TN
|
TN
|
HB2
|
N
|
TN
|
TN
|
N
|
N
|
TN
|
N
|
AGE
|
TN
|
TN
|
TN
|
TN
|
TN
|
TN
|
TN
|
WEIGHT
|
N
|
TN
|
TN
|
TN
|
N
|
TN
|
???
|
HEIGHT
|
TN
|
TN
|
TN
|
TN
|
TN
|
TN
|
TN
|
KALI
|
N
|
TN
|
TN
|
TN
|
TN
|
TN
|
???
|
Data
normal memiliki kurva normal dengan ciri-ciri kurva seimbang mean=median=modus.
Kalau
data ribuan kalau dibuatkan garisnya akan susah dibuatkan mean=median=modus
Tapi
jika bedanya kecil median harus ditengah berarti angkanya ditengah-tengah dan
itu sudah bias dikatakan normal.
Kalau
dibawah satu bedanya bias dianggap sama. Data yang normal itu yang bedanya
kecil.
Komentar
untuk tabel.
1. Umur
memiliki median /modus/mean yang normal karena jarak anatar media=mean=modus
tidak lebih dari satu.
Dan skewness untuk umur adalah tidak normal àsetelahdibagi
0.7 dengan 0.1 didapatkan hasil 70.
Data dikatakan berdistribusi normal bila skewness
dibagi standar error of skewnessnya berkisar antara -1,27 sampai +1,27.
2. TB
memiliki data yang berdistribusi normal karena data dikatakan berdistribusi
normal apabila mean=median=modus, atau ketiga data tersebut selisihnya kecil.
Media berada ditengah ketiga data. Median=mean=modus dari TB memiliki selisih
yang kecil sehingga data dikatakan berdistribusi normal. Dan dilihat dari
skewness dari TB setelah dibagi standar error of skewness nya hasilnya -0,6
kecil dari -1,27 maka data dikatakan tidak berdistribusi normal.
3. BB
memiliki data yang berdistribusi tidak normal karena jarak antara modus dengan mediannya
lebih dari satu yaitu dari 55 ke 50.
Alasan
kenapa KS tidak bisa dipakai untuk sampel besar H0 untuk KS berdistribusi
normal dan hanya sensitive pada sampel kecil. Karena konsep sampling adalah
makin besar sampel makin mendekati populasi dan p makin kecil maka normal.makin
besar sampel makin kecil p makin h0 ditolak.
Kurva
yang terbentuk dari data sendiri identik dengan kurva normal.
Data
atas dengan data bawah seimbang dia menyebar disekitar garis sketer.
3
KRITERIA DATA NORMAL DI BOXPLOT
1. Box rendah
2. Kakinya
pendek dan seimabng atas bawah
3. Median
ada ditengah yaitu garios yang hitam.
4. Tidak
ada data ekstrim kalau ada seimbang atas bawah yaitu angka yang ada di atas
bawah.
Kalau
data tidak normal maka dilakukan normalisasi. Yang dilakukan dengan 2 cara
1. Memissingkan
outlier / melog-kan variable . setelah dinormalisasi tetap tidak normal maka
ambil salah satu dari tindakan :
-
Uji dengan non parametric
-
Kategorikan variable lalu uji denngan
beda proporsi.
-
log adalah akar pangkat 10 dari sebuah
bilangan.
Tidak ada komentar:
Posting Komentar