Selasa, 15 Januari 2013

lagi lagi tugas



DISTRIBUSI FREKUENSI
PENGANTAR STATISTIK

logo_gunadarma


OLEH :
SHINTIA ERIVAWATI (A1A111012)
DOSEN PENGAMPU : FACHRUDDIANSYAH. M. S.Pd. M.Pd

PENDIDIKAN EKONOMI
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS JAMBI
2012/2013

DISTRIBUSI FREKUENSI
Bottom of Form


Pada saat kita dihadapkan pada sekumpulan data yang banyak, seringkali membantu untuk mengatur dan merangkum data tersebut dengan membuat tabel yang berisi daftar nilai data yang mungkin berbeda (baik secara individu atau berdasarkan pengelompokkan) bersama dengan frekuensi yang sesuai, yang mewakili berapa kali nilai-nilai tersebut terjadi. Daftar sebaran nilai data tersebut dinamakan dengan Daftar Frekuensi atau Sebaran Frekuensi (Distribusi Frekuensi).
Dengan demikian, distribusi frekuensi adalah daftar nilai data (bisa nilai individual atau nilai data yang sudah dikelompokkan ke dalam selang interval tertentu) yang disertai dengan nilai frekuensi yang sesuai.
Daftar distribusi frekuensi adalah suatu cara mengorganisasikan data dengan membagi data ke dalam beberapa kelompok atau kelas. Dalam daftar ini, dicatat berapa banyaknya data, atau frekuensi , yang ada dalam masing-masing kelas. Berdasarkan panjang kelasnya, daftar distribusi frekuensi terbagi menjadi dua jenis, yaitu
Daftar Distribusi Frekuensi Data Tunggal
Dalam distribusi frekuensi data tunggal, setiap kelas hanya terdiri dari 1 data. Hal ini dapat dilakukan jika data yang kita peroleh tidak terlalu banyak. Misalnya kita mendata jumlah mobil yang dimiliki teman-teman satu kelas dan kita memperoleh Xmaks = 5 dan Xmin = 0. Data pada contoh tadi memungkinkan untuk digambarkan dengan daftar distribusi data tunggal .


Daftar Distribusi Frekuensi Data Berkelompok
Pertama, yang harus kita lakukan adalah melihat rentangan atau jangkauan dari data semula. Kemudian data tersebut kita bagi dalam kelompok-kelompok yang disebut kelas interval. Lalu kita mencatat jumlah dta yang ada dalm setiap kelompok.
Biasanya banyak kelas antara 5 – 15. Namun berapakah ukuran kelas yang tepat untuk setiap data berkelompok yang kita miliki? Terdapat 2 pedoman yang bisa kita gunakan, yaitu aturan Sturges dan aturan bahwa panjang kelas haruslah sama.
Aturan Sturges
Aturan panjang kelas atau interval selalu sama
Beberapa istilah dalam daftar distribusi berkelompok
Batas kelas
Batas kelas bawah: nilai terkecil pada kelas interval
Batas kelas atas: nilai terbesar pada kelas interval
Limit kelas
Limit/tepi kelas bawah (Tb) diperoleh dengan mengurangi setengah satuan dari batas kelas bawah. Sedangkan limit/tepi kelas atas (Ta) diperoleh dengan mengurangi setengah satuan dari batas kelas atas.
Panjang kelas
Panjang kelas merupakan limit kelas atas dikurangi dengan limit kelas bawah. Misalkan, c merupakan panjang kelas, maka
c = Ta - Tb
Titik tengah kelas
T          itik tengah kelas didapatkan dengan mencari rataan batas kelas atas dan batas kelas bawah, atau dengan kata lain
½ (batas kelas bawah + batas kelas atas)
Titik tengah dianggap sebagai nilai yang mewakili suatu kelas interval
contoh:

Pengelompokkan data ke dalam beberapa kelas dimaksudkan agar ciri-ciri penting data tersebut dapat segera terlihat. Daftar frekuensi ini akan memberikan gambaran yang khas tentang bagaimana keragaman data. Sifat keragaman data sangat penting untuk diketahui, karena dalam pengujian-pengujian statistik selanjutnya kita harus selalu memperhatikan sifat dari keragaman data. Tanpa memperhatikan sifat keragaman data, penarikan suatu kesimpulan pada umumnya tidaklah sah.
Sebagai contoh, perhatikan contoh data pada Tabel 1. Tabel tersebut adalah daftar nilai ujian Matakuliah Statistik dari 80 Mahasiswa (Sudjana, 19xx).
Tabel 1. Daftar Nilai Ujian Matakuliah Statistik
79
49
48
74
81
98
87
80
80
84
90
70
91
93
82
78
70
71
92
38
56
81
74
73
68
72
85
51
65
93
83
86
90
35
83
73
74
43
86
88
92
93
76
71
90
72
67
75
80
91
61
72
97
91
88
81
70
74
99
95
80
59
71
77
63
60
83
82
60
67
89
63
76
63
88
70
66
88
79
75









Sangatlah sulit untuk menarik suatu kesimpulan dari daftar data tersebut. Secara sepintas, kita belum bisa menentukan berapa nilai ujian terkecil atau terbesar. Demikian pula, kita belum bisa mengetahui dengan tepat, berapa nilai ujian yang paling banyak atau berapa banyak mahasiswa yang mendapatkan nilai tertentu. Dengan demikian, kita harus mengolah data tersebut terlebih dulu agar dapat memberikan gambaran atau keterangan yang lebih baik.
Bandingkan dengan tabel yang sudah disusun dalam bentuk daftar frekuensi (Tabel 2a dan Tabel 2b). Tabel 2a merupakan daftar frekuensi dari data tunggal dan Tabel 2b merupakan daftar frekuensi yang disusun dari data yang sudah di kelompokkan pada kelas yang sesuai dengan selangnya. Kita bisa memperoleh beberapa informasi atau karakteristik dari data nilai ujian mahasiswa.

Tabel 2a.
No
Nilai Ujian
Frekuensi

xi
fi
1
35
1
2
36
0
3
37
0
4
38
1
:
:
:
16
70
4
17
71
3
:
:
1
42
98
1
43
99
1

Total
80
Pada Tabel 2a, kita bisa mengetahui bahwa ada 80 mahasiswa yang mengikuti ujian, nilai ujian terkecil adalah 35 dan tertinggi adalah 99. Nilai 70 merupakan nilai yang paling banyak diperoleh oleh mahasiswa, yaitu ada 4 orang, atau kita juga bisa mengatakan ada 4 mahasiswa yang memperoleh nilai 70, tidak ada satu pun mahasiswa yang mendapatkan nilai 36, atau hanya satu orang mahasiswa yang mendapatkan nilai 35.
Tabel 2b.
Kelas ke-
Nilai Ujian
Frekuensi fi
1
31 – 40
2
2
41 – 50
3
3
51 – 60
5
4
61 – 70
13
5
71 – 80
24
6
81 – 90
21
7
91 – 100
12

Jumlah
80
Tabel 2b merupakan daftar frekuensi dari data yang sudah dikelompokkan. Daftar ini merupakan daftar frekuensi yang sering digunakan. Kita sering kali mengelompokkan data contoh ke dalam selang-selang tertentu agar memperoleh gambaran yang lebih baik mengenai karakteristik dari data. Dari daftar tersebut, kita bisa mengetahui bahwa mahasiswa yang mengikuti ujian ada 80, selang kelas nilai yang paling banyak diperoleh oleh mahasiswa adalah sekitar 71 sampai 80, yaitu ada 24 orang, dan seterusnya. Hanya saja perlu diingat bahwa dengan cara ini kita bisa kehilangan identitas dari data aslinya. Sebagai contoh, kita bisa mengetahui bahwa ada 2 orang yang mendapatkan nilai antara 31 sampai 40. Meskipun demikian, kita tidak akan tahu dengan persis, berapa nilai sebenarnya dari 2 orang mahasiswa tersebut, apakah 31 apakah 32 atau 36 dst.
Ada beberapa istilah yang harus dipahami terlebih dahulu dalam menyusun daftar frekuensi.
Tabel 3.
Kelas ke-
Selang
Nilai Ujian
Batas Kelas
Nilai Kelas
(xi)
Frekuensi
(fi)
1
31 – 40
30.5 – 40.5
35.5
2
2
41 – 50
40.5 – 50.5
45.5
3
3
51 – 60
50.5 – 60.5
55.5
5
4
61 – 70
60.5 – 70.5
65.5
13
5
71 – 80
70.5 – 80.5
75.5
24
6
81 – 90
80.5 – 90.5
85.5
21
7
91 – 100
90.5 – 100.5
95.5
12

Jumlah


80
Range : Selisih antara nilai tertinggi dan terendah. Pada contoh ujian di atas, Range = 99 – 35 = 64
Batas bawah kelas: Nilai terkecil yang berada pada setiap kelas. (Contoh: Pada Tabel 3 di atas, batas bawah kelasnya adalah 31, 41, 51, 61, …, 91)
Batas atas kelas: Nilai terbesar yang berada pada setiap kelas. (Contoh: Pada Tabel 3 di atas, batas bawah kelasnya adalah 40, 50, 60, …, 100)
Batas kelas (Class boundary): Nilai yang digunakan untuk memisahkan antar kelas, tapi tanpa adanya jarak antara batas atas kelas dengan batas bawah kelas berikutnya. Contoh: Pada kelas ke-1, batas kelas terkecilnya yaitu 30.5 dan terbesar 40.5. Pada kelas ke-2, batas kelasnya yaitu 40.5 dan 50.5. Nilai pada batas atas kelas ke-1 (40.5) sama dengan dan merupakan nilai batas bawah bagi kelas ke-2 (40.5). Batas kelas selalu dinyatakan dengan jumlah digit satu desimal lebih banyak daripada data pengamatan asalnya. Hal ini dilakukan untuk menjamin tidak ada nilai pengamatan yang jatuh tepat pada batas kelasnya, sehingga menghindarkan keraguan pada kelas mana data tersebut harus ditempatkan. Contoh: bila batas kelas di buat seperti ini:
Kelas ke-1 : 30 – 40
Kelas ke-2 : 40 – 50 dst
Apabila ada nilai ujian dengan angka 40, apakah harus ditempatkan pada kelas-1 ataukah kelas ke-2?
Panjang/lebar kelas (selang kelas): Selisih antara dua nilai batas bawah kelas yang berurutan atau selisih antara dua nilai batas atas kelas yang berurutan atau selisih antara nilai terbesar dan terkecil batas kelas bagi kelas yang bersangkutan. Biasanya lebar kelas tersebut memiliki lebar yang sama. Contoh:
lebar kelas = 41 – 31 = 10 (selisih antara 2 batas bawah kelas yang berurutan) atau
lebar kelas = 50 – 40 = 10 (selisih antara 2 batas atas kelas yang berurutan) atau
lebar kelas = 40.5 – 30.5 = 10. (selisih antara nilai terbesar dan terkecil batas kelas pada kelas ke-1)
Nilai tengah kelas: Nilai kelas merupakan nilai tengah dari kelas yang bersangkutan yang diperoleh dengan formula berikut: ½ (batas atas kelas+batas bawah kelas). Nilai ini yang dijadikan pewakil dari selang kelas tertentu untuk perhitungan analisis statistik selanjutnya. Contoh: Nilai kelas ke-1 adalah ½(31+40) = 35.5
Banyak kelas: Sudah jelas! Pada tabel ada 7 kelas.
Frekuensi kelas: Banyaknya kejadian (nilai) yang muncul pada selang kelas tertentu. Contoh, pada kelas ke-1, frekuensinya = 2. Nilai frekuensi = 2 karena pada selang antara 30.5 – 40.5, hanya ada 2 angka yang muncul, yaitu nilai ujian 31 dan 38.
Teknik pembuatan Tabel Distribusi Frekuensi (TDF)
  • kumpulan data yang besar dapat diringkas
  • kita dapat memperoleh beberapa gambaran mengenai karakteristik data, dan
  • merupakan dasar dalam pembuatan grafik penting (seperti histogram).
Langkah-langkah dalam menyusun tabel distribusi frekuensi:
  • Urutkan data, biasanya diurutkan dari nilai yang paling kecil
    • Tujuannya agar range data diketahui dan mempermudah penghitungan frekuensi tiap kelas!
  • Tentukan range (rentang atau jangkauan)
    • Range = nilai maksimum – nilai minimum
  • Tentukan banyak kelas yang diinginkan. Jangan terlalu banyak/sedikit, berkisar antara 5 dan 20, tergantung dari banyak dan sebaran datanya.
    • Aturan Sturges:
    • Banyak kelas = 1 + 3.3 log n, dimana n = banyaknya data
  • Tentukan panjang/lebar kelas interval (p)
    • Panjang kelas (p) = [rentang]/[banyak kelas]
  • Tentukan nilai ujung bawah kelas interval pertama
Pada saat menyusun TDF, pastikan bahwa kelas tidak tumpang tindih sehingga setiap nilai-nilai pengamatan harus masuk tepat ke dalam satu kelas. Pastikan juga bahwa tidak akan ada data pengamatan yang tertinggal (tidak dapat dimasukkan ke dalam kelas tertentu). Cobalah untuk menggunakan lebar yang sama untuk semua kelas, meskipun kadang-kadang tidak mungkin untuk menghindari interval terbuka, seperti ” ≥ 91 ” (91 atau lebih). Mungkin juga ada kelas tertentu dengan frekuensi nol.

Tabel berikut merupakan tabel yang sudah dilengkapi

Kelas ke-
Nilai Ujian
Batas Kelas
Frekuensi
(fi)
1
31 – 40
30.5 – 40.5
2
2
41 – 50
40.5 – 50.5
3
3
51 – 60
50.5 – 60.5
5
4
61 – 70
60.5 – 70.5
13
5
71 – 80
70.5 – 80.5
24
6
81 – 90
80.5 – 90.5
21
7
91 – 100
90.5 – 100.5
12

Jumlah

80
Distribusi Frekuensi Relatif dan Kumulatif
Variasi penting dari distribusi frekuensi dasar adalah dengan menggunakan nilai frekuensi relatifnya, yang disusun dengan membagi frekuensi setiap kelas dengan total dari semua frekuensi (banyaknya data). Sebuah distribusi frekuensi relatif mencakup batas-batas kelas yang sama seperti TDF, tetapi frekuensi yang digunakan bukan frekuensi aktual melainkan frekuensi relatif. Frekuensi relatif kadang-kadang dinyatakan sebagai persen.
Frekuensi relatif = \dfrac{{{f_i}}}{{\sum {f_i}}} \times 100\% = \dfrac{{{f_i}}}{n} \times 100\%
Contoh: frekuensi relatif kelas ke-1:
fi = 2; n = 80
Frekuensi relatif = 2/80 x 100% = 2.5%
Kelas ke-
Nilai Ujian
Frekuensi relatif (%)
1
31 – 40
2.50
2
41 – 50
3.75
3
51 – 60
6.25
4
61 – 70
16.25
5
71 – 80
30.00
6
81 – 90
26.25
7
91 – 100
15.00

Jumlah
100.00
Distribusi Frekuensi kumulatif
Variasi lain dari distribusi frekuensi standar adalah frekuensi kumulatif. Frekuensi kumulatif untuk suatu kelas adalah nilai frekuensi untuk kelas tersebut ditambah dengan jumlah frekuensi semua kelas sebelumnya.
Perhatikan bahwa kolom frekuensi selain label headernya diganti dengan frekuensi kumulatif kurang dari, batas-batas kelas diganti dengan “kurang dari” ekspresi yang menggambarkan kisaran nilai-nilai baru.
Nilai Ujian
Frekuensi kumulatif kurang dari
kurang dari 30.5
0
kurang dari 40.5
2
kurang dari 50.5
5
kurang dari 60.5
10
kurang dari 70.5
23
kurang dari 80.5
47
kurang dari 90.5
68
kurang dari 100.5
80
atau kadang disusun dalam bentuk seperti ini:
Nilai Ujian
Frekuensi kumulatif kurang dari
kurang dari 41
2
kurang dari 51
5
kurang dari 61
10
kurang dari 71
23
kurang dari 81
47
kurang dari 91
68
kurang dari 101
80
Variasi lain adalah Frekuensi kumulatif lebih dari. Prinsipnya hampir sama dengan prosedur di atas.



UKURAN PEMUSATAN
PEMUSATAN ITENDENSI
Mean, Median, Modus sama-sama merupakan ukuran pemusatan data yang termasuk kedalam analisis statistika deskriptif. Namun, ketiganya memiliki kelebihan dan kekurangannya masing-masing dalam menerangkan suatu ukuran pemusatan data. Untuk tahu kegunaannya masing-masing dan kapan kita mempergunakannya, perlu diketahui terlebih dahulu pengertian analisis statistika deskriptif dan ukuran pemusatan data.
Mean
Mean adalah nilai rata-rata dari beberapa buah data. Nilai mean dapat ditentukan dengan membagi jumlah data dengan banyaknya data.Mean (rata-rata) merupakan suatu ukuran pemusatan data. Mean suatu data juga merupakan statistik karena mampu menggambarkan bahwa data tersebut berada pada kisaran mean data tersebut. Mean tidak dapat digunakan sebagai ukuran pemusatan untuk jenis data nominal dan ordinal. Rata-rata hitung atau mean memiliki perhitungan dengan cara membagi jumlah nilai data dengan banyaknya data. Rata-rata hitung disebut dengan mean
 Rumus Mean dari Data Tunggal  




Rumus Mean Untuk Data yang Disajikan Dalam Distribusi Frekuensi.


Dengan : fixi = frekuensi untuk nilai xi yang bersesuaian
xi = data ke-i

 Rumus Mean Gabungan

 
Median
Median menentukan letak tengah data setelah data disusun menurut urutan  nilainya. Bisa juga nilai tengah dari data-data yang terurut. Simbol untuk median adalah Me.  Dengan median Me, maka 50% dari banyak data nilainya paling tinggi sama dengan Me, dan 50% dari banyak data nilainya paling rendah sama dengan Me. Dalam  mencari median, dibedakan  untuk banyak data ganjil  dan banyak data genap.  Untuk  banyak data ganjil, setelah data disusun menurut nilainya, maka median Me adalah data yang terletak tepat di tengah. Median bisa dihitung menggunakan rumus sebagai berikut:
 Data yang belum dikelompokkan Untuk mencari nilai median, data harus dikelompokan terlebih dahulu dari yang terkecil sampai yang terbesar. 



Rumus Data yang Dikelompokkan


Dengan : Qj = Kuartil ke-j
j = 1, 2, 3
i = Interval kelas
Lj = Tepi bawah kelas Qj
fk = Frekuensi kumulatif sebelum kelas Qj
f = Frekuensi kelas Qj
n = Banyak data

 Modus
Modus adalah nilai yang sering muncul. Jika kita tertarik pada data frekuensi, jumlah dari suatu nilai dari kumpulan data, maka kita menggunakan modus. Modus sangat baik bila digunakan untuk data yang memiliki sekala kategorik yaitu nominal atau ordinal.
Sedangkan data ordinal adalah data kategorik yang bisa diurutkan, misalnya kita menanyakan kepada 100 orang tentang kebiasaan untuk mencuci kaki sebelum tidur, dengan pilihan jawaban: selalu (5), sering (4), kadang-kadang(3), jarang (2), tidak pernah (1). Apabila kita ingin melihat ukuran pemusatannya lebih baik menggunakan modus yaitu yaitu jawaban yang paling banyak dipilih, misalnya sering (2). Berarti sebagian besar orang dari 100 orang yang ditanyakan menjawab sering mencuci kaki sebelum tidur. Inilah cara menghitung modus:
  1.  Data yang belum dikelompokkan
Modus dari data yang belum dikelompokkan adalah ukuran yang memiliki frekuensi tertinggi. Modus dilambangkan mo.
  1. Data yang telah dikelompokkan
Rumus Modus dari data yang telah dikelompokkan dihitung dengan rumus:


Dengan : Mo = Modus
L = Tepi bawah kelas yang memiliki frekuensi tertinggi (kelas modus) i = Interval kelas
b1 = Frekuensi kelas modus dikurangi frekuensi kelas interval terdekat sebelumnya
b2 = frekuensi kelas modus dikurangi frekuensi kelas interval terdekat sesudahnya


Kuartil
Selain ketiga ukuran pemusatan data di atas, terdapat beberapa ukuran pemusatan lagi. Salah satunya adalah kuartil. Kuartil adalah nilai ukuran yang membagi data yang sudah terurut menjadi empat bagian yang sama. Contoh suatu data terurut seperti berikut.
Gambar:32.jpg
Data yang terdapat pada batas pengelompokan pertamadisebut kuartil bawah (Q1), batas pengelompokan kedua disebut kuartil tengah (Q2), dan batas pengelompokan ketiga disebut kuartil atas (Q3).
Untuk menentukan nilai-nilai kuartil, kita tentukan nilai kuartil tengah (Q2) terlebih dahulu. Nilai Q2 adalah median dari data tersebut. Selanjutnya, seluruh data yang berada di sebelah kiri Q2, digunakan untuk mencari Q1. Nilai Q1 adalah median dari data sebelah kiri Q2, sedangkan Q3 adalah median dari seluruh data di sebelah kanan Q2 Selain dengan cara di atas, nilai kuartil dapat ditentukan dengan menggunakan rumus berikut.
Gambar:33.jpg


Untuk menentukan nilai kuartil perlu diperhatikan langkah-langkah berikut, yaitu :
1. Susun data tersebut menurut nilainya,
2. Tentukan letak kuartil, dan
3. Tentukan nilai kuartil

Desil
Jika kelompok suatu data dapat dibagi menjadi 10 bagian yang sama didapat 9 pembagi dan tiap pembagi disebut desil. Desil adalah nilai-nilai yang membagi segugus pengamatan menjadi 10 bagian yang sama. Nilai-nilai pembaginya ada 9, dilambangkan dengan D1, D2, …, D9, mempunyai sifat bahwa 10% datajatuh di bawah D1, 20% jatuh di bawah D2, …, dan 90% jatuh di bawah D9.
P e r s e n t i l (Percentile)

Jika suatu data dibagi menjadi 100 bagian yang sama didapat 99 pembagi, dan setiap pembagi disebut persentil. Persentil adalah nilai-nilai yang membagi segugus pengamatan menjadi 100 bagian yang sama.Nilai-nilai pembaginya ada 99, dilambangkan dengan P1, P2, …, P99, bersifat bahwa 1% dariseluruh data terletak di bawah P1, 2% terletak di bawah P2, …, dan 99% terletak di bawah P99.

UKURAN PENYEBARAN
Varians
Varian merupakan jumlah kuadrat semua deviasi nilai-nilai individual terhadap rata-rata kelompok. Varian merupakan konsep yang cukup penting dalam statistik, karena merupakan dasar dari banyak metode statistik inferensial. Sebagai contoh, berikut adalah tampilan data:
10, 12, 15, 16 dan 12
Maka dapat dengan mudah dihitung rata-rata dari lima data di atas adalah (10 + 12 + 15 + 16 + 12)/5 = 65/5 = 13. Varian dihitung berdasarkan kuadrat selisih dari masing-masing data terhadap nilai rata-ratanya, sehingga:

(10-13)^2 + (12-13)^2 + (15-13)^2 + (16-13)^2 + (12-13)^2 = (-3)^2 + (-1)^2 + 2^2 + 3^2 + (-1)^2 = 9 + 1 + 4 + 9 + 1 = 24.

Jadi besarnya varian adalah 24 dibagi 5 (jumlah data jika merupakan populasi) atau dibagi 5-1 = 4 jika merupakan sampel. Sehingga nilainya adalah 24/4 = 6 (dianggap merupakan sampel). Dan jika akan dihitung standar deviasi maka akar kuadrat dari 6 yaitu sebesar 2,449.

Varian merupakan ukuran variabilitas data, yang berarti semakin besar nilai varian berarti semakin tinggi fluktuasi data antara satu data dengan data yang lain.
Contoh
Data jumlah anakan  padi varietas Pandan Wangi pada metode SRI adalah sebagai berikut
28  32  15  21  30  30  27  22  36  40
Sampel
y
y2
1
28
784
2
32
1024
3
15
225
4
21
441
5
30
900
6
30
900
7
27
729
8
22
484
9
36
1296
10
40
1600
Jumlah
281
8383

Maka nilai varians data di atas adalah



Varian merupakan ukuran variabilitas data, yang berarti semakin besar nilai varian berarti semakin tinggi fluktuasi data antara satu data dengan data yang lain. Untuk jelasnya, perhatikan data gaji pada dua kelompok masyarakat di bawah:

Kelompok kampung: 3 juta, 1 juta, 6 juta, 8 juta, rata-rata 4,5 juta
Kelompok perumahan: 4 juta, 5 juta, 4,2 juta, 4,8 juta, rata-rata 4,5 juta. Empat orang dari dua kelompok diambil secara acak dan diambil data gaji perbulannya. Kelompok pertama, terdiri dari empat orang warga kampung X, yang pertama mempunyai gaji 3 juta, yang kedua 1 juta, yang ketiga 6 juta dan yang keempat 8 juga, maka rata-ratanya adalah sebesar 4,5 juta.

Empat orang dari kelompok kedua, yaitu warga perumahan, yang pertama mempunyai gaji 4 juta, yang kedua 5 juta, yang ketiga 4,2 juta dan yang keempat 4,8 juta dengan rata-rata 4,5 juta.

Tampak bahwa rata-rata kedua kelompok adalah sama yaitu sebesar 4,5 juta. Tampilan data dengan rata-rata, menimbulkan bias, karena seolah-olah mempunyai rata-rata yang sama, sehingga kebijakan yang diambil dapat salah. Jika kita menghitung varian dari kedua kelompok tersebut akan diperoleh bahwa kelompok pertama mempunyai varian sebesar 29/3 = 9,67 dan untuk kelompok kedua mempunyai varian sebesar 0,68/3 = 0,227.

 Tampak bahwa varian kelompok satu (warga kampung) lebih tinggi dari pada varian kelompok kedua (warga perumahan). Interpretasinya adalah bahwa pendapatan warga kampung sangat berfluktuatif ada yang kecil ada yang sangat besar. Akan tetapi pendapatan warga perumahan relatif sama dan mempunyai tingkat ekonomi yang relatif sama antara satu warga dengan warga perumahan yang lain. Dengan menyertakan nilai varian pada rata-rata akan memberikan informasi yang lebih akurat. Demikian juga dengan standar deviasi, yang besarnya merupakan akar kuadrat dari varian.

Simpangan baku


Standar deviasi atau simpangan baku adalah satuan ukuran penyebaran frekuensi dari tendensi sentralnya. Setiap frekuensi mempunyai deviasi dari tendensi sentralnya, dan juga merupakan ukuran penyebaran bagi variabel kontinum, bukan variabel deskrit. Kegunaannya adalah memberikan ukuran variabelitas dan homogenitas dari serangkain data. Semakin besar nilai simpangan suatu data semakin tinggi pula variabelitas dan semakin kurang homogenitas dari data tersebut. Sebaliknya, bila simpangan baku kecil, maka data tersebut semakin dekat kepada sifat homogenitasnya
Dalam statistika dan probabilitas, simpangan baku atau deviasi standar adalah ukuran sebaran statistik yang paling lazim. Singkatnya, ia mengukur bagaimana nilai-nilai data tersebar. Bisa juga didefinisikan sebagai, rata-rata jarak penyimpangan titik-titik data diukur dari nilai rata-rata data tersebut.
Simpangan baku didefinisikan sebagai akar kuadrat varians. Simpangan baku merupakan bilangan tak-negatif, dan memiliki satuan yang sama dengan data. Misalnya jika suatu data diukur dalam satuan meter, maka simpangan baku juga diukur dalam meter pula.
Istilah simpangan baku pertama kali diperkenakan oleh Karl Pearson pada tahun 1894, dalam bukunya On the dissection of asymmetrical frequency curves.
Dalam Statistik, wilayah data yang berada di antara +/- 1 simpangan baku akan berkisar 68.2%, wilayah data yang berada di antara +/- 2 simpangan baku akan berkisar 95.4%, dan wilayah data yang berada di antara +/- 3 simpangan baku akan berkisar 99.7%,

Rumus Simpangan Baku

Simpangan Baku Populasi

Simpangan baku untuk populasi disimbolkan dengan σ (sigma) dan didefinisikan dengan rumus:
\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2},

Simpangan Baku Sampel

Simpangan baku untuk sampel disimbolkan dengan s dan didefinisikan dengan rumus:
s = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - \overline{x})^2},
dimana \scriptstyle\{x_1,\,x_2,\,\ldots,\,x_N\}adalah nilai data dari sampel dan \scriptstyle\overline{x}adalah rata-rata dari sampel.
.













DAFTAR PUSTAKA



Tidak ada komentar:

Poskan Komentar