Metode IQR adalah teknik yang robust untuk mengidentifikasi outlier karena tidak terlalu sensitif terhadap nilai ekstrem dibandingkan dengan metode yang menggunakan rata-rata dan standar deviasi. Metode ini berfokus pada sebaran data di antara kuartil.
Data yang Digunakan:
Dari hasil penelitian
- Metode Duke: Terdiri dari 30 data observasi dengan nilai minimum 1.30 dan nilai maksimum 5.00
. Rata-rata adalah 2.4667 dengan standar deviasi 1.26309 . - Metode Slide Tetes: Terdiri dari 30 data observasi dengan nilai minimum 8.00 dan nilai maksimum 15.00
. Rata-rata adalah 10.7767 dengan standar deviasi 1.82222 .
Langkah-langkah Penerapan Metode IQR:
1. Pengurutan Data:
Langkah pertama adalah mengurutkan semua data observasi dari yang terkecil hingga terbesar untuk setiap metode secara terpisah.
-
Data Metode Duke (Terurut):
1.30, 1.30, 1.30, 1.30, 1.30, 1.30, 1.30, 1.30, 1.30, 2.00, 2.00, 2.00, 2.30, 2.30, 2.30, 3.00, 3.30, 3.30, 3.30, 4.00, 4.00, 4.00, 4.00, 4.00, 4.30, 4.30, 5.00, 5.00, 5.00, 5.00 (asumsi dari rentang nilai dan jumlah data, perlu data mentah lengkap untuk urutan persis).
-
Data Metode Slide Tetes (Terurut):
8.00, 8.00, 8.30, 9.00, 9.00, 9.00, 9.30, 9.30, 9.30, 9.30, 9.30, 10.00, 10.00, 10.00, 11.00, 11.00, 11.00, 12.00, 12.00, 12.00, 12.00, 12.00, 12.30, 12.30, 12.30, 13.30, 13.30, 13.30, 15.00, 15.00 (asumsi dari rentang nilai dan jumlah data, perlu data mentah lengkap untuk urutan persis).
2. Menghitung Kuartil (Q1, Q2/Median, Q3):
Untuk 30 data, posisi kuartil dihitung sebagai berikut:
- -th posisi.
- Q2 (Median) -th posisi.
- -th posisi.
Di mana (jumlah observasi)
- Q1 posisi -th posisi. Ini berarti Q1 adalah interpolasi antara nilai ke-7 dan ke-8.
- Q2 (Median) posisi -th posisi. Ini berarti Median adalah interpolasi antara nilai ke-15 dan ke-16.
- Q3 posisi -th posisi. Ini berarti Q3 adalah interpolasi antara nilai ke-23 dan ke-24.
a. Perhitungan untuk Metode Duke:
Dengan data terurut metode Duke, kita dapat memperkirakan Q1, Median, dan Q3.
- Q1: Nilai ke-7 adalah 1.30, nilai ke-8 adalah 1.30. Jadi, Q1 = 1.30.
- Median (Q2): Nilai ke-15 adalah 2.30, nilai ke-16 adalah 3.00. Jadi, Median = .
- Q3: Nilai ke-23 adalah 4.00, nilai ke-24 adalah 4.00. Jadi, Q3 = 4.00.
b. Perhitungan untuk Metode Slide Tetes:
Dengan data terurut metode Slide Tetes, kita dapat memperkirakan Q1, Median, dan Q3.
- Q1: Nilai ke-7 adalah 9.30, nilai ke-8 adalah 9.30. Jadi, Q1 = 9.30.
- Median (Q2): Nilai ke-15 adalah 11.00, nilai ke-16 adalah 11.00. Jadi, Median = .
- Q3: Nilai ke-23 adalah 12.30, nilai ke-24 adalah 12.30. Jadi, Q3 = 12.30.
3. Menghitung IQR (Interquartile Range):
IQR adalah rentang antara Q3 dan Q1 ().
- IQR Metode Duke: .
- IQR Metode Slide Tetes: .
4. Menentukan Batas Outlier:
Outlier adalah nilai yang berada di luar batas bawah atau batas atas. Batas ini dihitung menggunakan rumus:
- Batas Bawah (Lower Bound) = Q1 - (1.5 * IQR)
- Batas Atas (Upper Bound) = Q3 + (1.5 * IQR)
Faktor 1.5 adalah konvensi umum yang digunakan dalam metode IQR.
a. Batas Outlier untuk Metode Duke:
- Batas Bawah = .
- Batas Atas = .
b. Batas Outlier untuk Metode Slide Tetes:
- Batas Bawah = .
- Batas Atas = .
5. Mengidentifikasi Outlier:
-
Metode Duke:
- Bandingkan setiap nilai data metode Duke dengan batas-batas ini.
- Semua nilai dalam data metode Duke berada dalam rentang [-2.75, 8.05].
- Berdasarkan perhitungan ini, tidak ada outlier yang teridentifikasi dalam data metode Duke menggunakan ambang batas 1.5 IQR.
-
Metode Slide Tetes:
- Bandingkan setiap nilai data metode Slide Tetes dengan batas-batas ini.
- Semua nilai dalam data metode Slide Tetes berada dalam rentang [4.80, 16.80].
- Berdasarkan perhitungan ini, tidak ada outlier yang teridentifikasi dalam data metode Slide Tetes menggunakan ambang batas 1.5 IQR.
Kesimpulan Awal dari Metode IQR:
Berdasarkan analisis IQR dengan faktor 1.5, tidak ada outlier yang teridentifikasi dalam kedua set data (Metode Duke dan Metode Slide Tetes) yang diberikan. Ini menunjukkan bahwa meskipun ada variasi dalam data (terutama pada metode Slide Tetes yang memiliki standar deviasi lebih besar
Tindak Lanjut dan Pertimbangan:
Meskipun metode 1.5 IQR tidak mengidentifikasi outlier, ada beberapa pertimbangan lebih lanjut:
- Pentingnya Data Mentah Penuh: Untuk perhitungan kuartil yang sangat presisi, memiliki akses ke semua 30 nilai data yang terurut secara eksplisit akan lebih akurat daripada hanya mengandalkan nilai minimum, maksimum, rata-rata, dan standar deviasi dari tabel deskriptif
. Meskipun interpolasi sudah dilakukan, ketepatan nilai sebenarnya dapat bervariasi sedikit. - Visualisasi Data: Selalu disarankan untuk membuat box plot untuk kedua set data. Box plot secara visual akan menunjukkan apakah ada titik-titik data yang berada di luar "janggut" (whiskers), yang merupakan representasi visual dari batas outlier metode IQR. Ini dapat memberikan konfirmasi visual yang kuat atau bahkan mengungkapkan outlier yang mungkin terlewat oleh perhitungan manual jika ada pembulatan atau interpretasi posisi yang sedikit berbeda.
- Ambang Batas Alternatif: Terkadang, ambang batas 3.0 * IQR digunakan untuk mengidentifikasi outlier "ekstrem" atau "jauh". Jika 1.5 IQR tidak menemukan outlier, tetapi ada kecurigaan outlier yang lebih ekstrem, perhitungan dengan 3.0 IQR dapat dicoba.
- Batas Bawah Ekstrem = Q1 - (3 * IQR)
- Batas Atas Ekstrem = Q3 + (3 * IQR)
- Konteks Domain: Penting untuk selalu mempertimbangkan konteks medis atau biologis dari data. Apakah ada nilai yang, meskipun tidak outlier secara statistik, secara klinis tidak masuk akal? Misalnya, waktu pembekuan darah yang sangat rendah atau sangat tinggi dapat menunjukkan masalah mendasar yang harus diselidiki lebih lanjut, terlepas dari apakah itu outlier secara statistik.
Dengan demikian, meskipun secara statistik tidak ada outlier yang teridentifikasi menggunakan metode IQR standar, pemahaman mendalam tentang proses dan potensi langkah-langkah tambahan dapat memastikan integritas data dan validitas hasil penelitian.