MEMPREDIKSI ETA:
SEBARAN DAN TUMPANG TINDIH
1. APA ITU ETA ($\eta$)?
- Eta adalah ukuran asosiasi (korelasi) yang digunakan untuk melihat hubungan antara variabel nominal/kategorikal (dalam kasus ini: Status - Berhasil, Batal, Gagal) dengan variabel interval/rasio (dalam kasus ini: Umur).
Nilai Eta berkisar antara 0 hingga 1:
- Mendekati 1: Hubungan sangat kuat (Kelompok status sangat menentukan umur, atau sebaliknya).
- Mendekati 0: Hubungan sangat lemah/tidak ada (Umur tidak bisa membedakan status).
2. LOGIKA VISUAL: SEBARAN & TUMPANG TINDIH
A. "SEBARAN YANG LUAS" (High Within-Group Variance)
Pernyataan ini berarti di dalam satu kelompok status (misalnya kelompok "Berhasil"), rentang umurnya sangat bervariasi.
Contoh: Orang yang "Berhasil" ada yang berumur 20 tahun, tapi ada juga yang 60 tahun.
Dampak Statistik: Ini menciptakan "kebisingan" (noise) yang tinggi. Data tidak berkumpul rapi di sekitar rata-rata.
B. "TUMPANG TINDIH (OVERLAPPING) YANG BESAR"
Pernyataan ini berarti jika kita menggambar grafik distribusi umur untuk "Berhasil", "Batal", dan "Gagal", kurva ketiganya akan saling menumpuk.
Contoh: Rata-rata umur "Berhasil" = 35 tahun, "Batal" = 34 tahun, "Gagal" = 36 tahun.
Dampak Statistik: Ini berarti perbedaan antar kelompok sangat kecil (low signal). Sulit membedakan seseorang masuk kelompok mana hanya dengan melihat umurnya.
3. INTUISI MATEMATIS
Kesimpulan Matematis:
- Overlap Besar $\rightarrow$ Menyebabkan Variansi Antar Kelompok Kecil (pembilang kecil). Artinya, perbedaan rata-rata umur antar status tidak signifikan.
- Sebaran Luas $\rightarrow$ Menyebabkan Variansi Dalam Kelompok Besar (penyebut menjadi sangat besar).
Jika Anda membagi angka yang kecil (perbedaan antar kelompok) dengan angka yang sangat besar (total sebaran data), hasilnya akan MENDEKATI NOL.
4. ANALOGI SEDERHANA
SKENARIO ETA TINGGI (>0.7)
Basket: Tinggi (190-210cm).
Joki: Pendek (145-160cm).
Tidak ada tumpang tindih. Tinggi badan adalah prediktor kuat.
SKENARIO ETA RENDAH (<0.3)
Berhasil: Umur 20-60.
Gagal: Umur 20-60.
Tumpang tindih total. Umur 40 ada di kedua kelompok.
5. PEMBUKTIAN DATA SIMULASI
- Sebaran Luas: Standar deviasi umur dibuat cukup besar (sekitar 11-12 tahun), artinya umur di setiap kelompok sangat bervariasi (18-75 tahun).
- Tumpang Tindih Besar: Rata-rata umur antar kelompok dibuat sangat mirip (Berhasil $\approx$ 34.6, Batal $\approx$ 37.1, Gagal $\approx$ 34.8).
> RUNNING PYTHON SIMULATION...
> GENERATING GROUPS: BERHASIL, BATAL, GAGAL
> CALCULATING ANOVA...
> RESULT:
Calculated Eta: 0.0962
Eta Squared: 0.0093
HASIL HITUNGAN ETA
(Sangat Rendah, Jauh di bawah 0.3)
Hanya 0.9% variasi status yang bisa dijelaskan oleh umur.
6. VISUALISASI BUKTI
GRAFIK DATA SIMULASI
- Kiri (Boxplot): Kotak-kotak (yang mewakili sebaran data 50% tengah) berada di posisi ketinggian yang hampir sama. Garis tengah (median) hampir sejajar. Ini menunjukkan tidak ada perbedaan "level" yang nyata antar kelompok.
- Kanan (Distribusi): Lihatlah bagaimana area warna-warni (kurva distribusi) saling menumpuk (overlapping).
Hampir mustahil untuk menarik garis batas yang tegas untuk memisahkan mana yang "Berhasil" atau "Gagal" hanya berdasarkan umur. Seseorang dengan umur 35 tahun, misalnya, memiliki peluang yang hampir sama besarnya untuk berada di kelompok Berhasil, Batal, atau Gagal.