Bagaimana (dan Mengapa) Menggunakan Fungsi Pencilan di Excel

Pencilan adalah nilai yang secara signifikan lebih tinggi atau lebih rendah daripada sebagian besar nilai dalam data Anda. Saat menggunakan Excel untuk menganalisis data, outlier dapat mengubah hasil. Misalnya, rata-rata rata-rata kumpulan data mungkin benar-benar mencerminkan nilai Anda. Excel menyediakan beberapa fungsi yang berguna untuk membantu mengelola outlier Anda, jadi mari kita lihat.

Contoh Singkat

Pada gambar di bawah, outlier cukup mudah dikenali—nilai dua yang diberikan kepada Eric dan nilai 173 yang diberikan kepada Ryan. Dalam kumpulan data seperti ini, cukup mudah untuk menemukan dan menangani outlier tersebut secara manual.

Dalam kumpulan data yang lebih besar, itu tidak akan terjadi. Mampu mengidentifikasi outlier dan menghapusnya dari perhitungan statistik adalah penting—dan itulah yang akan kita lihat bagaimana melakukannya di artikel ini.

Cara Menemukan Pencilan di Data Anda

Untuk menemukan outlier dalam kumpulan data, kami menggunakan langkah-langkah berikut:

Hitung kuartil ke-1 dan ke-3 (kita akan membicarakannya sebentar lagi).
Evaluasi rentang interkuartil (kami juga akan menjelaskan ini sedikit lebih jauh ke bawah).
Kembalikan batas atas dan bawah rentang data kami.
Gunakan batas-batas ini untuk mengidentifikasi titik-titik data terluar.

Rentang sel di sebelah kanan kumpulan data yang terlihat pada gambar di bawah ini akan digunakan untuk menyimpan nilai-nilai ini.

Mari kita mulai.

Langkah Satu: Hitung Kuartil

Jika Anda membagi data menjadi empat bagian, masing-masing set tersebut disebut kuartil. 25% angka terendah dalam rentang membentuk kuartil ke-1, 25% berikutnya menjadi kuartil ke-2, dan seterusnya. Kami mengambil langkah ini terlebih dahulu karena definisi outlier yang paling banyak digunakan adalah titik data yang lebih dari 1,5 rentang interkuartil (IQR) di bawah kuartil 1, dan 1,5 rentang interkuartil di atas kuartil ke-3. Untuk menentukan nilai-nilai itu, pertama-tama kita harus mencari tahu apa itu kuartil.

Excel menyediakan fungsi QUARTILE untuk menghitung kuartil. Ini membutuhkan dua informasi: array dan quart.

=QUARTILE(array, quart)

Array adalah rentang nilai yang Anda evaluasi. Dan kuart adalah angka yang mewakili kuartil yang ingin Anda kembalikan (misalnya, 1 untuk kuartil pertama, 2 untuk kuartil ke-2, dan seterusnya).

Catatan: Di Excel 2010, Microsoft merilis fungsi QUARTILE.INC dan QUARTILE.EXC sebagai penyempurnaan fungsi QUARTILE. QUARTILE lebih kompatibel ke belakang saat bekerja di beberapa versi Excel.

Mari kembali ke tabel contoh kita.

Untuk menghitung Kuartil 1 kita dapat menggunakan rumus berikut di sel F2.

=QUARTILE(B2:B14,1)

Saat Anda memasukkan rumus, Excel menyediakan daftar opsi untuk argumen quart.

Untuk menghitung kuartil ke-3, kita dapat memasukkan rumus seperti yang sebelumnya di sel F3, tetapi menggunakan tiga, bukan satu.

=QUARTILE(B2:B14,3)

Sekarang, kami memiliki titik data kuartil yang ditampilkan di sel.

Langkah Kedua: Evaluasi Rentang Interkuartil

Rentang interkuartil (atau IQR) adalah 50% nilai tengah dalam data Anda. Ini dihitung sebagai selisih antara nilai kuartil ke-1 dan nilai kuartil ke-3.

Kita akan menggunakan rumus sederhana ke dalam sel F4 yang mengurangkan kuartil ke-1 dari kuartil ke-3:

=F3-F2

Sekarang, kita dapat melihat rentang interkuartil kita ditampilkan.

Langkah Tiga: Kembalikan Batas Bawah dan Atas

Batas bawah dan atas adalah nilai terkecil dan terbesar dari rentang data yang ingin kita gunakan. Nilai apa pun yang lebih kecil atau lebih besar dari nilai terikat ini adalah outlier.

Kami akan menghitung batas batas bawah di sel F5 dengan mengalikan nilai IQR dengan 1,5 dan kemudian mengurangkannya dari titik data Q1:

=F2-(1.5*F4)

Catatan: Tanda kurung dalam rumus ini tidak diperlukan karena bagian perkalian akan menghitung sebelum bagian pengurangan, tetapi tanda kurung membuat rumus lebih mudah dibaca.

Untuk menghitung batas atas di sel F6, kita akan mengalikan IQR dengan 1,5 lagi, tetapi kali ini menambahkannya ke titik data Q3:

=F3+(1.5*F4)

Langkah Empat: Identifikasi Pencilan

Sekarang setelah kita menyiapkan semua data pokok, saatnya mengidentifikasi titik data terluar kita—titik yang lebih rendah dari nilai batas bawah atau lebih tinggi dari nilai batas atas.

Kami akan menggunakan fungsi ATAU untuk melakukan tes logis ini dan menunjukkan nilai yang memenuhi kriteria ini dengan memasukkan rumus berikut ke dalam sel C2:

=OR(B2$F$6)

Kami kemudian akan menyalin nilai itu ke dalam sel C3-C14 kami. Nilai TRUE menunjukkan outlier, dan seperti yang Anda lihat, kami memiliki dua data.

Mengabaikan Pencilan saat Menghitung Rata-Rata Rata-rata

Dengan menggunakan fungsi QUARTILE, mari kita hitung IQR dan bekerja dengan definisi outlier yang paling banyak digunakan. Namun, saat menghitung rata-rata rata-rata untuk rentang nilai dan mengabaikan outlier, ada fungsi yang lebih cepat dan lebih mudah untuk digunakan. Teknik ini tidak akan mengidentifikasi outlier seperti sebelumnya, tetapi akan memungkinkan kita untuk fleksibel dengan apa yang mungkin kita anggap sebagai bagian outlier kita.

Fungsi yang kita butuhkan disebut TRIMMEAN, dan Anda dapat melihat sintaksnya di bawah ini:

=TRIMMEAN(array, percent)

Array adalah rentang nilai yang ingin Anda rata-rata. Persentase adalah persentase titik data yang akan dikecualikan dari bagian atas dan bawah kumpulan data (Anda dapat memasukkannya sebagai persentase atau nilai desimal).

Kami memasukkan rumus di bawah ini ke dalam sel D3 dalam contoh kami untuk menghitung rata-rata dan mengecualikan 20% dari outlier.

=TRIMMEAN(B2:B14, 20%)

Di sana Anda memiliki dua fungsi berbeda untuk menangani outlier. Baik Anda ingin mengidentifikasinya untuk beberapa kebutuhan pelaporan atau mengecualikannya dari penghitungan seperti rata-rata, Excel memiliki fungsi yang sesuai dengan kebutuhan Anda.

  Cara Membuat Streaming Netflix Lebih Mudah Menggunakan Pintasan Keyboard