Bab 4 Visualisasi Data Kuantitatif

Capaian Pembelajaran

Setelah mempelajari bab ini, Anda diharapkan:

  1. mampu memilih visualisasi yang tepat sesuai dengan variabel yang akan disajikan dan informasi yang ingin disampaikan STP-3.1
  2. mampu menginterpretasikan suatu visualisasi data kuantitatif secara mendalam STP-3.2
  3. mampu menjelaskan pentingnya menentukan tingkat pengukuran untuk sebuah variabel dari kaitannya dengan analisis statistik deskriptif dan diagram yang dipilih untuk menyajikan informasi STP-3.4

4.1 Konsep Dasar

Visualisasi data adalah mengubah bentuk penyajian data/presentasi data dari bentuk tabular/tabel menjadi bentuk grafis. Kita sering mendengar pepatah yang berbunyi “a picture is worth a thousand words” yang artinya kurang lebih “satu gambar bernilai seribu kata.” Pepatah ini menggambarkan bahwa data yang disajikan dalam bentuk gambar/grafis dapat menampilkan banyak sekali informasi kepada audiens.

Sajian data dalam bentuk gambar disebut juga grafik atau diagram (chart). Jenis grafik atau diagram yang digunakan sangat bergantung pada jenis dan tingkat pengukuran variabel yang akan divisualisasikan.

Banyak sekali panduan-panduan untuk memilih bentuk grafik yang perlu Anda gunakan untuk menyajikan data Anda. Salah satu sumber yang menyediakan panduan tersebut adalah situs From data to Viz atau Data Viz Project.

4.2 Jenis-jenis Diagram

Untuk memilih jenis diagram yang tepat, kita perlu menentukan terlebih dahulu jenis dan tingkat pengukuran variabel yang akan kita sajikan. Kemudian, kita dapat mempertimbangkan jenis informasi apa yang ingin kita sajikan dan menyesuaikannya dengan cara menampilkan nilainya, bisa dengan sumbu (tegak/datar; Y/X) atau yang lainnya. Berikut adalah pembahasan sebagian jenis-jenis diagram berdasarkan jenis nilai dan tingkat pengukuran variabel yang sudah kita bahas dan tujuan penggunaanya.

4.2.1 Variabel Kategorikal

Visualisasi variabel kategorikal bertujuan menampilkan jumlah (frekuensi) objek untuk masing-masing kategori. Untuk menentukan jenis diagram yang tepat, kita perlu memperhatikan jumlah variabel yang dianalisis dan hubungan antarvariabel.

4.2.1.1 Grafik Batang (Column/Bar Chart)

Grafik batang adalah grafik yang paling sering digunakan untuk memvisualkan variabel kategorikal. Grafik ini memberikan informasi berupa sebaran frekuensi sebuah variabel.

Bentuk grafik batang tersusun dari dua sumbu tegak (Y) dan datar (X). Tinggi batang sepanjang sumbu Y bermakna frekuensi dari kategori-kategori yang ada dalam variabel, sementara kategori-kategori berada di sepanjang sumbu X.

Terdapat dua jenis grafik batang: tegak dan mendatar. Grafik batang tegak disebut juga column chart sementara yang mendatar disebut bar chart. Perbedaan column chart dan bar chart hanya terletak di sumbu yang menunjukkan frekuensi kategori, yakni tinggi/panjang batang. Grafik batang yang menggunakan sumbu Y untuk menunjukkan jumlah frekuensinya adalah column chart, sementara yang menggunakan sumbu X adalah bar chart.

Untuk lebih memahami bagaimana mengubah data terstruktur menjadi grafik batang, penjelasannya dapat dilihat di Studi Kasus di bawah.

4.2.1.2 Grafik Batang Bertumpuk (Stacked Column/Bar Chart)

Grafik batang bertumpuk (stacked bar/column chart) digunakan untuk membandingkan komposisi dari beberapa kategori. Setiap batang mewakili nilai total, yang kemudian dipecah menjadi beberapa segmen untuk menunjukkan bagaimana kontribusi masing-masing subkategori membentuk total tersebut. Kategori kedua variabel tersebut dibuat bertumpukan. Misalnya sebaran pengguna kendaraan (mobil, motor, sepeda) berdasarkan jenis kelamin (laki-laki dan perempuan).

Untuk lebih memahami bagaimana mengubah data terstruktur menjadi grafik batang bertumpuk, penjelasannya dapat dilihat di Studi Kasus di bawah. Secara umum, data mentah diubah menjadi tabel distribusi frekuensi, dan tabel distribusi frekuensi itu yang menjadi bahan pembuatan grafik.

Studi Kasus: Visualisasi Moda Transportasi Mahasiswa dengan Diagram Batang

Untuk memahami pembuatan grafik batang, kita akan menganalisis data moda transportasi mahasiswa UIN Raden Intan Lampung. Langkah pertama adalah mengubah data mentah menjadi tabel distribusi frekuensi (Tabel 4.1), baru kemudian divisualisasikan.

Tabel 4.1: Distribusi Frekuensi Moda Transportasi Mahasiswa UIN Raden Intan Lampung
Moda Transportasi Frekuensi
Berjalan kaki 38
Menumpang kendaraan bermotor teman/keluarga 27
Mobil pribadi 15
Sepeda motor pribadi 290
Transportasi daring 30

Setelah mendapatkan tabel distribusi frekuensi, kita dapat membuat grafik batang tegak (column chart)

Grafik batang tegak distribusi moda transportasi

Gambar 4.1: Grafik batang tegak distribusi moda transportasi

Atau dalam bentuk grafik batang mendatar (bar chart):

Grafik batang mendatar distribusi moda transportasi

Gambar 4.2: Grafik batang mendatar distribusi moda transportasi

Untuk grafik batang bertumpuk, kita memerlukan dua variabel kategorikal. Kita akan membandingkan moda transportasi berdasarkan jenis kelamin (Tabel 4.2).

Tabel 4.2: Distribusi Frekuensi Moda Transportasi Mahasiswa UIN Raden Intan Lampung berdasarkan Jenis Kelamin
Jenis Kelamin Berjalan Kaki Menumpang Mobil Pribadi Sepeda Sepeda Motor Transportasi Online
Laki-laki 3 9 6 0 167 3
Perempuan 35 18 9 0 123 27

Dari tabel kontingensi tersebut, kita dapat membuat grafik batang bertumpuk:

Grafik batang bertumpuk moda transportasi berdasarkan jenis kelamin

Gambar 4.3: Grafik batang bertumpuk moda transportasi berdasarkan jenis kelamin

Interpretasi: Grafik menunjukkan bahwa sepeda motor merupakan moda transportasi yang paling banyak digunakan oleh mahasiswa UINRIL, diikuti oleh mobil dan angkutan umum. Dari grafik batang bertumpuk terlihat bahwa penggunaan sepeda motor lebih dominan pada mahasiswa laki-laki dibandingkan perempuan, sementara penggunaan angkutan umum relatif seimbang antara kedua jenis kelamin.

4.2.1.3 Grafik Lollipop

Diagram lollipop pada dasarnya serupa dengan diagram batang, hanya saja data direpresentasikan oleh tiang-tiang berujung lingkaran yang menyerupai permen loli. Penggunaannya sangat cocok untuk data berjumlah banyak guna menghindari efek Moiré (dibaca `moarey’) Wikipedia contributors (2025). Efek Moiré adalah ilusi optik pergerakan benda yang posisinya berdekatan dan membentuk sebuah kisi (fringe) seperti yang ditunjukkan Gambar 4.4, sehingga dapat menyulitkan pembaca grafik.

Contoh efek Moiré pada grafik batang

Gambar 4.4: Contoh efek Moiré pada grafik batang

Studi Kasus: Perbandingan Grafik Lollipop dengan Grafik Batang

Pada dataset dengan banyak kategori, grafik batang konvensional dapat menghasilkan efek Moiré yang mengganggu. Mari kita bandingkan penggunaan grafik batang biasa dengan grafik lollipop menggunakan data program studi mahasiswa UINRIL.

Tabel 4.3: Distribusi Frekuensi Mahasiswa UIN Raden Intan Lampung Per Program Studi
Nama Program Studi Frekuensi
Hukum Keluarga 31
Ekonomi Syariah 28
Pendidikan Bahasa Inggris 24
Pendidikan Biologi 23
Manajemen Bisnis Syariah 21
Akuntansi Syariah 19
Catatan: Menampilkan 6 dari 32 program studi

Berikut adalah visualisasi menggunakan grafik batang biasa:

Grafik batang program studi mahasiswa UINRIL

Gambar 4.5: Grafik batang program studi mahasiswa UINRIL

Sekarang bandingkan dengan grafik lollipop:

Grafik lollipop program studi mahasiswa UINRIL

Gambar 4.6: Grafik lollipop program studi mahasiswa UINRIL

Perbandingan: Pada grafik lollipop, setiap kategori lebih mudah dibedakan karena hanya tiang tipis dan titik yang mewakili nilai, sehingga menghindari efek visual yang berlebihan (Moiré). Grafik lollipop sangat cocok untuk dataset dengan banyak kategori seperti ini, karena lebih ringkas dan tetap informatif. Sementara grafik batang biasa terlihat lebih padat dan dapat menimbulkan kesulitan dalam membaca data ketika batang-batangnya berdekatan.

4.2.1.4 Grafik Treemap

Secara fungsi, treemap dan stacked bar chart sangat mirip karena keduanya menunjukkan distribusi frekuensi objek berdasarkan kategori variabelnya. Jika stacked chart memakai panjang segmen pada batang untuk menunjukkan proporsi, treemap menggunakan luas area persegi panjang. Frekuensinya diperlihatkan oleh luas persegi masing-masing kategori.

Proses pembuatannya sama persis seperti dengan grafik batang bertumpuk.

Studi Kasus: Membuat Treemap Moda Transportasi

Treemap menggunakan luas area persegi untuk menunjukkan proporsi kategori. Seperti pada grafik batang bertumpuk, kita mulai dari tabel distribusi frekuensi dua variabel.

Tabel 4.4: Distribusi Frekuensi Moda Transportasi berdasarkan Jenis Kelamin untuk Treemap
Jenis Kelamin Moda Transportasi Frekuensi
Laki-laki Berjalan kaki 3
Laki-laki Menumpang kendaraan bermotor teman/keluarga 9
Laki-laki Mobil pribadi 6
Laki-laki Sepeda motor pribadi 167
Laki-laki Transportasi daring 3
Perempuan Berjalan kaki 35
Perempuan Menumpang kendaraan bermotor teman/keluarga 18
Perempuan Mobil pribadi 9
Perempuan Sepeda motor pribadi 123
Perempuan Transportasi daring 27

Dari tabel distribusi frekuensi tersebut, kita dapat membuat treemap:

Treemap moda transportasi berdasarkan jenis kelamin

Gambar 4.7: Treemap moda transportasi berdasarkan jenis kelamin

Interpretasi: Treemap menunjukkan proporsi penggunaan moda transportasi dengan jelas melalui luas area. Area terbesar dimiliki oleh sepeda motor, menunjukkan dominasinya sebagai moda transportasi utama. Di dalam setiap moda, terdapat sub-area yang menunjukkan pembagian berdasarkan jenis kelamin. Visualisasi ini memudahkan kita untuk membandingkan proporsi secara langsung tanpa perlu membaca angka.

4.2.1.5 Grafik Pai/Donat (Pie/Donut Chart)

Grafik jenis ini juga sering digunakan untuk visualisasi variabel kategoris. Perbedaan dengan grafik batang adalah frekuensi tiap kategori tidak diperlihatkan dengan sumbu tegak, tetapi besar juring (sektor) lingkaran.

Proses pembuatannya sama seperti pembuatan grafik batang yang ditunjukkan pada kasus di 4.2.1.2, hanya saja jumlah kategori menjadi jumlah sektor, sementara frekuensinya menjadi ukuran sektor.

Studi Kasus: Membuat Grafik Pai dan Donat

Grafik pai dan donat menggunakan juring lingkaran untuk menunjukkan proporsi kategori. Prosesnya sama dengan grafik batang, dimulai dari tabel distribusi frekuensi.

Tabel 4.5: Distribusi Frekuensi Moda Transportasi untuk Grafik Pai
Moda Transportasi Frekuensi
Berjalan kaki 38
Menumpang kendaraan bermotor teman/keluarga 27
Mobil pribadi 15
Sepeda motor pribadi 290
Transportasi daring 30

Dari tabel distribusi frekuensi, kita dapat membuat grafik pai (pie chart):

Grafik pai moda transportasi mahasiswa UINRIL

Gambar 4.8: Grafik pai moda transportasi mahasiswa UINRIL

Untuk membuat grafik donat (donut chart), kita mengubah jenis kategori menjadi juring-juring lingkaran dan sudunya ditentukan dari proporsi frekuensi. Prosesnya sama dengan grafik pai, hanya saja kita di tengahnya ada ruang kosong yang dapat digunakan untuk informasi tambahan.

Grafik donat moda transportasi mahasiswa UINRIL

Gambar 4.9: Grafik donat moda transportasi mahasiswa UINRIL

Interpretasi: Baik grafik pai maupun donat menunjukkan proporsi penggunaan moda transportasi dengan jelas. Sepeda motor mendominasi dengan proporsi terbesar, diikuti oleh mobil dan angkutan umum. Grafik donat memberikan tampilan yang lebih modern dengan ruang kosong di tengahnya yang dapat digunakan untuk informasi tambahan.

4.2.2 Variabel Numerik

Berbeda dengan visualisasi variabel kategorikal yang memperlihatkan frekuensi masing-masing kategori dalam variabel, grafik data dengan variabel numerik merepresentasikan nilai yang sebenarnya.

Persamaan dengan visualisasi pada data kategorikal adalah perlunya pertimbangan jumlah variabel dan cara menyajikan nilianya dengan sumbu atau bukan. Selain itu juga perlu dipertimbangkan keterurutan objek/observasi (order).

Berikut adalah tinjauan beberapa jenis grafik visualisasi data variabel numerik dengan masing-masing ilustrasi data terstrukturnya.

4.2.2.1 Histogram

Histogram menunjukkan distribusi nilai-nilai yang berada pada rentang tertentu. Rentang nilai ditunjukkan di sumbu X-nya, sementara sumbu Y adalah frekuensinya. Istilah untuk rentang-rentang ini disebut bin, sementara lebar/ukurannya disebut bin size atau bin width.

Penting!

Jangan tertukar antara histogram dengan grafik batang! Perbedaan mendasar keduanya terletak pada sumbu X-nya. Sumbu X pada histogram menunjukkan angka, sementara pada grafik batang menunjukkan kategorinya.

Satu karakteristik lain yang membedakan histogram dengan grafik batang adalah jarak antarbatangnya. Grafik batang biasanya memiliki celah di antara batangnya, sementara histogram tidak memiliki celah.

Proses pembuatan histogram dari tabel data terstruktur diilustrasikan oleh kasus berikut. Dalam proses ini, variabel numerik dikelompokkan ke dalam interval atau rentang tertentu. Selanjutnya, frekuensi merepresentasikan jumlah total objek yang nilainya berada di dalam masing-masing rentang tersebut.

Studi Kasus: Membuat Histogram Biaya Perjalanan

Histogram menunjukkan distribusi nilai numerik dengan mengelompokkannya ke dalam interval (bin). Mari kita visualisasikan biaya perjalanan mahasiswa ITERA.

Tabel 4.6: Statistik Deskriptif Biaya Perjalanan Mahasiswa ITERA (dalam ribuan rupiah)
Statistik Nilai (Rp ribu)
Min 0,00
Q1 20000,00
Median 30000,00
Mean 38665,89
Q3 45000,00
Max 400000,00
NA 0,00

Sebelum membuat histogram, kita perlu mengelompokkan nilai-nilai ke dalam interval (bin). Perangkat lunak pengolah data statistik, contohnya bahasa pemrograman R, melakukan ini secara otomatis. Berikut adalah contoh pembuatan histogram dengan pengaturan bin otomatis:

Histogram biaya perjalanan (bin otomatis) dalam ribuan rupiah

Gambar 4.10: Histogram biaya perjalanan (bin otomatis) dalam ribuan rupiah

Kita juga dapat mengatur jumlah bin secara manual untuk melihat distribusi dengan lebih detail:

Histogram biaya perjalanan (bin manual) dalam ribuan rupiah

Gambar 4.11: Histogram biaya perjalanan (bin manual) dalam ribuan rupiah

Untuk lebih memahami proses binning, mari kita buat tabel frekuensi manual:

Tabel 4.7: Tabel Frekuensi Biaya Perjalanan dalam Ribuan Rupiah (6 Interval Pertama)
Interval Biaya (Rp ribu) Frekuensi
[0,4,44e+04] 318
(4,44e+04,8,89e+04] 80
(8,89e+04,1,33e+05] 13
(1,33e+05,1,78e+05] 7
(1,78e+05,2,22e+05] 7
(2,22e+05,2,67e+05] 1

Interpretasi: Histogram menunjukkan bahwa sebagian besar mahasiswa ITERA memiliki biaya perjalanan dalam rentang rendah hingga menengah, dengan konsentrasi terbesar pada rentang 0-50 ribu rupiah (perhatikan bahwa nilai biaya sudah dalam satuan ribu rupiah). Distribusi menunjukkan pola miring ke kanan (right-skewed), yang berarti terdapat beberapa mahasiswa dengan biaya perjalanan yang sangat tinggi. Informasi ini penting untuk perencanaan transportasi kampus, misalnya dalam menentukan subsidi atau rute angkutan kampus.

4.2.2.2 Boxplot

Boxplot adalah grafik berbentuk kotak dan garis yang menampilkan ukuran penyebaran suatu variabel numerik secara grafis (Gambar 4.12). Sebagaimana yang ditunjukkan oleh gambar tersebut, kotak dan garis pada boxplot dapat berjumlah satu atau lebih. Satu kotak dan garis menandakan hanya ada satu kategori objek dengan variabel numerik yang ditampilkan.

Sementara itu, jika variabel numerik tersebut dikategorikan lagi berdasarkan suatu variabel kategoris, maka jumlah kotak dan garisnya bisa lebih dari satu dan berjumlah sesuai dengan jumlah kategori objeknya.

*Boxplot* yang terdiri atas dua kategori objek: A dan B

Gambar 4.12: Boxplot yang terdiri atas dua kategori objek: A dan B

Setiap elemen pada boxplot memiliki makna ukuran penyebaran. Ini dijelaskan pada kasus berikut.

Studi Kasus: Membuat Boxplot Biaya Perjalanan Mahasiswa

Boxplot menampilkan ukuran penyebaran data numerik secara grafis. Mari kita buat boxplot untuk menganalisis distribusi biaya perjalanan mahasiswa dari berbagai universitas.

Tabel 4.8: Statistik Deskriptif Biaya Perjalanan Gabungan (UINRIL & UNILA)
Statistik Nilai
Min 0,00
Q1 30,00
Median 50,00
Mean 56,54
Q3 65,00
Max 400,00
NA 0,00

Mari kita buat boxplot tunggal untuk biaya perjalanan UINRIL terlebih dahulu:

Boxplot biaya perjalanan mahasiswa UINRIL

Gambar 4.13: Boxplot biaya perjalanan mahasiswa UINRIL

Sekarang mari kita buat boxplot ganda untuk membandingkan distribusi biaya perjalanan antar kampus:

Boxplot biaya perjalanan mahasiswa berdasarkan kampus

Gambar 4.14: Boxplot biaya perjalanan mahasiswa berdasarkan kampus

Penjelasan elemen boxplot:

  • Garis tengah kotak (median/Q2): Nilai tengah data yang membagi data menjadi dua bagian sama besar
  • Kotak bagian bawah (Q1): Kuartil pertama, 25% data berada di bawah nilai ini
  • Kotak bagian atas (Q3): Kuartil ketiga, 75% data berada di bawah nilai ini
  • Tinggi kotak (IQR): Jarak interkuartil, menunjukkan rentang 50% data tengah
  • Whiskers (garis atas dan bawah): Menunjukkan rentang data yang masih dalam batas normal (1,5 × IQR)
  • Titik-titik di luar whiskers: Outlier atau pencilan, yakni nilai-nilai ekstrem yang jauh dari sebagian besar data

Interpretasi: Dari boxplot ganda terlihat bahwa distribusi biaya perjalanan mahasiswa UNILA memiliki median yang sedikit lebih tinggi dibandingkan UINRIL. Rentang interkuartil (tinggi kotak) UNILA juga lebih besar, menunjukkan variasi biaya perjalanan yang lebih beragam. Terdapat beberapa outlier pada kedua kampus yang menunjukkan ada mahasiswa dengan biaya perjalanan yang jauh lebih tinggi dari mayoritas. Informasi ini berguna untuk perencanaan fasilitas kampus seperti kantin atau transportasi yang disesuaikan dengan daya beli mahasiswa.

4.2.2.3 Grafik Garis (Line Plot) dan Area (Area Plot)

Grafik ini memetakan nilai variabel angka yang masuk akal bisa diurutkan, yakni biasanya yang berupa deret waktu (time series). Garis menghubungkan masing-masing titik nilai pada tiap-tiap posisi untuk menegaskan perubahan nilainya. Gambar 4.15 berikut mengilustrasikan data terstruktur yang membentuk line atau area plot.

Ilustrasi line plot dan area plot serta data terstruktur yang membentuknya

Gambar 4.15: Ilustrasi line plot dan area plot serta data terstruktur yang membentuknya

Area plot secara prinsip sama saja dengan line plot, hanya saja ruang di bawah garisnya diisi dengan warna yang sama dengan garis. Area plot biasanya digunakan untuk data numerik dengan dimensi waktu yang terdiri atas kategori-kategori seperti yang ditunjukkan Gambar 4.16.

Ilustrasi area plot dengan tiga variabel

Gambar 4.16: Ilustrasi area plot dengan tiga variabel

4.2.2.4 Grafik Pencar (Scatterplot)

Scatterplot dapat memperlihatkan pemetaan nilai dua variabel numerik yang berkaitan. Sumbu tegak dan datar menunjukkan nilai-nilai dua variabel tersebut sementara tiap titik dibentuk dari perpotongan nilai dari kedua variabel untuk tiap-tiap objek.

Studi Kasus: Membuat Scatterplot Hubungan Biaya Perjalanan dan Jarak Tempuh

Scatterplot memperlihatkan hubungan antara dua variabel numerik. Setiap titik mewakili satu observasi dengan nilai pada sumbu X dan Y. Mari kita analisis hubungan antara biaya perjalanan dan jarak tempuh mahasiswa ITERA.

Tabel 4.9: Contoh Data Biaya Perjalanan dan Jarak Tempuh dalam Ribuan Rupiah (10 Observasi Pertama)
Biaya Perjalanan (Rp ribu) Jarak Tempuh (km)
10000 6,69
21000 2,82
40000 5,17
30000 6,95
25000 5,57
40000 4,75
30000 8,27
0 3,70
100000 3,77
30000 2,08

Tabel di atas menunjukkan pasangan nilai untuk setiap mahasiswa. Kolom pertama (biaya.dalam.sepekan) akan menjadi sumbu X, dan kolom kedua (jarak) menjadi sumbu Y. Setiap baris akan menjadi satu titik pada scatterplot.

Mari kita buat scatterplot menggunakan ggplot2:

Scatterplot jarak tempuh vs biaya perjalanan dalam ribuan rupiah

Gambar 4.17: Scatterplot jarak tempuh vs biaya perjalanan dalam ribuan rupiah

Hubungan data terstruktur dengan scatterplot:

  • Setiap baris dalam tabel data menjadi satu titik pada grafik
  • Nilai kolom pertama (biaya perjalanan) menentukan posisi horizontal (X) titik
  • Nilai kolom kedua (jarak tempuh) menentukan posisi vertikal (Y) titik
  • Titik di koordinat (50, 10) artinya mahasiswa tersebut memiliki biaya perjalanan 50 ribu rupiah (nilai sudah dalam satuan ribu) dan jarak tempuh 10 km

Interpretasi: Scatterplot menunjukkan adanya hubungan positif antara biaya perjalanan (dalam ribuan rupiah) dan jarak tempuh mahasiswa ITERA. Mahasiswa yang tinggal lebih jauh dari kampus cenderung memiliki biaya perjalanan yang lebih tinggi, yang masuk akal karena mereka memerlukan lebih banyak bahan bakar atau biaya transportasi umum. Garis tren (garis putus-putus merah) menunjukkan arah umum hubungan ini. Informasi ini berguna untuk perencanaan kebijakan kampus terkait subsidi transportasi yang mungkin lebih diprioritaskan untuk mahasiswa yang tinggal jauh dari kampus.

4.3 Penggunaan dan Interpretasi Diagram

Memilih diagram yang tepat adalah kunci dalam menghasilkan analisis yang baik dan tajam. Setiap diagram memiliki karakteristik yang berbeda satu sama lain, sehingga penggunaannya harus disesuaikan dengan jenis variabel dan pesan yang ingin ditekankan.

Untuk memilih visualisasi yang paling efektif, mulailah dengan menjawab beberapa pertanyaan mendasar berikut:

  • Apa tujuan utama Anda? Apakah Anda ingin menunjukkan perbandingan, distribusi, komposisi, atau hubungan antarvariabel?
  • Ada berapa variabel yang ingin Anda tampilkan? Apakah hanya satu, dua, atau lebih?
  • Apa jenis nilai dan tingkat pengukuran dari variabel-variabel tersebut? Apakah kategorikal (nominal, ordinal) atau numerik (metrik)?

Jawaban dari pertanyaan-pertanyaan ini akan menuntun Anda pada pilihan diagram yang paling sesuai.

4.3.1 Pemilihan Diagram Berdasarkan Tujuan

Secara umum, tujuan visualisasi data dalam statistik dapat dikelompokkan menjadi beberapa empat kategori, yang masing-masing memiliki jenis diagram yang cocok. Berikut adalan penjelasan keempat kategori tersebut.

  1. Menampilkan Distribusi Frekuensi. Ini paling cocok untuk variabel kategorikal (nominal atau ordinal). Pilihan utamanya adalah grafik batang atau grafik lollipop, di mana panjang atau tinggi batang merepresentasikan jumlah atau frekuensi setiap kategori.
  2. Menampilkan Komposisi. Ketika Anda ingin menunjukkan bagian-bagian dari suatu keseluruhan, Anda sedang menampilkan komposisi. Grafik pai atau donat dapat dipakai untuk tujuan ini.
  3. Menampilkan Distribusi Nilai Numerik. Ketika Anda ingin menampilkan distribusi nilai numerik, Anda dapat menggunakan histogram atau boxplot. Untuk menampilkan ukuran-ukuran statistik penyebaran dengan lebih tegas, Anda dapat menggunakan boxplot.
  4. Menampilkan Hubungan Antar Variabel. Ketika Anda ingin menunjukkan hubungan antar variabel, Anda dapat menggunakan scatterplot atau line plot.

4.3.2 Pemilihan Diagram Berdasarkan Jumlah Variabel

Pemilihan diagram juga dapat Anda lakukan dengan melihat jumlah variabel yang ingin Anda tampilkan. Jika hanya satu variabel, Anda dapat menggunakan grafik batang atau grafik lollipop. Jika ada dua variabel, Anda dapat menggunakan scatterplot atau line plot.

Grafik batang juga dapat digunakan untuk menampilkan distribusi frekuensi dari dua variabel kategorikal dengan menggunakan grafik batang bertumpuk atau grafik batang berjejer.

4.3.3 Pemilihan Diagram Berdasarkan Tingkat Pengukuran Variabel

Secara umum, diagram yang digunakan untuk menampilkan data kategorikal adalah grafik batang atau grafik lollipop, sedangkan diagram yang digunakan untuk menampilkan data numerik adalah histogram atau boxplot.

Beberapa contoh pertimbangan dalam memilih diagram berdasarkan tingkat pengukuran variabel adalah sebagai berikut:

  1. Data Ordinal. Untuk data ordinal, Anda sangat disarankan untuk menggunakan grafik batang atau grafik lollipop yang diurutkan berdasarkan urutan kategori.
  2. Data Metrik. Histogram, boxplot, dan scatterplot adalah pilihan standar untuk visualisasi.

Ringkasan dari pemilihan diagram berdasarkan tujuan, jumlah variabel, dan tingkat pengukuran variabel tersebut dapat dilihat pada Gambar 4.18 berikut yang diambil dari Crazyegg (2017).

Panduan memilih jenis visualisasi

Gambar 4.18: Panduan memilih jenis visualisasi

Silakan kerjakan soal-soal evaluasi berikut terkait visualisasi data kuantitatif untuk menguji pemahaman Anda terhadap penjelasan-penjelasan yang telah Anda pelajari.

Soal Evaluasi 5

Perhatikan cuplikan data hasil survei mahasiswa berikut ini:

Tabel 4.10: Cuplikan data survei mahasiswa
KodeResp Usia Fakultas ThnMsk UangSaku Jarak
001 22 1 2020 2 19,27
002 25 1 2020 1 0,58
003 24 2 2021 1 0,56
004 19 3 2022 1 1,05
005 23 2 2021 1 1,69
006 20 1 2020 3 1,37

Adapun keterangan dari variabel-variabel tersebut (metadata) adalah sebagai berikut:

Tabel 4.11: Metadata variabel survei mahasiswa
Nama Variabel Deskripsi Nilai-nilai yang valid
KodeResp Nomor urut responden tiga digit angka, hingga jumlah responden minimal
Usia Usia responden (tahun) 18 - ∞
Fakultas Fakultas mahasiswa 1 = Fakultas Syariah,
2 = Fakultas Tarbiyah dan Keguruan,
3 = Fakultas Dakwah dan Komunikasi
ThnMsk Tahun masuk kuliah (Masehi) 2018 - 2022
UangSaku Uang saku mahasiswa per bulan 1 = <1 juta rupiah,
2 = 1-2 juta rupiah,
3 = 2-3 juta rupiah,
4 = 3-4 juta,
5 = >4 juta
Jarak Jarak tempat tinggal mahasiswa dari kampus (km) 0 - ∞
  1. Analisislah tiap-tiap variabel berdasarkan tingkat pengukuran variabelnya untuk menentukan jenis grafik apa yang bisa digunakan untuk memvisualkan variabel-variabel tersebut! STP-3.1
# Nama Variabel Tingkat Pengukuran Jenis Grafik yang Bisa Digunakan (bisa lebih dari 1)
a Usia
b Fakultas
c UangSaku
d ThnMsk
e Jarak
  1. Tentukan jenis grafik yang sesuai untuk beberapa tujuan visualisasi berikut STP-3.2:
    1. menampilkan distribusi frekuensi dari variabel Fakultas
    2. menampilkan distribusi frekuensi mahasiswa per ThnMsk dan Fakultas
    3. memperlihatkan median, kuartil atas, dan kuartil bawah variabel Usia
    4. memperlihatkan sebaran mahasiswa berdasarkan Jarak tempat tinggal mereka
  2. Analisislah mengapa grafik histogram tidak bisa digunakan untuk menampilkan distribusi frekuensi dari variabel Fakultas dan UangSaku! STP-3.4