Pengenalan Teknis R

Sebelum memulai praktikum dengan set data sesungguhnya, ada baiknya kita memahami beberapa konsep teknis dasar dalam bahasa pemrograman R. Bagian ini merangkum keterampilan-keterampilan dasar yang akan kalian temui tersebar di modul-modul praktikum.

0.6 Pengaturan Direktori

Salah satu keterampilan penting dalam bekerja dengan R adalah mengorganisasi file dan data dengan baik. Sepanjang semester ini, kalian akan bekerja dengan berbagai dataset, kode R, dan hasil analisis. Pengaturan direktori yang terstruktur akan memudahkan kalian dalam mengelola semua file tersebut dan memastikan kode dapat berjalan dengan lancar.

0.6.1 Struktur Direktori yang Ideal

Sebelum memulai praktikum, kalian perlu menyiapkan direktori kerja (working directory) yang terorganisir dengan baik. Berikut adalah struktur direktori yang wajib kalian gunakan sepanjang semester:

Praktikum STP 2026/
├── Praktikum STP 2026.Rproj
├── datasets/
│   ├── data.csv
│   └── ...
├── output/
│   ├── output_1.xlsx
│   └── ...
├── modul_1.R
└── modul_2.R

Komponen-komponen penting:

  • Praktikum STP 2026.Rproj: File RStudio Project yang mengatur working directory secara otomatis dan menyimpan environment kerja kalian.
  • datasets/: Folder khusus untuk menyimpan semua dataset mentah (file Excel, CSV, atau format lainnya yang kalian terima dari asisten praktikum).
  • output/: Folder khusus untuk menyimpan hasil-hasil analisis seperti file Excel yang sudah diolah, file CSV hasil export, atau grafik yang dihasilkan.
  • modul_1.R, modul_2.R, …: File-file kode R (script) yang akan kalian buat untuk setiap modul praktikum.

Dengan struktur seperti ini, kode R kalian akan lebih ringkas dan portabel. Sebagai contoh, untuk membaca data, kalian cukup menulis:

data <- read.xlsx("datasets/data_penduduk.xlsx")

Tanpa perlu menulis path lengkap seperti C:\Users\NamaAnda\Documents\praktikum\data_penduduk.xlsx yang panjang, rumit, dan berbeda-beda di setiap komputer.

0.6.2 Membuat dan Mengatur Direktori Praktikum

Ikuti langkah-langkah berikut untuk menyiapkan direktori praktikum kalian:

0.6.2.1 Langkah 1: Membuat Folder Utama

Buatlah sebuah folder di komputer kalian dengan nama Praktikum STP 2026 (sesuai tahun ajaran yang sedang berjalan). Penamaan yang seragam ini sangat penting agar asisten praktikum dapat dengan mudah membantu kalian jika terjadi masalah atau kesalahan.

Folder ini akan menjadi direktori kerja (working directory) kalian selama satu semester penuh.

0.6.2.2 Langkah 2: Membuat Subfolder datasets dan output

Di dalam folder Praktikum STP 2026, buatlah dua subfolder:

  1. Subfolder datasets - untuk menyimpan semua data mentah
  2. Subfolder output - untuk menyimpan hasil analisis

Cara membuat folder:

  • Di Windows: Klik kanan di dalam folder Praktikum STP 2026 → pilih NewFolder → beri nama datasets, lalu ulangi untuk membuat folder output
  • Di Mac/Linux: Klik kanan di dalam folder Praktikum STP 2026 → pilih New Folder → beri nama datasets, lalu ulangi untuk membuat folder output

Setiap kali kalian mendapatkan dataset baru untuk praktikum (misalnya file Excel atau CSV dari asisten), simpanlah di dalam folder datasets. Setiap kali kalian menghasilkan output analisis, simpanlah di dalam folder output.

0.6.2.3 Langkah 3: Mengubahnya Menjadi RStudio Project

Setelah struktur folder dasar sudah siap, langkah selanjutnya adalah mengubahnya menjadi RStudio Project. RStudio Project adalah fitur yang sangat berguna untuk mengelola sesi kerja R kalian.

Keuntungan RStudio Project:

  1. Otomatis mengatur working directory: Ketika kalian membuka sebuah Project, RStudio otomatis mengatur working directory ke folder tersebut, sehingga kalian tidak perlu menggunakan perintah setwd() lagi.

Perintah setwd() digunakan untuk mengatur working directory secara manual. Misalnya, jika kita ingin mengatur working directory ke folder Praktikum STP 2026 yang terletak dalam folder Documents pada direktori C:/Users/NamaAnda/, kita bisa menggunakan perintah

setwd("C:/Users/NamaAnda/Documents/Praktikum STP 2026")

Namun, jika kita sudah membuat direktori Anda sebagai Project, dalam praktikum ini, kita tidak perlu menggunakan perintah ini lagi.

  1. Mempertahankan status kerja: RStudio menyimpan environment (variabel, data yang sudah dimuat) sehingga kalian bisa melanjutkan pekerjaan dari tempat terakhir kalian berhenti.
  2. Memudahkan manajemen path: Kalian cukup menulis relative path (misalnya datasets/data.xlsx) tanpa perlu mengetik path lengkap yang panjang dan berisiko error.
  3. Portabilitas: Project folder bisa dipindahkan ke komputer lain atau dibagikan ke rekan tanpa perlu mengubah kode, karena semua path bersifat relatif.

Cara membuat RStudio Project:

  1. Buka RStudio
  2. Pilih menu File → New Project…
  3. Pilih Existing Directory (karena folder sudah dibuat)
  4. Klik Browse… dan cari folder Praktikum STP 2026 yang sudah kalian buat
  5. Klik Create Project

Setelah itu, RStudio akan membuat file Praktikum STP 2026.Rproj di dalam folder kalian. File .Rproj ini adalah “pintu masuk” ke Project kalian.

Setiap kali ingin bekerja: Cukup double-click file Praktikum STP 2026.Rproj tersebut, dan RStudio akan terbuka dengan working directory yang sudah otomatis diatur ke folder praktikum kalian. Kalian siap untuk mulai bekerja!

Catatan Penting: Selalu buka RStudio melalui file .Rproj, bukan dengan membuka RStudio terlebih dahulu lalu membuka script. Ini memastikan working directory selalu benar dan kode kalian berjalan sebagaimana mestinya.

0.6.3 Mengunduh Dataset Praktikum dari GitHub

Setelah struktur direktori dan Project sudah siap, langkah selanjutnya adalah mengunduh dataset-dataset praktikum yang akan digunakan sepanjang semester. Semua dataset praktikum disimpan di repository GitHub dan dapat diunduh secara gratis.

Mengapa Dataset Disimpan di GitHub? {.tajuksaya}

Dataset praktikum disimpan di GitHub agar: - Semua mahasiswa mendapatkan dataset yang sama dan terbaru - Dataset dapat diakses kapan saja tanpa perlu menunggu distribusi dari asisten - Jika ada pembaruan dataset, kalian bisa mengunduh ulang dengan mudah - Dataset tidak hilang meskipun laptop rusak atau file terhapus

0.6.3.1 Langkah-Langkah Mengunduh Dataset

Ikuti langkah-langkah berikut dengan seksama untuk mengunduh folder datasets/ dari GitHub:

1. Buka halaman GitHub repository praktikum

Klik link berikut atau copy-paste ke browser kalian:

https://github.com/abdulmubdibindar/praktikum-r-stp

Kalian akan melihat halaman repository yang berisi semua file praktikum.

2. Download seluruh repository sebagai file ZIP

  • Di halaman GitHub, cari dan klik tombol hijau “Code” di bagian kanan atas
  • Pada menu yang muncul, pilih “Download ZIP”
  • Simpan file ZIP di lokasi yang mudah kalian temukan (misalnya folder Downloads atau Desktop)
  • Tunggu hingga proses download selesai

3. Ekstrak file ZIP yang sudah didownload

  • Buka folder tempat kalian menyimpan file ZIP (misalnya Downloads)
  • Klik kanan pada file praktikum-r-stp-main.zip
  • Pilih “Extract All…” atau “Extract Here” (di Windows)
  • Atau untuk Mac/Linux: double-click file ZIP, akan otomatis ter-ekstrak
  • Setelah ekstrak selesai, akan muncul folder bernama praktikum-r-stp-main

4. Copy folder datasets ke dalam Project RStudio kalian

Ini adalah langkah paling penting! Ikuti dengan teliti:

  • Buka folder praktikum-r-stp-main yang baru diekstrak
  • Di dalam folder tersebut, cari folder bernama datasets
  • Klik kanan pada folder datasets, lalu pilih “Copy” (atau tekan Ctrl + C)
  • Buka folder Praktikum STP 2026 (folder Project RStudio kalian)
  • Klik kanan di dalam folder tersebut, lalu pilih “Paste” (atau tekan Ctrl + V)
  • Folder datasets beserta seluruh isinya sekarang sudah tersalin ke Project kalian

5. Verifikasi dataset sudah tersimpan dengan benar

Untuk memastikan dataset sudah tersimpan di lokasi yang benar, buka RStudio (klik file .Rproj kalian), lalu jalankan kode berikut di Console:

Jika hasilnya TRUE, berarti folder datasets sudah berada di lokasi yang benar! ✓

Selanjutnya, cek isi folder datasets dengan kode:

Kalian akan melihat daftar file-file dataset seperti Data Praktikum 01.xlsx, Data Praktikum 02.xlsx, DataUtama_mhsUBL.csv, dan lain-lain.

Struktur Folder yang Benar {.header}

Pastikan struktur folder Project kalian sekarang terlihat seperti ini:

Praktikum STP 2026/           ← Folder Project kalian
├── Praktikum STP 2026.Rproj  ← File Project RStudio
├── datasets/                 ← Folder datasets (HARUS ada di sini!)
│   ├── Data Praktikum 01.xlsx
│   ├── Data Praktikum 02.xlsx
│   ├── Data Praktikum 03.xlsx
│   ├── DataUtama_mhsUBL.csv
│   ├── DataUtama_mhsUINRIL.csv
│   ├── DataUtama_mhsUNILA.csv
│   ├── DataUtama_mhsITERA.csv
│   ├── data_mahasiswa.csv
│   └── ... (file-file dataset lainnya)
├── output/                   ← Folder untuk hasil analisis
└── ... (file .R kalian)

PENTING: Jika folder datasets berada di lokasi lain (misalnya di Desktop atau Downloads), kode praktikum tidak akan bisa membaca dataset. Pastikan folder datasets berada langsung di dalam folder Praktikum STP 2026.

0.7 Sintaks Dasar Bahasa R

Dalam subbab ini, kita akan membahas sintaks dasar bahasa R yang akan sering digunakan dalam praktikum ini.

0.7.1 Komentar

Pada dasarnya, semua yang kita tulis di script akan dijalankan oleh R. Akan tetapi, kita bisa memberi tahu R untuk tidak menjalankan kode yang kita tulis dengan mengubah formatnya menjadi komentar (comment). Kita bisa menuliskan komentar dengan menggunakan tanda pagar (#) sebelum kode yang ingin kita komentari.

# Kode ini akan menghitung 1 + 1
1 + 1 

Komentar sangat berperan penting dalam kode kalian. Malahan, ini adalah kekuatan terbesar dari penggunaan R dalam Kita akan sering menggunakan komentar dalam kode kalian. Jadi, jangan ragu untuk menggunakan komentar untuk menjelaskan kode kalian.

0.7.1.1 Komentar Blok (Block Comment)

Untuk menulis komentar yang panjang (lebih dari satu baris), kita bisa menggunakan komentar blok. Ada dua cara:

Cara 1: Tanda Pagar di Setiap Baris

# Ini adalah komentar blok
# yang terdiri dari beberapa baris
# untuk menjelaskan konsep yang kompleks
hasil <- data.ubl |>
  filter(Jenis.Kelamin == "Laki-Laki") |>
  summarize(rata_rata = mean(jarak))

Cara 2: Menggunakan if(FALSE)

if(FALSE) {
  Ini adalah komentar blok alternatif.
  Semua teks di dalam kurung kurawal tidak akan dijalankan.
  Berguna untuk men-disable blok kode sementara saat debugging.
}

Kapan Menggunakan Komentar Blok?

  • Menulis jawaban analisis yang panjang (misalnya interpretasi hasil statistik)
  • Mendokumentasikan proses pemikiran Anda
  • Men-disable sementara kode yang tidak ingin dihapus
  • Menjawab soal Aktivitas Mandiri dalam bentuk teks

0.7.2 Variabel

Variabel adalah tempat menyimpan data dan informasi di R. Variabel terdiri atas nama variabel dan nilainya, Cara mendeklarasikan variabel adalah dengan operator <-. Operator deklarasi bisa dimasukkan dengan hotkey Alt + I.

Contoh:

a <- 1 # 'a' adalah nama variabel yang nilainya 1
b <- 2 # 'b' adalah nama variabel yang nilainya 2

Meskipun kita bisa menggunakan = untuk meng-assign nilai ke variabel, praktik tersebut tidak lazim dipakai dalam komunitas R. Oleh karena itu, tetap gunakan assignment operator <- untuk memberi nilai pada suatu variabel.

Variabel juga bisa dideklarasikan menggunakan operasi matematika dan variabel sebelumnya.

hasil <- a + b

paste("Hasil:", hasil)
## [1] "Hasil: 3"

Untuk menampilkan nilai variabel tuliskan kembali nama variabelnya lalu jalankan.

a
## [1] 1
b
## [1] 2
hasil
## [1] 3

0.7.3 Konvensi Penamaan dalam R

R mendukung beberapa gaya penamaan variabel. Penting untuk diingat bahwa R membedakan huruf besar dan kecil (case-sensitive), sehingga data berbeda dengan Data, JenisKelamin berbeda dengan jeniskelamin, dan "Laki-Laki" berbeda dengan "Laki-laki". Kesalahan dalam kapitalisasi adalah sumber error yang sangat umum bagi pemula.

R mendukung beberapa gaya penamaan variabel:

  1. snake_case (disarankan untuk variabel R):
    • data_mahasiswa, jarak_tempuh, biaya_sepekan
    • Menggunakan garis bawah (_) untuk memisahkan kata
  2. dot.notation (umum untuk nama kolom):
    • data.ubl, Jenis.Kelamin, biaya.dalam.sepekan
    • Menggunakan titik (.) untuk memisahkan kata
    • Sering muncul saat mengimpor data dari Excel
  3. camelCase (jarang dipakai di R):
    • dataMahasiswa, jarakTempuh
    • Huruf besar menandai awal kata baru

Rekomendasi:

  • Gunakan snake_case untuk nama variabel/objek R yang Anda buat sendiri
  • Gunakan dot.notation untuk nama kolom dataset (konsisten dengan output dari Excel)
  • Hindari spasi dan karakter khusus dalam nama variabel
  • Gunakan nama yang deskriptif: data_ubl lebih baik dari d1
  • Konsisten: Pilih satu gaya dan gunakan terus sepanjang kode Anda

Aktivitas Mandiri: Membuat Variabel Disertai Komentar

  1. Buatlah variabel dengan nama nama yang nilainya adalah nama kalian.
  2. Buatlah variabel dengan nama nim yang nilainya adalah NIM kalian.
  3. Buatlah variabel dengan nama prodi yang nilainya adalah program studi kalian.
  4. Buatlah variabel dengan nama angkatan yang nilainya adalah angkatan kalian.
  5. Tambahkan komentar pada baris paling atas bahwa variabel-variabel di bawahnya adalah “Identitas Saya”.
  6. Tampilkan nilai variabel nama, nim, prodi, dan angkatan dengan perintah berikut.
cat("Nama saya adalah",nama,". NIM saya adalah",nim,". Saya adalah mahasiswa",prodi," angkatan",angkatan,".")

0.8 Paket (Packages)

R memiliki ribuan paket tambahan yang menyediakan fungsi-fungsi khusus.

  • install.packages("nama_paket"): Digunakan untuk mengunduh dan menginstal paket dari internet ke komputer kita. Ini cukup dilakukan satu kali saja. Perhatikan bahwa nama paket ditulis dengan tanda " di awal dan akhir nama paket yang akan diinstal.
  • library(nama_paket): Digunakan untuk memuat paket yang sudah terinstal ke dalam sesi kerja kita agar isinya bisa digunakan. Ini harus dilakukan setiap kali kita membuka RStudio baru. Perhatikan bahwa tanda " tidak perlu lagi ditulis ketika kita ingin memuat paket yang sudah kita instal.

Aktivitas Mandiri: Instalasi Paket

Berikut adalah paket-paket yang akan kita gunakan selama praktikum ini. Instalasilah paket-paket berikut di komputer kalian:

  • tidyverse
  • openxlsx
  • gtsummary
  • flextable
  • treemapify
  • MKinfer
  • rcompanion
  • RCPA3
  • vcdExtra
  • psych

Tunggu hingga masing-masing proses instalasi selesai. Ingat, tahap ini hanya perlu dilakukan satu kali saja.

0.9 Fungsi (Functions)

Fungsi adalah serangkaian instruksi yang dibungkus menjadi satu perintah untuk melakukan tugas tertentu. R memiliki banyak fungsi bawaan yang berguna untuk banyak hal, seperti print() untuk menampilkan output, mean() untuk menghitung rata-rata, atau sum() untuk menghitung jumlah.

0.9.1 Menggunakan Fungsi

Untuk menggunakan fungsi, kita memanggil namanya diikuti dengan tanda kurung (). Di dalam tanda kurung, kita bisa memasukkan argumen (input).

# Contoh fungsi bawaan: mean (rata-rata)
nilai <- c(10, 20, 30)
rata_rata <- mean(nilai) # Hasil: 20

0.9.2 Membuat Fungsi Sendiri

Kita dapat membuat fungsi buatan kita sendiri menggunakan perintah function(). Struktur dasarnya adalah sebagai berikut:

nama_fungsi <- function(input) {
  # Proses yang dilakukan
  hasil <- input * 2
  return(hasil)
}

Penjelasan:

  • nama_fungsi: Nama yang akan kita gunakan untuk memanggil fungsi ini.
  • function(input): Mendefinisikan bahwa kita membuat sebuah fungsi yang menerima satu argumen bernama input.
  • { ... }: Blok kode yang berisi instruksi yang akan dijalankan.
  • return(hasil): Mengembalikan nilai hasil sebagai output dari fungsi.

Aktivitas Mandiri: Membuat Fungsi Sendiri

  1. Buatlah dua variabel dengan nama c dan d dengan nilai 10 dan 20
  2. Buatlah fungsi dengan nama kali_dua yang menerima satu argumen x sebagai berikut:
kali_dua <- function(x) {
  # Proses yang dilakukan
  hasil <- x * 2
  return(hasil)
}
  1. Jalankan fungsi tersebut dengan argumen nilai c dan d dan simpan nilainya berturut-turut pada variabel c_kali2 dan d_kali2.
  2. Tampilkan nilai variabel c_kali2 dan d_kali2.

Ini akan sangat berguna ketika kita ingin melakukan perhitungan yang sama berulang kali, seperti pada perhitungan IQV di Modul 2.

0.10 Struktur Data Dasar

Kita perlu mengenal jenis-jenis struktur data yang ada di R. Mereka akan sangat sering kita gunakan selama praktikum ini.

0.10.1 Vektor

Vektor adalah struktur data paling dasar di R yang dapat menampung lebih dari satu nilai. Kita membuatnya dengan fungsi c() (combine).

Ciri utama vektor adalah semua elemen di dalamnya harus memiliki tipe data yang sama. Jika tidak, R akan mengubah tipe data elemen tersebut menjadi tipe data yang paling umum.

angka <- c(1, 2, 3, 4, 5)
huruf <- c("a", "b", "c")
campuran <- c(1, "a", TRUE) # R akan mengubah tipe data elemen tersebut menjadi tipe data yang paling umum, yaitu character/string

Aktivitas Mandiri: Membuat Vektor

  1. Buatlah vektor dengan nama nilai_ujian yang berisi nilai ujian 5 mahasiswa berikut: 85, 90, 78, 92, 88
  2. Buatlah vektor dengan nama fakultas yang berisi nama-nama fakultas di ITERA
  3. Buatlah vektor dengan nama apa_saja yang berisi nilai 1 dan "a"
  4. Tampilkan tipe data dari variabel nilai_ujian, fakultas, dan apa_saja. Perhatikan hasil pada bagian apa_saja. Apa jenis nilai-nilai dalam vektor tersebut?

0.10.2 List

List adalah struktur data yang dapat menampung banyak nilai yang berbeda tipe datanya.

list_saya <- list("kucing", 1, TRUE)
list_saya # Untuk menampilkan nilai list_saya

List juga bahkan dapat menampung vektor.

list_saya <- list(c(1, 2, 3), c("a", "b", "c"), c(TRUE, FALSE, TRUE))
list_saya

Kita dapat memberi nama elemen-elemen dalam list dengan mengetikkan nama elemen dan diikuti tanda = sebelum nilai elemen tersebut.

list_saya <- list(nama = "Budi", nilai_ujian = c(85, 90, 78), fakultas = "FTI")

Aktivitas Mandiri: Membuat List

  1. Buatlah list dengan nama list_saya yang berisi nama, nilai ujian, dan fakultas
  2. Tampilkan nilai variabel list_saya

0.10.3 Tipe Data

Saat mengolah data, kalian akan sering menemukan singkatan tipe data berikut:

  • dbl (Double): Angka numerik (bisa desimal).
  • chr (Character): Teks atau string. Ditandai dengan tanda kutip.
  • fct (Factor): Data kategorik (bisa nominal atau ordinal). Factor menyimpan nilai sebagai angka di belakang layar namun menampilkan label teks, yang berguna untuk analisis statistik dan plot.

0.10.4 Data Frame dan Tibble

Data dalam R biasanya disimpan dalam bentuk tabel yang disebut Data Frame. Di era modern (tidyverse), kita sering menggunakan versi yang lebih canggih disebut Tibble. Strukturnya mirip spreadsheet: baris mewakili observasi, kolom mewakili variabel.

0.11 Operator Pipa (|>)

Dalam tidyverse, kita sering menggunakan operator pipa (|>) untuk merangkai beberapa perintah sekaligus. Bayangkan ini sebagai penyambung proses:

# Tanpa pipa
hasil <- fungsi_2(fungsi_1(data))

# Dengan pipa (lebih mudah dibaca)
data |> 
  fungsi_1() |> 
  fungsi_2()

Artinya: “Ambil data, lalu fungsi_1, kemudian hasilnya dimasukkan ke fungsi_2.”

Kita akan mempelajari penggunaan operator pipa (|>) secara lebih praktis dalam Modul 1.

0.12 Manajemen Data (Input/Output)

Ini adalah kemampuan yang penting dalam pengolahan data di R karena seringkali kita perlu mengolah data dari file eksternal (seperti Excel) atau menyimpan data hasil pengolahan ke file eksternal.

Kita akan mempraktikkan kemampuan ini lebih banyak mulai di Modul 1.

0.12.1 Membaca Data

Kita sering menggunakan read.xlsx() dari paket openxlsx untuk membaca file Excel.

data <- read.xlsx("folder/nama_file.xlsx", sheet = "nama_sheet")

0.12.2 Menyimpan Data

Setelah diolah, data bisa disimpan kembali ke Excel atau CSV.

write.xlsx(data, "folder/nama_file_baru.xlsx")
write.csv2(data, "folder/nama_file_baru.csv") # Format CSV Excel Indonesia (pemisah titik koma)