Pengenalan Data Science dengan R

Mitha Ramadhani Pratiwi
3 min readFeb 20, 2021

--

Data scientist memerlukan software yang simple but powerful. Software tersebut adalah R.

R merupakan sebuah bahasa pemrograman sekaligus software untuk pengolahan data dan grafik. R sangat popular saat ini karena memiliki banyak pilihan pengolahan data dengan jumlah fitur yang sangat komplit. Dibandingkan dengan bahasa lain, R lebih cepat dipelajari dan dijalankan. Selain itu R bersifat gratis dan open source.

Dasar-dasar Pemrograman R

Untuk memulai pembelajaran pemrograman dengan R, mari kita coba memunculkan tulisan “Hello World” dengan mengetikkan “Hello World” pada R Script, kemudian mengklik tombol run untuk menjalankan R dan mengeluarkan hasil di bagian Console seperti berikut ini.

Selanjutnya mari kita praktek kembali dengan R untuk melakukan perhitungan sederhana dengan mengetikkan rumus 10+7 pada R Script dan menjalankan dengan tombol run untuk melihat hasilnya pada Console seperti berikut ini.

Dimana 17 merupakan hasil perhitungan dari rumus 10+7.

Penggunaan variable pada pemrograman sangat penting untuk menampung angka maupun teks di R dengan suatu nama. Berikut ini contoh penggunaannya.

Pada code diatas, kita membuat variable a diisi dengan angka 5. Selanjutnya mencetak isi variable a.

Comment merupakan teks untuk menambahkan keterangan pada code dan tidak dianggap sebagai kode yang bisa dieksekusi. Pada R penggunaan comment yaitu dengan mengawali suatu teks dengan tanda pagar (#). Berikut ini contoh penggunaannya.

Terlihat bahwa comment tidak diproses oleh R, yang ditampilkan hanya hasil perhitungan matematika.

Vector adalah suatu struktur data yang dapat menyimpan lebih dari satu data yang digunakan di R. Penggunaannya yaitu menggunakan fungsi c disertai data-data yang ingin disimpan. Berikut ini contoh penggunaannya.

Terlihat code diatas membuat tiga rangkaian angka yaitu 3, 10 dan 15 yang disimpan dan ditampilkan bersamaan dalam suatu vector.

Selain mengetikkan satu per satu data pada vector, bisa juga dengan membuat rangkaian data yang terurut menggunakan operator titik dua. Berikut contoh penggunaannya.

Pada code diatas, kita membuat vector dengan lima rangkaian angka, dari 1 sampai dengan 5.

Fungsi summary digunakan untuk menyimpulkan data yang kita proses.

Dapat diketahui bahwa pada vektor tersebut angka terkecilnya adalah 1, nilai kuartil 1nya adalah 2, nilai mediannya adalah 3, nilai rata-ratanya adalah 3, nilai kuartil 3nya adalah 4, dan angka terbesarnya adalah 5.

--

--

No responses yet