Tutorial Pemasangan CentOS 6 di Server

CentOS adalah distribusi linux berbasis Red Hat Enterprise Linux (RHEL). CentOS dikelola oleh komunitas dan dapat diunduh secara gratis dari situs resminya. Manajemen paket yang digunakan adalah RPM, sama halnya dengan RHEL. CentOS umum digunakan untuk server. Pada post ini, saya akan berbagi mengenai Tutorial Instalasi CentOS 6. Dalam hal ini, akan digunakan CentOS 6.7 Minimal yang dapat diunduh di situs CentOS. Tutorial menggunakan mesin virtual KVM dengan spesifikasi satu core CPU, memori 1GB, satu NIC, HDD 15GB. Perlu diketahui, alokasi memori dibawah 1GB hanya dapat menggunakan pemasangan berbasis teks. Dalam tutorial ini, saya akan menggunakan Logical Volume Manager (LVM) untuk partisi harddisk. ...

June 13, 2016 · 2 min · 321 words · Me

Twitter Mining with R : Tweet Analysis, Bagian 2

Pengantar Pada tulisan ini akan melanjutkan proses selanjutnya setelah mendapatkan data dengan Twitter API. Jika ingin mengunduh dataset tanpa mengambil online dari twitter, silakan unduh melalui link berikut : Tweet @RadioElshinta Stopwords Indonesia Text Cleaning Setelah akuisisi data, langkah selanjutnya adalah Text Cleaning . Tahapan ini meliputi sub-proses antara lain stopwords removal, whitespaces stripping, dan stemming. library(tm) library(SnowballC) load(file = "elshinta.RData") tweets.df <- twListToDF(tweets_data) corpus <- Corpus(VectorSource(tweets.df$text)) # lowercase konten corpus <- tm_map(corpus,content_transformer(tolower)) # hapus url, dan tanda baca removeURL <- function(x) gsub("http[^[:space:]]*", "", x) corpus <- tm_map(corpus, content_transformer(removeURL)) corpus <- tm_map(corpus, removePunctuation) # buat stopwords Indonesia file_stop <- file("stopwords.txt",open = "r") id_stopwords <- readLines(file_stop) close(file_stop) id_stopwords = c(id_stopwords, "amp") # hapus stopwords, angka, whitespace corpus <- tm_map(corpus, removeWords, id_stopwords) corpus <- tm_map(corpus, removeNumbers) corpus <- tm_map(corpus, stripWhitespace) corpus <- tm_map(corpus, PlainTextDocument) # tampilkan konten tweet ke 125 writeLines(strwrap(corpus[[125]]$content)) # TDF dan DTF untuk corpus dataset elshinta dtm = DocumentTermMatrix(corpus) tdm = TermDocumentMatrix(corpus) Untuk kasus ini, bahasa yang digunakan adalah bahasa Indonesia. Sedangkan pada R tidak tersedia untuk bahasa Indonesia. Sehingga, perlu membuat sendiri stopwords custom. ...

June 12, 2016 · 1 min · 199 words · Me

Twitter Mining with R : Tweet Analysis, Bagian 1

Pengantar Pada tulisan sebelumnya, Introduction to Twitter Mining with R telah dipaparkan pengantar tentang Text Mining pada Twitter dengan R. Pada tulisan ini akan dibahas tentang Tweet Analysis. Secara utuh, yang akan saya lakukan adalah : Mengambil data tweet dengan R menggunakan paket twitteR. Text cleaning dengan paket tm pada R. Menampilkan Terms Frequency Membuat wordcloud berdasar term yang didapat. Mengambil Data Tweets Sebelumnya, pastikan telah membuat Twitter App seperti pada tulisan sebelumnya. Kemudian, pada tulisan ini saya menggunakan RStudio. ...

June 11, 2016 · 2 min · 266 words · Me

Introduction to Twitter Mining with R

Pengantar Twitter dan Twitter Apps Twitter adalah media sosial berbasis teks dengan maksimal huruf sebanyak 140 dalam satu tulisan (disebut tweet). Twitter kerapkali digunakan sebagai sumber data untuk diolah karena akuisisi data tidak terlalu kompleks jika dibandingkan media sosial lain. Untuk mengambil data pada twitter, kita dapat memanfaatkan Twitter Application. Ikuti langkah berikut: Buka Twitter Apps. Buat app baru dengan klik create new app. Isi detail app, lanjutkan. App baru akan dibuat. Outline Tutorial Pada tulisan ini, saya akan mencoba untuk melakukan analisis data dengan dataset yang diperoleh dari twitter menggunakan R. Sebelumnya, berikut adalah kakas yang saya gunakan : ...

June 11, 2016 · 1 min · 189 words · Me

RStudio : IDE untuk R

Pengantar R adalah perangkat lunak yang dikembangkan oleh R Foundation dan merupakan bagian dari GNU Project. Pada situs resminya di r-project dikatakan bahwa : R is a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS. R digunakan untuk keperluan komputasi statistik dan grafik, mirip dengan Matlab namun R bersifat Free Software dengan lisensi GNU Public License. ...

June 11, 2016 · 1 min · 190 words · Me