Temu Kembali Informasi Menggunakan Metode Vector Space Model Pada Majalah Suara Muhammadiyah Periode 2010 – 2015

Adi Sucipto(1*)

(1) STMM Yogyakarta
(*) Corresponding Author

Abstract

Temu kembali informasi berdasar peristiwa pada Majalah Suara Muhammadiyah periode 2010 – 2015 adalah untuk melihat banyaknya kata yang digunakan pada dokumen untuk menggambarkan topik yang dibahas pada dokumen tersebut. Temu kembali infomasi pada dokumen ini dibatasi untuk periode 2010 – 2015 dan dokumen yang dikumpulkan sebanyak 232 dokumen. Pengumpulan dokumen majalah Suara Muhammadiyah dalam bentuk digital yaitu berekstensi pdf. Ektraksi teks dokumen dari berkas pdf menggunakan pdfminer. Metode untuk temu kembali menggunakan Vector Space Model. Tahapan dimulai dari ekstraksi dokumen pdf menjadi teks,kemudian teks diparsing untuk menghapus tanda baca dan tanda hubung, penghapusan stopwords bahasa Indonesia untuk mengurangi kata-kata hubung dan kata-kata yang kurang bermakna, kemudian dilakukan pembobotan teks dan pencarian kemiripan teks untuk dapat menghitung dan mencari kembali informasi. Setelah dilakukan parsing dan pembobotan teks didapatkan bahwa teks yang banyak digunakan di dalam dokumen tersebut. Dengan hasil Precision sebesar 72.96% dan F1 measure sebesar 80.94. Sehingga artikel yang dapat ditemukan dengan kata kunci tertentu yang sesuai.

Keywords

Vector Space Model, Information Retrieval, Stemming, Dokumen, Tokenisasi, Python

Full Text:

PDF

References

M. W. Hasyim, “Dakwah Bertingkat Majalah Suara Muhammadiyah,” Jurnal Dakwah, vol. 9, no. 1, Art. no. 1, Jun. 2008, Accessed: Feb. 03, 2021. [Online]. Available: http://ejournal.uin-suka.ac.id/dakwah/jurnaldakwah/article/view/438.

I. Lanin, J. Geovedi, and W. Soegijoko, “Perbandingan distribusi frekuensi kata bahasa Indonesia di Kompas, Wikipedia, Twitter, dan Kaskus,” in Proceedings of Konferensi Linguistik Tahunan Atma Jaya Kesebelas (KOLITA11), Jakarta, 2013, pp. 249–252.

B. P. TP and I. Gunawan, “Sistem Information Retrieval Pencarian Kesamaan Ayat Terjemahan Al Quran Berbahasa Indonesia Dengan Query Expansion Dari Tafsirnya,” in Seminar Nasional “Inovasi dalam Desain dan Teknologi, 2015, pp. 100–108.

G. Karyono and F. S. Utomo, “Temu Balik Informasi Pada Dokumen Teks Berbahasa Indonesia Dengan Metode Vector Space Retrieval Model,” semantik, vol. 2, no. 1, Art. no. 1, Jun. 2012, Accessed: Feb. 02, 2021. [Online]. Available: http://publikasi.dinus.ac.id/index.php/semantik/article/view/141.

I. Irmawati, “Sistem Temu Kembali Informasi Pada Dokumen Dengan Metode Vector Space Model,” FIFO, vol. 9, no. 1, p. 74, May 2017, doi: 10.22441/fifo.2017.v9i1.009.

P. E. Mas’udia, M. D. Atmadja, and L. D. Mustafa, “Information Retrieval Tugas Akhir Dan Perhitungan Kemiripan Dokumen Mengacu Pada Abstrak Menggunakan Vector Space Model,” Simet, vol. 8, no. 1, pp. 355–362, Apr. 2017, doi: 10.24176/simet.v8i1.1016.

A. Fauzi and G. Ginabila, “Information Retrieval System Pada File Pencarian Dokumen Tesis Berbasis Text Menggunakan Metode Vector Space Model,” pilar, vol. 15, no. 1, pp. 41–46, Mar. 2019, doi: 10.33480/pilar.v15i1.61.

Y. Shinyama, PDFMiner. 2014.

F. Tala, “A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia,” 2003.

G. Salton and M. J. McGill, Introduction to modern information retrieval. New York: McGraw-Hill, 1983.

H. A. Robbani, Sastrawi. 2016.

M. Adriani, J. Asian, B. Nazief, S. M. M. Tahaghoghi, and H. E. Williams, “Stemming Indonesian: A confix-stripping approach,” ACM Transactions on Asian Language Information Processing, vol. 6, no. 4, pp. 1–33, Dec. 2007, doi: 10.1145/1316457.1316459.

Article Metrics

Abstract view(s): 516 time(s)
PDF: 198 time(s)

Refbacks

  • There are currently no refbacks.