EKSTRAKSI BERITA HOAX PADA TURN BACK HOAX BERBASIS PENDEKATAN TF-IDF & COSINE SIMILARITY

WILLIAM HIDAYAT (1), Jesen Ong (2), Umar Muhdhor (3), Hafiz Irsyad (4), Abdul Rahman (5)
(1) a:1:{s:5:"id_ID";s:32:"UNIVERSITAS MULTI DATA PALEMBANG";}, Indonesia,
(2) UNIVERSITAS MULTI DATA PALEMBANG, Indonesia,
(3) UNIVERSITAS MULTI DATA PALEMBANG, Indonesia,
(4) UNIVERSITAS MULTI DATA PALEMBANG, Indonesia,
(5) UNIVERSITAS MULTI DATA PALEMBANG, Indonesia

Abstrak

Perkembangan teknologi telah membawa perubahan besar dalam kehidupan masyarakat. Salah satunya akses terhadap berita dan artikel yang semakin mudah, dan bebas. Namun, fenomena ini juga memunculkan permasalahan serius, yaitu penyebaran berita hoaks yang sangat cepat dan masif. Penelitian ini bertujuan untuk mengekstraksi informasi penting dari artikel hoaks yang dipublikasikan di situs TurnBackHoax.id menggunakan pendekatan text mining berbasis TF-IDF dan cosine similarity. Data artikel hoaks diperoleh melalui teknik web scraping dengan pustaka Python seperti requests dan BeautifulSoup, diikuti oleh tahap prapemrosesan teks yang meliputi case folding, penghapusan tanda baca, angka, serta stopwords, dan stemming. Teks yang telah diproses kemudian direpresentasikan dalam bentuk vektor numerik menggunakan metode TF-IDF untuk menentukan bobot kata berdasarkan frekuensi dan kelangkaannya dalam korpus. Selanjutnya, cosine similarity digunakan untuk mengukur tingkat kemiripan antar dokumen, sementara kata kunci diekstraksi berdasarkan bobot TF-IDF tertinggi. Visualisasi Word Cloud juga diterapkan untuk menggambarkan kata-kata dominan secara visual. Berdasarkan hasil evaluasi, metode yang digunakan dalam penelitian ini berhasil mencapai tingkat ketepatan sebesar 93,15%, menunjukkan efektivitas pendekatan TF-IDF dan Cosine Similarity dalam menganalisis dan mengelompokkan artikel hoaks. Hasil penelitian menunjukkan bahwa pendekatan ini efektif dalam mengidentifikasi kata kunci penting dan mengelompokkan artikel hoaks berdasarkan kemiripan konten.


 


Kata kunci : Cosine Similarity,Hoaks,Text Mining, TF-IDF, kata kunci

Artikel teks lengkap

##article.generated_from_xml##

Penulis

WILLIAM HIDAYAT
williamhidayat_2226250035@mhs.mdp.ac.id (Kontak utama)
Jesen Ong
Umar Muhdhor
Hafiz Irsyad
Abdul Rahman
HIDAYAT, W., Ong, J., Muhdhor, U., Irsyad, H., & Rahman, A. (2025). EKSTRAKSI BERITA HOAX PADA TURN BACK HOAX BERBASIS PENDEKATAN TF-IDF & COSINE SIMILARITY. Computing Insight : Journal of Computer Science, 7(2), 1–11. https://doi.org/10.30651/comp_insight.v7i2.26678

Rincian Artikel