EKSTRAKSI BERITA HOAX PADA TURN BACK HOAX BERBASIS PENDEKATAN TF-IDF & COSINE SIMILARITY
Abstrak
Perkembangan teknologi telah membawa perubahan besar dalam kehidupan masyarakat. Salah satunya akses terhadap berita dan artikel yang semakin mudah, dan bebas. Namun, fenomena ini juga memunculkan permasalahan serius, yaitu penyebaran berita hoaks yang sangat cepat dan masif. Penelitian ini bertujuan untuk mengekstraksi informasi penting dari artikel hoaks yang dipublikasikan di situs TurnBackHoax.id menggunakan pendekatan text mining berbasis TF-IDF dan cosine similarity. Data artikel hoaks diperoleh melalui teknik web scraping dengan pustaka Python seperti requests dan BeautifulSoup, diikuti oleh tahap prapemrosesan teks yang meliputi case folding, penghapusan tanda baca, angka, serta stopwords, dan stemming. Teks yang telah diproses kemudian direpresentasikan dalam bentuk vektor numerik menggunakan metode TF-IDF untuk menentukan bobot kata berdasarkan frekuensi dan kelangkaannya dalam korpus. Selanjutnya, cosine similarity digunakan untuk mengukur tingkat kemiripan antar dokumen, sementara kata kunci diekstraksi berdasarkan bobot TF-IDF tertinggi. Visualisasi Word Cloud juga diterapkan untuk menggambarkan kata-kata dominan secara visual. Berdasarkan hasil evaluasi, metode yang digunakan dalam penelitian ini berhasil mencapai tingkat ketepatan sebesar 93,15%, menunjukkan efektivitas pendekatan TF-IDF dan Cosine Similarity dalam menganalisis dan mengelompokkan artikel hoaks. Hasil penelitian menunjukkan bahwa pendekatan ini efektif dalam mengidentifikasi kata kunci penting dan mengelompokkan artikel hoaks berdasarkan kemiripan konten.
Â
Kata kunci : Cosine Similarity,Hoaks,Text Mining, TF-IDF, kata kunci
Artikel teks lengkap
Penulis
Hak Cipta (c) 2026 WILLIAM HIDAYAT, Jesen Ong, Umar Muhdhor, Hafiz Irsyad, Abdul Rahman

Artikel ini berlisensi Creative Commons Attribution 4.0 International License.
Hak cipta berada di tangan penulis
Artikel yang terbit dapat digunakan di bawah lisensi Creative Commons Atribusi 4.0 Internasional
Anda diperbolehkan:
- Berbagi — menyalin dan menyebarluaskan kembali materi ini dalam bentuk atau format apapun;
- Adaptasi menggubah, mengubah, dan membuat turunan dari materi ini untuk kepentingan apapun, termasuk kepentingan komersial.
Pemberi lisensi tidak dapat mencabut ketentuan di atas sepanjang Anda mematuhi ketentuan lisensi ini.
Berdasarkan ketentuan berikut:
- Atribusi Anda harus mencantumkan nama yang sesuai, mencantumkan tautan terhadap lisensi, dan menyatakan bahwa telah ada perubahan yang dilakukan. Anda dapat melakukan hal ini dengan cara yang sesuai, namun tidak mengisyaratkan bahwa pemberi lisensi mendukung Anda atau penggunaan Anda.
- Tidak ada pembatasan tambahan Anda tidak dapat menggunakan ketentuan hukum atau sarana kontrol teknologi yang secara hukum membatasi orang lain untuk melakukan hal-hal yang diizinkan lisensi ini.