Analisis Dataset TOP 1000 IMDb Movies Menggunakan Hadoop

Authors

  • M. Nauval Perdana Universitas Sriwijaya
  • Intan Permatahati

DOI:

https://doi.org/10.1233/jnca.v2i2.86

Keywords:

IMDB , Top Movies, Hadoop, Big Data, Multinode

Abstract

Dalam studi ini, kami mengeksplorasi analisis dataset TOP 1000 IMDb Movies dengan memanfaatkan keunggulan kerangka kerja Hadoop. Pertama-tama, untuk mengatasi tantangan pemrosesan data yang tidak terstruktur, kami menerapkan strategi khusus melalui infrastruktur yang mampu menangani volume besar dan kompleksitas data, yang umumnya dikenal sebagai Big Data. Kerangka kerja Hadoop telah terbukti efektif dalam menangani tugas-tugas semacam ini dengan menyediakan lingkungan yang terdistribusi untuk pemrosesan data secara paralel. Kemudian, untuk mengoptimalkan kueri data pada dataset IMDb, kami mengadopsi pendekatan dengan menggunakan Python. Keunggulan Python sebagai bahasa pemrograman untuk analisis data memberikan fleksibilitas dan keterbacaan kode, sementara implementasi multinode memungkinkan pemrosesan data yang terdistribusi untuk meningkatkan efisiensi. Gabungan dari kerangka kerja Hadoop, Python, dan pendekatan multinode menghasilkan pendekatan analisis yang efisien dan handal untuk dataset film IMDb TOP 1000.

Downloads

Published

2023-12-05