Pengertian Dan Fungsi Hadoop Dalam Big Data
Apa itu Apache™ Hadoop®?
Hadoop yakni library software (pustaka software) yang merupakan framework open source dari bahasa pemrograman Java dibawah lisensi Apache yang dipakai untuk melaksanakan pemrosesan big data memakai model pemrograman sederhana.
Artikel terkait: Apa itu Big Data?
Hadoop dirancang untuk melaksanakan komputasi data dari satu server hingga ribuan server yang dikoneksikan antara satu sama lainnya. Hal ini sanggup menunjukkan akomodasi dari sisi penyimpanan data untuk melaksanakan analisis data. Selain itu hadoop sanggup menunjukkan informasi real time untuk mendeteksi kesalahan terkait kegagalan jalan masuk dan ketersediaan data pada masing-masing server.
A. Pengertian dan Fungsi Hadoop dari Produk Utamanya
Hadoop merupakan sebuah framework yang terus dikembangkan untuk melaksanakan pemrosesan big data. Berikut produk utama yang dikembangkan dalam Hadoop.
-
Hadoop Common
Hadoop Common yakni library-library umum yang mendukung library lainnya untuk sanggup digunakan. Ini terkait perintah-perintah dasar yang ada pada Hadoop.
-
Hadoop Distributed File System (HDFS™)
Berbeda dengan system file data pada umumnya yaitu FAT32 dan NTFS yang sanggup menyimpan 1 file data berkisaran antara 4gb hingga 16tb. HDFS yakni format sistem file yang sanggup menampung 1 file data yang sangat besar dengan mengecilkan cluster sekelompok host data storage.
-
Hadoop YARN
Hadoop YARN yakni framework yang dipakai untuk mengatur pekerjaan secara berkala (schedule) dan administrasi cluster data.
-
Hadoop MapReduce
Hadoop MapReduce yakni paradigma pemrosesan data yang mengambil spesifikasi big data untuk memilih bagaimana data tersebut dijadikan input dan output untuk diterapkan. MapReduce terintegrasi dekat dengan HDFS untuk menyimpan data yang diperlukan.
B. Fungsi Produk terkait Apache Hadoop
Berikut beberapa produk yang sanggup diintegrasikan dengan Hadoop:
-
Ambari™
Produk ini dipakai pada sistem yang berbasis web untuk penyediaan, pengelolaan, dan pemantauan kluster Apache Hadoop yang meliputi pertolongan untuk HDFS Hadoop, Hadoop MapReduce, Hive, HCatalog, HBase, Zookeeper, Oozie, Pig, dan Sqoop. Ambari juga menyediakan dashboard untuk melihat kondisi klaster menyerupai heatmap dan kemampuan untuk melihat kondisi aplikasi MapReduce, Babi dan Hive secara visual. Ambari juga dilengkapi fitur untuk mendiagnosis karakteristik kinerja Hadoop dengan antarmuka yang ramah.
-
Avro™
Avro™ yakni sistem serialisasi data.
-
Cassandra™
Cassandra™ yakni database multi-master yang sanggup diukur untuk mengelola data yang berkapasitas besar.
-
Chukwa™
Chukwa™ yakni sistem pengumpulan data untuk mengelola sistem terdistribusi yang besar.
-
HBase™
HBase™ yakni database yang sanggup diukur untuk mendukung penyimpanan data terstruktur dengan tabel yang besar.
-
Hive ™
Hive™ yakni Infrastruktur data warehouse yang menyediakan data summarization dan ad hoc querying.
-
Mahout™
Mahout™ yakni library machine learning dan data mining.
-
Babi™
Babi™ yakni bahasa pemrograman tinggi pedoman data (data-flow) yang dipakai melaksanakan sanksi framework untuk melaksanakan komputasi data secara paralel.
-
Spark™
Spark™ yakni model pemrograman yang dipakai untuk menghitung data dengan cepat. Spark menyediakan model pemrograman yang sederhana dan ekspresif yang mendukung banyak sekali aplikasi, termasuk ETL, machine learning, stream processing, dan graph computation.
-
Tez™
Tez™ yakni framework bahasa pemrograman untuk membangun data-flow.
-
ZooKeeper™
ZooKeeper™ yakni layanan koordinasi untuk pendistribusian aplikasi dengan performa tinggi.
Baca juga tutorial lainnya: Daftar Isi Big Data
Sekian artikel Pengertian dan Fungsi Hadoop dalam Big Data. Nantikan artikel menarik lainnya dan mohon kesediaannya untuk share dan juga menyukai halaman Advernesia. Terima kasih…
Sumber https://www.advernesia.com/
0 Response to "Pengertian Dan Fungsi Hadoop Dalam Big Data"
Posting Komentar