Rabu, 14 Desember 2016

MAKALAH BIG DATA

BAB I
PENDAHULUAN

1.1 LATAR BELAKANG

Pada masa sekarang, Sistem Informasi Manajemen sangat diperlukan dalam dunia bisnis. Sistem Informasi Manajemen yang baik akan memberikan dampak yang baik pula bagi suatu perusahaan. Dari tahun ke tahun perkembangan Teknologi pula semakin canggih. Hal ini berdampak juga pada Informasi-informasi yang di peroleh dalam Sistem Informasi.

Suatu bisnis tentunya memerlukan suatu informasi yang dapat menunjang perusahaannya. Informasi-informasi yang didapatkan akan diproses sedemikian rupa hingga menjadi suatu keputusan dalam manajemen. Dalam memperoleh Informasi tentunya dibutuhkan suatu media untuk menampung segala informasi yang didapatkan dari sumber-sumber terpercaya. Dengan demikian terciptalah Big Data dalam dunia Teknologi Informasi.

Big Data sendiri merupakan media penyimpanan data yang menawarkan ruang tak terbatas, serta kemampuan untuk mengakodasi dan memproses berbagai jenis data dengan sangat cepat. Jadi kini, banyak perusahaan yang sudah memanfaatkan Big Data agar dapat menyimpan segala datanya tanpa kendala dan menghindari hilangnya informasi-informasi yang dimiliki.

1.2 RUMUSAN MASALAH
1.                  Apa yang dimaksud dengan Big Data?
2.                  Apa saja karakteristik dari Big Data?
3.                  Bagaimana penggunaan Big Data dalam Perusahaan?
4.                  Apa saja permasalahan dalam Big Data?

1.3 TUJUAN

1.                  Mengetahui tentang sejarah Big Data
2.                  Mengetahui tentang pengertian Big Data
3.                  Mengetahui tentang karakteristik Big Data
4.                  Mengetahui tentang penggunaan Big Data dalam Perusahaan
5.                  Mengetahu permasalahan dalam Big Data









BAB II
PEMBAHASAN

2.1  SEJARAH BIG DATA

Sebelum mempelajari suatu hal tentu diperlukan untuk memahami asal muasal atau sejarah dari hal yang ingin dipelajari tersebut, ada pun tentang topic kali ini penulis akan memperkenalkan sejarah big data. Berikut urutannya;

1944    - Fremont Rider, Pustakawan universitas Wesleyan. Dia memperkirakan bahwa 
              Perpustakana yang ada di amerika serikat ukurannya meningkat dua kali lipat
  setiap 16 tahun
1961    - Derek Price. Dia mendiagramkan pertumbuhan pengetahuan ilmiah dengan
  cara melihat jumlah pertumbuhan jurnal ilmiah dan makalah
1967    - B.A. Marron dan P.A.D. De Maine menerbitkan "Automatic data compression"
dalam Komunikasi dari ACM, yang menyatakan bahwa "ledakan informasi”
tercatat dalam beberapa tahun terakhir membuatnya penting bahwa persyaratan
penyimpanan untuk semua informasi harus dijaga agar tetap minimum.
1971    - Arthur Miller Menulis dalam “The Assault on Privacy” menyatakan, "Terlalu
  banyak informasi. pengurus tampaknya mengukur seorang pria seimbang
  dengan jumlah bit kapasitas penyimpanan berkas itu akan mengisi."
1975    - Departemen Pos dan Telekomunikasi di Jepang mulai melakukan Arus
  Informasi Sensus, pelacakan volume informasi yang beredar di Jepang (ide
  pertama kali diusulkan dalam makalah 1969)
1980    - I.A. Tjomsland memberikan ceramah berjudul "Where do we go from here?"
  Di IEEE Keempat Symposium on Mass Storage Systems, dia mengatakan
  "Mereka yang terkait dengan perangkat penyimpanan lama menyadari bahwa
  Hukum parkinson Pertama dapat diparafrasekan untuk menggambarkan
  Industry kami 'Data mengembang untuk mengisi ruang yang tersedia'.
1981    - Kantor Pusat statistic hungaria memulai proyek penelitian untuk menjelaskan
   informasi indsutri negara, termasuk mengukur Volume informasi dalam bit.
1983    - Ithiel de Sola Pool menerbitkan "Pelacakan Arus Informasi" di Science.
  Melihat tren pertumbuhan di 17 Media komunikasi utama 1960-1977, ia
  menyimpulkan bahwa "kata-kata yang tersedia untuk Amerika (di atas usia 10)
  melalui media ini tumbuh pada tingkat 8,9 persen per tahun, kata-kata benar
  benar hadir untuk dari media tersebut tumbuh hanya 2,9 persen per tahun, Pada
  periode pengamatan, sebagian besar pertumbuhan arus informasi adalah karena
  pertumbuhan penyiaran, Tapi menjelang akhir periode [1977] situasi berubah:
  media point-to-point yang tumbuh lebih cepat dari penyiaran."

2.2  PENGERTIAN BIG DATA

Pengertian Data
(R. Kelly Rainer, 2011) Data, menunjuk pada deskripsi dasar akan benda, event, aktivitas, dan transaksi yang terdokumentasi, terklasifikasi,dan tersimpan tetapi tidak terorganisasi untuk dapat memberikan suatu arti yang spesifik.
            Berdasarkan pengertian di atas, data merupakan hal paling mendasar yang dibutuhkan perusahaan yang dapat diperoleh dari proses-proses operasional sehari-hari maupun sumber-sumber luar yang akan diolah menurut keinginan perusahaan.

Pengertian Informasi
(R. Kelly Rainer, 2011) Information, merupakan data yang telah terorganisir agar dapat memberikan arti dan nilai kepada penerima.
Berdasarkan pengertian di atas, hasil penyusunan dan transformasi data yang dapat memberikan makna baru kepada data tersebut.

Pengertian Big Data
Big Data  adalah istilah umum untuk segala kumpulan himpunan data dalam jumlah yang sangat besar dan kompleks sehingga menjadikannya sulit untuk ditangani atau di proses jika hanya menggunakan manajemen basis data biasa atau aplikasi pemroses data tradisional.
Big Data menjamin pemrosesan solusi data dengan varian baru maupun yang sudah ada untuk memberikan manfaat nyata bagi bisnis. Namun pengolahan data dengan ukuran dan kompleksitas besar tetap sekedar solusi teknologi kecuali jika dikaitkan dengan tujuan bisnis.
Hal terpenting dari Big Data bukanlah sekedar kemampuan teknis untuk mengolah data melainkan manfaat yang dapat disadari oleh perusahaan dengan menggunakan Big Data Analytics Terminologi Big Data diyakini berasal dari perusahaan pencarian web yang mengolah data dengana gregasi yang terdistribusi sangat besar dan tidak terstruktur.

Contoh Big Data dapat berupa data yang berukuran hingga petabytes (1,024 terabytes) atau exabytes (1,024 petabytes), seperti milyaran hingga triliunan catatan personal seseorang yang semuanya berasal dari sumber berbeda seperti web, sales, customer service, social media, data mobile dan sebagainya.
Data-data ini biasanya tidak terstruktur, sering tidak lengkap dan tidak dapat diakses. Pada saat berhadapan dengan kelompok data yang lebih besar, perusahaan menghadapi kesulitan membuat, memanipulasi dan mengelola Big Data. Big Data sesungguhnya masalah dalaman alisis bisnis karena tools dan prosedur standar tidak didesain untuk mencari dan menganalisa kumpulan data yang massive.


2.3  KARAKTERISTIK BIG DATA
1.      Volume
Seberapa besar data yang bisa anda olah saat ini? Apakah dengan jumlah data yang anda miliki anda sudah lebih baik dibanding kompetitor? Data yang ada saat ini berukuran sangat besar. Di tahun 2000 saja tercatat 800,000 petabyte data tersimpan di seluruh dunia dan angka ini diperkirakan akan mencapai 35 zettabyte di tahun 2020 atau bahkan lebih. Bayangkan jika anda membutuhkan analisis terhadap 1 persen saja dari seluruh data untuk mendapatkan keuntungan dibandingkan kompetitor anda, apakah teknologi yang anda miliki sekarang mampu melakukannya?

2.      Variety
Selain data relasional, data apa saja yang umum dianalisis? Dengan meledaknya jumlah sensor, dan perangkat pintar , dan juga teknologi social networking yang menghasilkan data-data yang akan sulit jika harus disimpan di dalam relasional database. Kita tidak akan pernah tahu jika kita tidak menyimpan semua data yang tidak terstruktur ini seperti halaman web, web log, search index, forum social media, email, dokumen, data sensor, dll. Data-data seperti inilah yang mungkin akan memberikan keuntungan jika kita mampu mengolahnya.

3.      Velocity
Seberapa cepat kita dapat memproses data yang ada? Mungkin hal itu yang pertama ada dalam benak anda ketika anda membaca ini. Namun sebenarnya velocity di sini kita lihat dari persepsi seberapa cepat kita mampu mendapatkan hasil analisis terhadap aliran data yang terus mengalir di saat yang hampir bersamaan dengan datangnya data tersebut. Bayangkan jika kita memiliki sistem yang mampu mendeteksi buronan yang tertangkap kamera cctv, ataumendeteksi dini titik kritis seorang bayi dari suhu tubuh, tekanan darah, denyut jantung, kecepatan bernafas bayi tersebut, melakukan sensor terhadap kata kasar atau kata yang tidak seharusnya diucapkan yang diucapkan pada siaran langsung di tv atau pada percakapan telepon customer service sebuah perusahaan.

2.4  CONTOH BIG DATA DALAM BERBGAI BIDANG

1.      Contoh  di Sektor  Swasta
Perusahaan eBay.com menggunakan dua gudang data pada 7,5 petabyte dan 40PB serta Hadoop klaster 40PB untuk pencarian, rekomendasi, konsumen, dan merchandising . Di dalam eBay 90PB data warehouse. Amazon.com menangani jutaan operasi back-end setiap hari, serta pertanyaan dari lebih dari setengah juta penjual pihak ketiga . Teknologi inti yang membuat Amazon berjalan adalah berbasis Linux dan pada 2005 mereka memiliki tiga database Linux terbesar di dunia , dengan kapasitas 7,8 TB , 18,5 TB , dan 24,7 TB .
Walmart menangani lebih dari 1 juta transaksi nasabah setiap jam , yang diimpor ke database diperkirakan mengandung lebih dari 2,5 petabyte ( 2.560 terabyte ) data - . Setara dengan 167 kali informasi yang terdapat dalam semua buku di Perpustakaan Kongres AS.
FICO Falcon Penipuan Kartu Kredit Detection System melindungi 2,1 miliar akun aktif di seluruh dunia .
Volume data bisnis di seluruh dunia , di semua perusahaan , dua kali lipat setiap 1,2 tahun , menurut perkiraan. Windermere Real Estate menggunakan sinyal GPS anonim dari hampir 100 juta driver untuk membantu pembeli rumah baru menentukan waktu berkendara khas mereka ke dan dari tempat kerja di berbagai kali dalam sehari .

2.      Contoh di Bidang Arsitektur
Pada tahun 2004 , Google menerbitkan sebuah makalah tentang proses yang disebut MapReduce yang menggunakan arsitektur tersebut . MapReduce framework menyediakan model pemrosesan paralel dan implementasi terkait untuk memproses sejumlah besar data . Dengan MapReduce , query dibagi dan didistribusikan di seluruh node paralel dan diproses secara . Hasilnya kemudian dikumpulkan dan disampaikan. Kerangka itu sangat sukses sehingga orang lain ingin meniru algoritma . Oleh karena itu , sebuah implementasi dari kerangka MapReduce diadopsi oleh sebuah proyek open source Apache Hadoop bernama
Teknologi Topological Program Analisis Data DARPA.

3.      Contoh di Bidang Pasar
" Big Data " telah meningkatkan permintaan spesialis manajemen informasi dalam Software AG , Oracle Corporation , IBM , Microsoft , SAP , EMC , HP dan Dell telah menghabiskan lebih dari $ 15 miliar untuk perusahaan perangkat lunak hanya mengkhususkan diri dalam manajemen data dan analisis . Pada tahun 2010 , industri ini sendiri bernilai lebih dari $ 100 miliar dan tumbuh hampir 10 persen per tahun, tentang dua kali lebih cepat sebagai bisnis perangkat lunak secara keseluruhan .
Negara maju membuat meningkatnya penggunaan teknologi data-intensif Ada 4,6 miliar langganan ponsel di seluruh dunia dan ada antara 1 miliar sampai 2 miliar orang mengakses internet . Antara tahun 1990 dan 2005 , lebih dari 1 miliar orang di seluruh dunia memasuki kelas menengah yang berarti semakin banyak orang yang memperoleh uang akan menjadi melek lagi yang pada gilirannya menyebabkan pertumbuhan informasi . Kapasitas yang efektif di dunia untuk bertukar informasi melalui jaringan telekomunikasi adalah 281 petabyte pada tahun 1986 , 471 petabyte pada tahun 1993 , 2,2 exabyte pada tahun 2000 , 65 exabyte pada tahun 2007 dan diperkirakan bahwa jumlah lalu lintas yang mengalir melalui internet akan mencapai 667 exabytes per tahun pada tahun 2013. 

2.5  PENGGUNAAN BIG DATA DALAM PERUSAHAAN

·         IT logs Analytics
            Penyimpanan Log jangka panjang, digunakan untuk analisa proses sistem yang sedang berjalan untuk mencegah dan menaggulangi kegagalan dalam sistem, mengunakan hasil analisa log untuk menemukan dan mentukan secara pasti kegagalan apa yang terjadi didalam sistem, menyiapkan langkah-langkah pasti yang dapat digunakan sebagai solusi masalah sistem.

·         Fraud Detection Pattern
Banyak digunakan dalam Bidang keuangan atau dimana saja transaksi finasial terlibat, Memaksimalkan pengunaan data-data yang ada untuk memberikan kemampuan unutk mendeteksi fraud ketika transaksi sedang berlangsung

·         The Social Media Pattern
Pengunaan Big data untuk analisa media social dan sentiment pelangan, memberikan kemampuan bagi perusahan untuk mengetahui keinginan customer secara luas, mendapatkan feedback secara langsung, dan mengenali langsung dampak sentimen terhadap penjualan, serta efektivitas dan penerimaan pelangan terhadap pemasaran yang dilakukan.
   
·         The Call centere Mantra
Penyimpanan hasil perbincangan atau laporan customer dalam bentuk text yang kemudian digunakan sebagai data untuk analisa masalah yang dihadapai customer, memberikan kemampuan bagi perusahaan untuk memberikan tanggapan yang cepat maupun secara langsung terhadap masalah yang dihadapi customer, serta kemampuan unutk mendeteksi penurunan loyalitas customer dikarenakan masalah dan ketidakpuasaan.

·         Risk: Patterns  for Modeling and Management
Memberikan kempuaan pengunaan data secara penuh dan analisis dalam pemodelan resiko dan menejemen resiko untuk memberikan pengetahuan akan resiko dan penanggulangannya secara tepat dan langsung 

·         Big data and The Energy Sector
Memberikan kemampuan penyimpanan dan pemrosesan data secara langsung dari berbagai sumber(sensor), analisa dan kemudahan dalam pengenalan noise untuk memisahkannya dari signal.

2.6              PERMASALAHAN MENGENAI BIG DATA

1.                  Bukan Hanya Masalah Ukuran, Tapi Lebih pada Ragam
Kini jelas bahwa Big Data bukan hanya masalah ukuran yang besar, terlebih yang menjadi ciri khasnya adalah jenis datanya yang sangat beragam dan laju pertumbuhan maupun frekwensi perubahannya yang tinggi. Dalam hal ragam data, Big Data tidak hanya terdiri dari data berstruktur seperti halnya data angka-angka maupun deretan huruf-huruf yang berasal dari sistem database mendasar seperti halnya sistem database keuangan, tetapi juga terdiri atas data multimedia seperti data teks, data suara dan video yang dikenal dengan istilah data tak berstruktur. Terlebih lagi, Big Data juga mencakup data setengah berstruktur seperti halnya data e-mail maupun XML.
Dalam hal kecepatan pertumbuhan maupun frekwensi perubahannya, Big Data mencakup data-data yang berasal dari berbagai jenis sensor, mesin-mesin, maupun data log komunikasi yang terus menerus mengalir. Bahkan, juga mencakup data-data yang tak hanya data yang berada di internal perusahaan, tetapi juga data-data di luar perusahaan seperti data-data di Internet. Begitu beragamnya jenis data yang dicakup dalam Big Data inilah yang kiranya dapat dijadikan patokan untuk membedakan Big Data dengan sistem manajemen data pada umumnya.

2.                  Fokus pada Trend per-Individu, Kecepatan Lebih Utama daripada Ketepatan
Hingga saat ini, pendayagunaan Big Data didominasi oleh perusahaan-perusahaan jasa berbasis Internet seperti halnya Google dan Facebook. Data yang mereka berdayakan pun bukanlah data-data internal perusahaan seperti halnya data-data penjualan maupun data pelanggan, lebih menitik beratkan pada pengolahan data-data teks dan gambar yang berada di Internet. Bila kita melihat gaya pemberdayaan data yang dilakukan oleh perusahaan-perusahaan pada umumnya, yang dicari adalah trend yang didapat dari pengolahan data secara keseluruhan. Misalnya, dari data konsumen akan didapat informasi tentang trendkonsumen dengan memproses data konsumen secara keseluruhan, bukan memproses data per-konsumen untuk mendapatkan trend per-konsumen.
Dilain pihak, perusahaan-perusahaan jasa berbasis Internet yang memanfaatkan Big Data justru memfokuskan pemberdayaan data untuk mendapatkan informasi trendper-konsumen dengan memanfaatkan atribut-atribut yang melekat pada pribadi tiap konsumen. Sebut saja toko online Amazon yang memanfaatkan informasi maupun atribut yang melekat pada diri per-konsumen, untuk memberikan rekomendasi yang sesuai kepada tiap konsumen. Satu lagi, pemberdayaan data alaBig Data ini dapat dikatakan lebih berfokus pada kecepatan ketimbang ketepatan.

2.7              ANALISA SOLUSI BIG DATA
Sejumlah vendor di pasar saat ini mendukung solusi data yang besar . Berikut ini adalah daftar beberapa solusi diantaranya adalah :

1.      IBM ( www.ibm.com ) mengambil pendekatan perusahaan untuk data yang besar dan mengintegrasikan seluruh platform termasuk embedding / bundling nya analisis . Produknya termasuk gudang ( warehouse InfoSphere ) yang memiliki built -in data-mining sendiri dan cubing kemampuan . ini baru PureData Systems ( kemasan teknologi analisis canggih ke dalam platform sistem terintegrasi ) mencakup banyak dikemas analitis integrasi . Produk InfoSphere Streaming Its terintegrasi dengan Paket perangkat lunak statistik statistik untuk Ilmu Sosial ( SPSS ) untuk mendukung real-time analisis prediktif , termasuk kemampuan untuk dinamis memperbarui model berdasarkan data real-time . Hal ini bundling terbatas penggunaan lisensi Cognos Business Intelligence dengan data kunci besar yang kemampuan platform ( kelas enterprise Hadoop , komputasi aliran , dan solusi gudang ) . 

2.      SAS ( www.sas.com ) memberikan beberapa pendekatan untuk menganalisis data besar via infrastrukturnya analisis kinerja tinggi dan yang statistic software . SAS menyediakan beberapa pilihan pemrosesan terdistribusi . ini termasuk dalam database analytics , in- memory analytics , dan komputasi grid . Penyebaran bisa di tempat atau di awan .

3.      Tableau ( www.tableausoftware.com ) , sebuah business analytics dan data perusahaan perangkat lunak visualisasi , menawarkan kemampuan visualisasi untuk berjalan di atas peralatan dan infrastruktur lain yang ditawarkan oleh  berbagai besar mitra data, termasuk Cirro , EMC Greenplum , Karmasphere , Teradata / Aster, HP Vertica , Hortonworks , ParAccel , IBM Netezza , dan sejumlah lain .

4.      Oracle ( www.oracle.com ) menawarkan berbagai alat untuk melengkapi yang besar platform data disebut Oracle Exadata . Ini termasuk analisis canggih melalui bahasa pemrograman R , serta database in- memory pilihan dengan Oracle Exalytics di memori mesin dan data Oracle gudang . Exadata terintegrasi dengan platform perangkat keras nya .

5.      Pentaho ( www.pentaho.com ) menyediakan analisis bisnis open source melalui edisi komunitas dan perusahaan. Pentaho mendukung terkemuka Distribusi Hadoop - based dan mendukung kemampuan asli, seperti NFS kinerja tinggi sistem file mountable MapR itu . 

BAB III
PENUTUP

3.1  KESIMPULAN

Big Data adalah kemampuan untuk mengelola data dengan volume besar yang berbeda dengan kecepatan yang tepat, dan dalam dalam kerangka waktu yang tepat memungkinkan analisis dan reaksi secara langsung. bukan hanya tentang data yang berukuran raksasa. Big Data juga dapat didefinisikan sebagai data berukuran raksasa yang volumenya terus bertambah, terdiri dari berbagai jenis atau varietas data, terbentuk secara terus menerus dengan kecepatan tertentu dan harus diproses dengan kecepatan tertentu pula.
Banyak sekali perusahaan yang memiliki kumpulan data yang menumpuk, karena terlalu banyaknya data tersebut, terkadang perusahaan tidak mengetahui tindakan apa yang harusnya dapat dilakukan terhadap kumpulan data tersebut.
Sebuah informasi atau data dapat disebut sebagai Big Data apabila memiliki 1 (satu) dari 3 (tiga) karakteristik yang terdiri dari Volume (jumlah data yang dapat diolah oleh sebuah perusahaan), Variety (variasi data yang dapat diolah dan dianalisis lebih lanjut oleh perusahaan), dan Velocity (kecepatan sebuah perusahaan di dalam melakukan pemrosesan data).
Banyak perusahaan yang menganggap Big Data adalah kumpulan data dalam ukuran besar padahal Big Data bukan hanya sekedar ukuran, namun juga terdapat keragaman di dalamnya. Hal inilah yang membedakan Big Data dengan sistem manajemen data lainnya.


DAFTAR PUSAKA


UNTUK PPT BISA UNDUH DI LINK

Tidak ada komentar:

Posting Komentar