BAB I
PENDAHULUAN
1.1 LATAR
BELAKANG
Pada masa
sekarang, Sistem Informasi Manajemen sangat diperlukan dalam dunia bisnis.
Sistem Informasi Manajemen yang baik akan memberikan dampak yang baik pula bagi
suatu perusahaan. Dari tahun ke tahun perkembangan Teknologi pula semakin
canggih. Hal ini berdampak juga pada Informasi-informasi yang di peroleh dalam
Sistem Informasi.
Suatu bisnis
tentunya memerlukan suatu informasi yang dapat menunjang perusahaannya.
Informasi-informasi yang didapatkan akan diproses sedemikian rupa hingga
menjadi suatu keputusan dalam manajemen. Dalam memperoleh Informasi tentunya
dibutuhkan suatu media untuk menampung segala informasi yang didapatkan dari sumber-sumber
terpercaya. Dengan demikian terciptalah Big Data dalam dunia Teknologi
Informasi.
Big Data
sendiri merupakan media penyimpanan data yang
menawarkan ruang tak terbatas, serta kemampuan untuk mengakodasi dan memproses
berbagai jenis data dengan sangat cepat. Jadi kini, banyak perusahaan
yang sudah memanfaatkan Big Data agar dapat menyimpan segala datanya tanpa
kendala dan menghindari hilangnya informasi-informasi yang dimiliki.
1.2 RUMUSAN
MASALAH
1.
Apa yang
dimaksud dengan Big Data?
2.
Apa saja
karakteristik dari Big Data?
3.
Bagaimana
penggunaan Big Data dalam Perusahaan?
4.
Apa saja
permasalahan dalam Big Data?
1.3 TUJUAN
1.
Mengetahui
tentang sejarah Big Data
2.
Mengetahui tentang
pengertian Big Data
3.
Mengetahui tentang
karakteristik Big Data
4.
Mengetahui
tentang penggunaan Big Data dalam Perusahaan
5.
Mengetahu
permasalahan dalam Big Data
BAB II
PEMBAHASAN
2.1 SEJARAH BIG DATA
Sebelum
mempelajari suatu hal tentu diperlukan untuk memahami asal muasal atau sejarah
dari hal yang ingin dipelajari tersebut, ada pun tentang topic kali ini penulis
akan memperkenalkan sejarah big data. Berikut urutannya;
1944
- Fremont Rider, Pustakawan universitas Wesleyan. Dia memperkirakan bahwa
Perpustakana yang ada di amerika serikat ukurannya meningkat dua kali
lipat
setiap 16 tahun
1961
- Derek Price. Dia mendiagramkan pertumbuhan pengetahuan ilmiah dengan
cara melihat jumlah pertumbuhan jurnal ilmiah dan makalah
1967
- B.A. Marron dan P.A.D. De Maine menerbitkan "Automatic data compression"
dalam
Komunikasi dari ACM, yang menyatakan bahwa "ledakan informasi”
tercatat
dalam beberapa tahun terakhir membuatnya penting bahwa persyaratan
penyimpanan
untuk semua informasi harus dijaga agar tetap minimum.
1971
- Arthur Miller Menulis dalam “The Assault on Privacy” menyatakan, "Terlalu
banyak informasi. pengurus tampaknya mengukur seorang pria seimbang
dengan jumlah bit kapasitas penyimpanan berkas itu akan mengisi."
1975
- Departemen Pos dan Telekomunikasi di Jepang mulai melakukan Arus
Informasi Sensus, pelacakan volume informasi yang beredar di Jepang (ide
pertama kali diusulkan dalam makalah 1969)
1980
- I.A. Tjomsland memberikan ceramah berjudul "Where do we go from
here?"
Di IEEE Keempat Symposium on Mass Storage Systems, dia mengatakan
"Mereka yang terkait dengan perangkat penyimpanan lama menyadari bahwa
Hukum parkinson Pertama dapat diparafrasekan untuk menggambarkan
Industry kami 'Data mengembang untuk mengisi ruang yang tersedia'.
1981
- Kantor Pusat statistic hungaria memulai proyek penelitian untuk menjelaskan
informasi indsutri negara, termasuk mengukur Volume informasi dalam bit.
1983
- Ithiel de Sola Pool menerbitkan "Pelacakan Arus Informasi" di
Science.
Melihat tren pertumbuhan di 17 Media komunikasi utama 1960-1977, ia
menyimpulkan bahwa "kata-kata yang tersedia untuk Amerika (di atas usia
10)
melalui media ini tumbuh pada tingkat 8,9 persen per tahun, kata-kata benar
benar hadir untuk dari media tersebut tumbuh hanya 2,9 persen per tahun, Pada
periode pengamatan, sebagian besar pertumbuhan arus informasi adalah karena
pertumbuhan penyiaran, Tapi menjelang akhir periode [1977] situasi berubah:
media point-to-point yang tumbuh lebih cepat dari penyiaran."
2.2 PENGERTIAN BIG DATA
Pengertian Data
(R. Kelly Rainer, 2011) Data, menunjuk pada deskripsi
dasar akan benda, event, aktivitas, dan transaksi yang terdokumentasi,
terklasifikasi,dan tersimpan tetapi tidak terorganisasi untuk dapat memberikan
suatu arti yang spesifik.
Berdasarkan
pengertian di atas, data merupakan hal paling mendasar yang dibutuhkan perusahaan
yang dapat diperoleh dari proses-proses operasional sehari-hari maupun
sumber-sumber luar yang akan diolah menurut keinginan perusahaan.
Pengertian Informasi
(R. Kelly Rainer, 2011) Information, merupakan data
yang telah terorganisir agar dapat memberikan arti dan nilai kepada penerima.
Berdasarkan pengertian di atas, hasil penyusunan dan
transformasi data yang dapat memberikan makna baru kepada data tersebut.
Pengertian Big Data
Big Data adalah
istilah umum untuk segala kumpulan himpunan data dalam jumlah yang sangat besar
dan kompleks sehingga menjadikannya sulit untuk ditangani atau di proses jika
hanya menggunakan manajemen basis data biasa atau aplikasi pemroses data
tradisional.
Big Data menjamin
pemrosesan solusi data dengan varian baru maupun yang sudah ada untuk
memberikan manfaat nyata bagi bisnis. Namun pengolahan data dengan ukuran dan
kompleksitas besar tetap sekedar solusi teknologi kecuali jika dikaitkan dengan
tujuan bisnis.
Hal
terpenting dari Big Data bukanlah sekedar kemampuan teknis untuk mengolah data
melainkan manfaat yang dapat disadari oleh perusahaan dengan menggunakan Big
Data Analytics Terminologi Big Data diyakini berasal dari perusahaan pencarian
web yang mengolah data dengana gregasi yang terdistribusi sangat besar dan
tidak terstruktur.
Contoh Big
Data dapat berupa data yang berukuran hingga petabytes (1,024 terabytes) atau
exabytes (1,024 petabytes), seperti milyaran hingga triliunan catatan personal
seseorang yang semuanya berasal dari sumber berbeda seperti web, sales, customer
service, social media, data mobile dan sebagainya.
Data-data
ini biasanya tidak terstruktur, sering tidak lengkap dan tidak dapat diakses.
Pada saat berhadapan dengan kelompok data yang lebih besar, perusahaan
menghadapi kesulitan membuat, memanipulasi dan mengelola Big Data. Big Data
sesungguhnya masalah dalaman alisis bisnis karena tools dan prosedur standar
tidak didesain untuk mencari dan menganalisa kumpulan data yang massive.
2.3 KARAKTERISTIK BIG DATA
1.
Volume
Seberapa
besar data yang bisa anda olah saat ini? Apakah dengan jumlah data yang anda
miliki anda sudah lebih baik dibanding kompetitor? Data yang ada saat ini
berukuran sangat besar. Di tahun 2000 saja tercatat 800,000 petabyte data
tersimpan di seluruh dunia dan angka ini diperkirakan akan mencapai 35
zettabyte di tahun 2020 atau bahkan lebih. Bayangkan jika anda membutuhkan
analisis terhadap 1 persen saja dari seluruh data untuk mendapatkan keuntungan
dibandingkan kompetitor anda, apakah teknologi yang anda miliki sekarang mampu
melakukannya?
2.
Variety
Selain
data relasional, data apa saja yang umum dianalisis? Dengan meledaknya jumlah
sensor, dan perangkat pintar , dan juga teknologi social networking yang
menghasilkan data-data yang akan sulit jika harus disimpan di dalam relasional
database. Kita tidak akan pernah tahu jika kita tidak menyimpan semua data yang
tidak terstruktur ini seperti halaman web, web log, search index, forum social
media, email, dokumen, data sensor, dll. Data-data seperti inilah yang mungkin
akan memberikan keuntungan jika kita mampu mengolahnya.
3.
Velocity
Seberapa
cepat kita dapat memproses data yang ada? Mungkin hal itu yang pertama ada
dalam benak anda ketika anda membaca ini. Namun sebenarnya velocity di sini
kita lihat dari persepsi seberapa cepat kita mampu mendapatkan hasil analisis
terhadap aliran data yang terus mengalir di saat yang hampir bersamaan dengan
datangnya data tersebut. Bayangkan jika kita memiliki sistem yang mampu
mendeteksi buronan yang tertangkap kamera cctv, ataumendeteksi dini titik
kritis seorang bayi dari suhu tubuh, tekanan darah, denyut jantung, kecepatan
bernafas bayi tersebut, melakukan sensor terhadap kata kasar atau kata yang
tidak seharusnya diucapkan yang diucapkan pada siaran langsung di tv atau pada
percakapan telepon customer service sebuah perusahaan.
2.4 CONTOH BIG DATA DALAM BERBGAI BIDANG
1. Contoh di
Sektor Swasta
Perusahaan
eBay.com menggunakan dua gudang data pada 7,5 petabyte dan 40PB serta Hadoop
klaster 40PB untuk pencarian, rekomendasi, konsumen, dan merchandising . Di
dalam eBay 90PB data warehouse. Amazon.com menangani jutaan operasi back-end
setiap hari, serta pertanyaan dari lebih dari setengah juta penjual pihak
ketiga . Teknologi inti yang membuat Amazon berjalan adalah berbasis Linux dan
pada 2005 mereka memiliki tiga database Linux terbesar di dunia , dengan kapasitas
7,8 TB , 18,5 TB , dan 24,7 TB .
Walmart menangani lebih dari 1 juta
transaksi nasabah setiap jam , yang diimpor ke database diperkirakan mengandung
lebih dari 2,5 petabyte ( 2.560 terabyte ) data - . Setara dengan 167 kali
informasi yang terdapat dalam semua buku di Perpustakaan Kongres AS.
FICO
Falcon Penipuan Kartu Kredit Detection System melindungi 2,1 miliar akun aktif
di seluruh dunia .
Volume data bisnis di seluruh dunia , di
semua perusahaan , dua kali lipat setiap 1,2 tahun , menurut perkiraan. Windermere
Real Estate menggunakan sinyal GPS anonim dari hampir 100 juta driver untuk
membantu pembeli rumah baru menentukan waktu berkendara khas mereka ke dan dari
tempat kerja di berbagai kali dalam sehari .
2. Contoh di Bidang Arsitektur
Pada
tahun 2004 , Google menerbitkan sebuah makalah tentang proses yang disebut
MapReduce yang menggunakan arsitektur tersebut . MapReduce framework
menyediakan model pemrosesan paralel dan implementasi terkait untuk memproses
sejumlah besar data . Dengan MapReduce , query dibagi dan didistribusikan di
seluruh node paralel dan diproses secara . Hasilnya kemudian dikumpulkan dan
disampaikan. Kerangka itu sangat sukses sehingga orang lain ingin meniru
algoritma . Oleh karena itu , sebuah implementasi dari kerangka MapReduce
diadopsi oleh sebuah proyek open source Apache Hadoop bernama
Teknologi Topological Program Analisis
Data DARPA.
3. Contoh di Bidang Pasar
"
Big Data " telah meningkatkan permintaan spesialis manajemen informasi
dalam Software AG , Oracle Corporation , IBM , Microsoft , SAP , EMC , HP dan
Dell telah menghabiskan lebih dari $ 15 miliar untuk perusahaan perangkat lunak
hanya mengkhususkan diri dalam manajemen data dan analisis . Pada tahun 2010 ,
industri ini sendiri bernilai lebih dari $ 100 miliar dan tumbuh hampir 10
persen per tahun, tentang dua kali lebih cepat sebagai bisnis perangkat lunak
secara keseluruhan .
Negara
maju membuat meningkatnya penggunaan teknologi data-intensif Ada 4,6 miliar
langganan ponsel di seluruh dunia dan ada antara 1 miliar sampai 2 miliar orang
mengakses internet . Antara tahun 1990 dan 2005 , lebih dari 1 miliar orang di
seluruh dunia memasuki kelas menengah yang berarti semakin banyak orang yang
memperoleh uang akan menjadi melek lagi yang pada gilirannya menyebabkan
pertumbuhan informasi . Kapasitas yang efektif di dunia untuk bertukar
informasi melalui jaringan telekomunikasi adalah 281 petabyte pada tahun 1986 ,
471 petabyte pada tahun 1993 , 2,2 exabyte pada tahun 2000 , 65 exabyte pada
tahun 2007 dan diperkirakan bahwa jumlah lalu lintas yang mengalir melalui
internet akan mencapai 667 exabytes per tahun pada tahun 2013.
2.5 PENGGUNAAN BIG DATA DALAM PERUSAHAAN
·
IT logs Analytics
Penyimpanan Log jangka panjang,
digunakan untuk analisa proses sistem yang sedang berjalan untuk mencegah dan
menaggulangi kegagalan dalam sistem, mengunakan hasil analisa log untuk
menemukan dan mentukan secara pasti kegagalan apa yang terjadi didalam sistem,
menyiapkan langkah-langkah pasti yang dapat digunakan sebagai solusi masalah
sistem.
·
Fraud Detection Pattern
Banyak digunakan
dalam Bidang keuangan atau dimana saja transaksi finasial terlibat,
Memaksimalkan pengunaan data-data yang ada untuk memberikan kemampuan unutk
mendeteksi fraud ketika transaksi sedang berlangsung
·
The Social Media Pattern
Pengunaan Big
data untuk analisa media social dan sentiment pelangan, memberikan kemampuan
bagi perusahan untuk mengetahui keinginan customer secara luas, mendapatkan
feedback secara langsung, dan mengenali langsung dampak sentimen terhadap
penjualan, serta efektivitas dan penerimaan pelangan terhadap pemasaran yang
dilakukan.
·
The Call centere Mantra
Penyimpanan hasil
perbincangan atau laporan customer dalam bentuk text yang kemudian digunakan
sebagai data untuk analisa masalah yang dihadapai customer, memberikan
kemampuan bagi perusahaan untuk memberikan tanggapan yang cepat maupun secara
langsung terhadap masalah yang dihadapi customer, serta kemampuan unutk
mendeteksi penurunan loyalitas customer dikarenakan masalah dan ketidakpuasaan.
·
Risk: Patterns
for Modeling and Management
Memberikan
kempuaan pengunaan data secara penuh dan analisis dalam pemodelan resiko dan
menejemen resiko untuk memberikan pengetahuan akan resiko dan penanggulangannya
secara tepat dan langsung
·
Big data and The Energy Sector
Memberikan
kemampuan penyimpanan dan pemrosesan data secara langsung dari berbagai
sumber(sensor), analisa dan kemudahan dalam pengenalan noise untuk
memisahkannya dari signal.
2.6
PERMASALAHAN MENGENAI BIG DATA
1.
Bukan Hanya Masalah Ukuran, Tapi Lebih pada Ragam
Kini
jelas bahwa Big Data bukan
hanya masalah ukuran yang besar, terlebih yang menjadi ciri khasnya adalah
jenis datanya yang sangat beragam dan laju pertumbuhan maupun frekwensi
perubahannya yang tinggi. Dalam hal ragam data, Big Data tidak
hanya terdiri dari data berstruktur seperti halnya data angka-angka maupun
deretan huruf-huruf yang berasal dari sistem database mendasar seperti halnya
sistem database keuangan, tetapi juga terdiri atas data multimedia seperti data
teks, data suara dan video yang dikenal dengan istilah data tak berstruktur.
Terlebih lagi, Big Data juga mencakup data setengah berstruktur seperti halnya data e-mail
maupun XML.
Dalam
hal kecepatan pertumbuhan maupun frekwensi perubahannya, Big Data mencakup data-data yang berasal
dari berbagai jenis sensor, mesin-mesin, maupun data log komunikasi yang terus
menerus mengalir. Bahkan, juga mencakup data-data yang tak hanya data yang
berada di internal perusahaan, tetapi juga data-data di luar perusahaan seperti
data-data di Internet. Begitu beragamnya jenis data yang dicakup dalam Big Data inilah
yang kiranya dapat dijadikan patokan untuk membedakan Big Data dengan
sistem manajemen data pada umumnya.
2.
Fokus pada Trend per-Individu,
Kecepatan Lebih Utama daripada Ketepatan
Hingga
saat ini, pendayagunaan Big Data didominasi
oleh perusahaan-perusahaan jasa berbasis Internet seperti halnya Google dan
Facebook. Data yang mereka berdayakan pun bukanlah data-data internal
perusahaan seperti halnya data-data penjualan maupun data pelanggan, lebih
menitik beratkan pada pengolahan data-data teks dan gambar yang berada di
Internet. Bila kita melihat gaya pemberdayaan data yang dilakukan oleh
perusahaan-perusahaan pada umumnya, yang dicari adalah trend yang didapat dari pengolahan
data secara keseluruhan. Misalnya, dari data konsumen akan didapat informasi
tentang trendkonsumen dengan memproses data konsumen secara keseluruhan, bukan
memproses data per-konsumen untuk mendapatkan trend per-konsumen.
Dilain
pihak, perusahaan-perusahaan jasa berbasis Internet yang memanfaatkan Big Data justru memfokuskan pemberdayaan
data untuk mendapatkan informasi trendper-konsumen dengan memanfaatkan
atribut-atribut yang melekat pada pribadi tiap konsumen. Sebut saja toko online
Amazon yang memanfaatkan informasi maupun atribut yang melekat pada diri
per-konsumen, untuk memberikan rekomendasi yang sesuai kepada tiap konsumen.
Satu lagi, pemberdayaan data alaBig
Data ini dapat dikatakan lebih berfokus pada kecepatan ketimbang
ketepatan.
2.7
ANALISA SOLUSI BIG DATA
Sejumlah
vendor di pasar saat ini mendukung solusi data yang besar . Berikut ini adalah
daftar beberapa solusi diantaranya adalah :
1. IBM ( www.ibm.com ) mengambil pendekatan perusahaan untuk data yang besar dan
mengintegrasikan seluruh platform termasuk embedding / bundling nya analisis .
Produknya termasuk gudang ( warehouse InfoSphere ) yang memiliki built -in
data-mining sendiri dan cubing kemampuan . ini baru PureData Systems ( kemasan
teknologi analisis canggih ke dalam platform sistem terintegrasi ) mencakup
banyak dikemas analitis integrasi . Produk InfoSphere Streaming Its
terintegrasi dengan Paket perangkat lunak statistik statistik untuk Ilmu Sosial
( SPSS ) untuk mendukung real-time analisis prediktif , termasuk kemampuan
untuk dinamis memperbarui model berdasarkan data real-time . Hal ini bundling
terbatas penggunaan lisensi Cognos Business Intelligence dengan data kunci
besar yang kemampuan platform ( kelas enterprise Hadoop , komputasi aliran ,
dan solusi gudang ) .
2. SAS ( www.sas.com ) memberikan beberapa pendekatan untuk menganalisis data besar via
infrastrukturnya analisis kinerja tinggi dan yang statistic software . SAS
menyediakan beberapa pilihan pemrosesan terdistribusi . ini termasuk dalam
database analytics , in- memory analytics , dan komputasi grid . Penyebaran
bisa di tempat atau di awan .
3. Tableau ( www.tableausoftware.com ) , sebuah business analytics dan data perusahaan perangkat lunak
visualisasi , menawarkan kemampuan visualisasi untuk berjalan di atas peralatan
dan infrastruktur lain yang ditawarkan oleh berbagai besar mitra data,
termasuk Cirro , EMC Greenplum , Karmasphere , Teradata / Aster, HP Vertica ,
Hortonworks , ParAccel , IBM Netezza , dan sejumlah lain .
4. Oracle ( www.oracle.com ) menawarkan berbagai alat untuk melengkapi yang besar platform data
disebut Oracle Exadata . Ini termasuk analisis canggih melalui bahasa
pemrograman R , serta database in- memory pilihan dengan Oracle Exalytics di
memori mesin dan data Oracle gudang . Exadata terintegrasi dengan platform
perangkat keras nya .
5. Pentaho ( www.pentaho.com ) menyediakan analisis bisnis open source melalui edisi komunitas
dan perusahaan. Pentaho mendukung terkemuka Distribusi Hadoop - based dan
mendukung kemampuan asli, seperti NFS kinerja tinggi sistem file mountable MapR
itu .
BAB III
PENUTUP
3.1 KESIMPULAN
Big Data adalah kemampuan untuk
mengelola data dengan volume besar yang berbeda dengan kecepatan yang tepat, dan dalam dalam
kerangka waktu yang tepat memungkinkan analisis dan reaksi secara langsung.
bukan hanya tentang data yang berukuran raksasa. Big Data juga dapat didefinisikan sebagai data berukuran raksasa yang
volumenya terus bertambah, terdiri dari berbagai jenis atau varietas data,
terbentuk secara terus menerus dengan kecepatan tertentu dan harus diproses
dengan kecepatan tertentu pula.
Banyak
sekali perusahaan yang memiliki kumpulan data yang menumpuk, karena terlalu
banyaknya data tersebut, terkadang perusahaan tidak mengetahui tindakan apa
yang harusnya dapat dilakukan terhadap kumpulan data tersebut.
Sebuah informasi atau data dapat disebut
sebagai Big Data apabila memiliki 1 (satu) dari 3 (tiga) karakteristik yang terdiri
dari Volume (jumlah data yang dapat diolah oleh sebuah perusahaan), Variety (variasi data yang dapat diolah dan dianalisis lebih lanjut oleh
perusahaan), dan Velocity (kecepatan sebuah perusahaan di dalam melakukan pemrosesan data).
Banyak
perusahaan yang menganggap Big Data adalah kumpulan data dalam ukuran besar padahal Big Data bukan hanya sekedar ukuran, namun juga terdapat keragaman di
dalamnya. Hal inilah yang membedakan Big
Data dengan sistem manajemen data lainnya.
UNTUK PPT BISA UNDUH DI LINK
Tidak ada komentar:
Posting Komentar