Tuesday, March 21, 2017

MODEL SISTEM INFORMASI BERUPA BIG DATA

MODEL SISTEM INFORMASI BERUPA BIG DATA

Sebelum mempelajari suatu hal, tentu kita harus memahami awal mula atau sejarah dari hal yang ingin dipelajari tersebut, pada artikel kali ini penulis akan memperkenalkan sejarah big data. Berikut urutannya:
1944 Fremont Rider, Pustakawan universitas Wesleyan. Dia memperkirakan bahwa Perpustakana yang ada di amerika serikat ukurannya meningkat dua kali lipatsetiap 16 tahun
1961 Derek Price. Dia mendiagramkan pertumbuhan pengetahuan ilmiah dengan cara melihat jumlah pertumbuhan jurnal ilmiah dan makalah
1967 B.A. Marron dan P.A.D. De Maine menerbitkan "Automatic data compression" dalam Komunikasi dari ACM, yang menyatakan bahwa "ledakan informasi” tercatat dalam beberapa tahun terakhir membuatnya penting bahwa persyaratan penyimpanan untuk semua informasi harus dijaga agar tetap minimum.
1971 Arthur Miller Menulis dalam “The Assault on Privacy” menyatakan, "Terlalu banyak informasi. pengurus tampaknya mengukur seorang pria seimbang dengan jumlah bit kapasitas penyimpanan berkas itu akan mengisi."
1975 Departemen Pos dan Telekomunikasi di Jepang mulai melakukan Arus Informasi Sensus, pelacakan volume informasi yang beredar di Jepang (ide pertama kali diusulkan dalam makalah 1969)
1980 I.A. Tjomsland memberikan ceramah berjudul "Where do we go from here?" Di IEEE Keempat Symposium on Mass Storage Systems, dia mengatakan "Mereka yang terkait dengan perangkat penyimpanan lama menyadari bahwa Hukum parkinson Pertama dapat diparafrasekan untuk menggambarkan Industry kami 'Data mengembang untuk mengisi ruang yang tersedia'.
1981 Kantor Pusat statistic hungaria memulai proyek penelitian untuk menjelaskan informasi indsutri negara, termasuk mengukur Volume informasi dalam bit.
1983 Ithiel de Sola Pool menerbitkan "Pelacakan Arus Informasi" di Science. Melihat tren pertumbuhan di 17 Media komunikasi utama 1960-1977, ia menyimpulkan bahwa "kata-kata yang tersedia untuk Amerika (di atas usia 10) melalui media ini tumbuh pada tingkat 8,9 persen per tahun, kata-kata benar benar hadir untuk dari media tersebut tumbuh hanya 2,9 persen per tahun, Pada periode pengamatan, sebagian besar pertumbuhan arus informasi adalah karena pertumbuhan penyiaran, Tapi menjelang akhir periode [1977] situasi berubah: media point-to-point yang tumbuh lebih cepat dari penyiaran."

Pengertian Data
Adapun pengertian menurut para ahli, (R. Kelly Rainer, 2011) Data, menunjuk pada deskripsi dasar akan benda, event, aktivitas, dan transaksi yang terdokumentasi, terklasifikasi,dan tersimpan tetapi tidak terorganisasi untuk dapat memberikan suatu arti yang spesifik.
Berdasarkan pengertian di atas, data merupakan hal paling mendasar yang dibutuhkan perusahaan yang dapat diperoleh dari proses-proses operasional sehari-hari maupun sumber-sumber luar yang akan diolah menurut keinginan perusahaan.

Pengertian Informasi
(R. Kelly Rainer, 2011) Information, merupakan data yang telah terorganisir agar dapat memberikan arti dan nilai kepada penerima.
Berdasarkan pengertian di atas, hasil penyusunan dan transformasi data yang dapat memberikan makna baru kepada data tersebut.

Pengertian Big Data
Big Data merupakan istilah untuk data elektronik, yang tidak hanya sangat besar, tapi juga sangat cepat berubah, dan sangat banyak jenisnya. Big Data menjadi sangat populer di jagad teknologi setelah miliaran manusia menggunakan internet untuk berbagai kebutuhan. Sangat banyak data berkeliaran dan tersimpan di komputer-komputer di internet berupa teks, gambar, suara, video, animasi, blog, buku, cuaca, posisi tempat di bumi, suhu, penerbangan, belanja di supermarket, dan lain-lain. Perusahaan “Super Big” pengguna Big Data, antara lain Facebook, Google, Twitter, dan Yahoo.
Banyak orang membutuhkan pengolahan Big Data, antara lain untuk mengetahui topik yang sedang hangat saat ini di Twitter, mencari teman lama secara cepat melalui Facebook, dan lain-lain. Perusahaan perlu mengolah Big Data untuk pengambilan keputusan bisnis yang harus cepat. Misal, untuk mengetahui kebiasaan dan kesukaan pelanggan tanpa harus bertanya, mengetahui selera pembaca portal berita di web untuk disesuaikan dengan iklan yang ditampilkan, mengatur perjalanan pesawat agar tidak delay, mengendalikan wabah penyakit, dan sebagainya.
Untuk mengolah Big Data menjadi informasi yang lebih berguna, perlu program “big” yang artinya bukan program “biasa”. Jika data konvensional selama ini hanya berisi teks dan angka biasa seperti data keuangan, maka cukup diolah dengan database biasa pula, misal MS Access, MS SQL Server, dan lain-lain yang selama ini hanya untuk mengolah data terstruktur. Big Data tidak dapat diolah hanya dengan program database konvensional yang disebut SQL (Structured Query Language) atau RDBMS (Relational Database Management System). Big Data membutuhkan program database yang mendukung NoSQL (Not only SQL), yang mampu mengolah data tidak terstruktur.

KARAKTERISTIK BIG DATA
Volume
Seberapa besar data yang bisa anda olah saat ini? Apakah dengan jumlah data yang anda miliki anda sudah lebih baik dibanding kompetitor? Data yang ada saat ini berukuran sangat besar. Di tahun 2000 saja tercatat 800,000 petabyte data tersimpan di seluruh dunia dan angka ini diperkirakan akan mencapai 35 zettabyte di tahun 2020 atau bahkan lebih. Bayangkan jika anda membutuhkan analisis terhadap 1 persen saja dari seluruh data untuk mendapatkan keuntungan dibandingkan kompetitor anda, apakah teknologi yang anda miliki sekarang mampu melakukannya?
Variety
Selain data relasional, data apa saja yang umum dianalisis? Dengan meledaknya jumlah sensor, dan perangkat pintar , dan juga teknologi social networking yang menghasilkan data-data yang akan sulit jika harus disimpan di dalam relasional database. Kita tidak akan pernah tahu jika kita tidak menyimpan semua data yang tidak terstruktur ini seperti halaman web, web log, search index, forum social media, email, dokumen, data sensor, dll. Data-data seperti inilah yang mungkin akan memberikan keuntungan jika kita mampu mengolahnya.
Velocity
Seberapa cepat kita dapat memproses data yang ada? Mungkin hal itu yang pertama ada dalam benak anda ketika anda membaca ini. Namun sebenarnya velocity di sini kita lihat dari persepsi seberapa cepat kita mampu mendapatkan hasil analisis terhadap aliran data yang terus mengalir di saat yang hampir bersamaan dengan datangnya data tersebut. Bayangkan jika kita memiliki sistem yang mampu mendeteksi buronan yang tertangkap kamera cctv, ataumendeteksi dini titik kritis seorang bayi dari suhu tubuh, tekanan darah, denyut jantung, kecepatan bernafas bayi tersebut, melakukan sensor terhadap kata kasar atau kata yang tidak seharusnya diucapkan yang diucapkan pada siaran langsung di tv atau pada percakapan telepon customer service sebuah perusahaan.

CONTOH BIG DATA DALAM BERBAGAI BIDANG
Contoh  di Sektor  Swasta
Perusahaan eBay.com menggunakan dua gudang data pada 7,5 petabyte dan 40PB serta Hadoop klaster 40PB untuk pencarian, rekomendasi, konsumen, dan merchandising . Di dalam eBay 90PB data warehouse. Amazon.com menangani jutaan operasi back-end setiap hari, serta pertanyaan dari lebih dari setengah juta penjual pihak ketiga . Teknologi inti yang membuat Amazon berjalan adalah berbasis Linux dan pada 2005 mereka memiliki tiga database Linux terbesar di dunia , dengan kapasitas 7,8 TB , 18,5 TB , dan 24,7 TB .
Walmart menangani lebih dari 1 juta transaksi nasabah setiap jam , yang diimpor ke database diperkirakan mengandung lebih dari 2,5 petabyte ( 2.560 terabyte ) data - . Setara dengan 167 kali informasi yang terdapat dalam semua buku di Perpustakaan Kongres AS.
FICO Falcon Penipuan Kartu Kredit Detection System melindungi 2,1 miliar akun aktif di seluruh dunia .
Volume data bisnis di seluruh dunia , di semua perusahaan , dua kali lipat setiap 1,2 tahun , menurut perkiraan. Windermere Real Estate menggunakan sinyal GPS anonim dari hampir 100 juta driver untuk membantu pembeli rumah baru menentukan waktu berkendara khas mereka ke dan dari tempat kerja di berbagai kali dalam sehari .
Contoh di Bidang Arsitektur
Pada tahun 2004 , Google menerbitkan sebuah makalah tentang proses yang disebut MapReduce yang menggunakan arsitektur tersebut . MapReduce framework menyediakan model pemrosesan paralel dan implementasi terkait untuk memproses sejumlah besar data . Dengan MapReduce , query dibagi dan didistribusikan di seluruh node paralel dan diproses secara . Hasilnya kemudian dikumpulkan dan disampaikan. Kerangka itu sangat sukses sehingga orang lain ingin meniru algoritma . Oleh karena itu , sebuah implementasi dari kerangka MapReduce diadopsi oleh sebuah proyek open source Apache Hadoop bernama
Teknologi Topological Program Analisis Data DARP
Contoh di Bidang Pasar
" Big Data " telah meningkatkan permintaan spesialis manajemen informasi dalam Software AG , Oracle Corporation , IBM , Microsoft , SAP , EMC , HP dan Dell telah menghabiskan lebih dari $ 15 miliar untuk perusahaan perangkat lunak hanya mengkhususkan diri dalam manajemen data dan analisis . Pada tahun 2010 , industri ini sendiri bernilai lebih dari $ 100 miliar dan tumbuh hampir 10 persen per tahun, tentang dua kali lebih cepat sebagai bisnis perangkat lunak secara keseluruhan .
Negara maju membuat meningkatnya penggunaan teknologi data-intensif Ada 4,6 miliar langganan ponsel di seluruh dunia dan ada antara 1 miliar sampai 2 miliar orang mengakses internet . Antara tahun 1990 dan 2005 , lebih dari 1 miliar orang di seluruh dunia memasuki kelas menengah yang berarti semakin banyak orang yang memperoleh uang akan menjadi melek lagi yang pada gilirannya menyebabkan pertumbuhan informasi . Kapasitas yang efektif di dunia untuk bertukar informasi melalui jaringan telekomunikasi adalah 281 petabyte pada tahun 1986 , 471 petabyte pada tahun 1993 , 2,2 exabyte pada tahun 2000 , 65 exabyte pada tahun 2007 dan diperkirakan bahwa jumlah lalu lintas yang mengalir melalui internet akan mencapai 667 exabytes per tahun pada tahun 2013.

PENGGUNAAN BIG DATA DALAM PERUSAHAAN
IT logs Analytics
Penyimpanan Log jangka panjang, digunakan untuk analisa proses sistem yang sedang berjalan untuk mencegah dan menaggulangi kegagalan dalam sistem, mengunakan hasil analisa log untuk menemukan dan mentukan secara pasti kegagalan apa yang terjadi didalam sistem, menyiapkan langkah-langkah pasti yang dapat digunakan sebagai solusi masalah sistem.
Fraud Detection Pattern
Banyak digunakan dalam Bidang keuangan atau dimana saja transaksi finasial terlibat, Memaksimalkan pengunaan data-data yang ada untuk memberikan kemampuan unutk mendeteksi fraud ketika transaksi sedang berlangsung
The Social Media Pattern
Pengunaan Big data untuk analisa media social dan sentiment pelangan, memberikan kemampuan bagi perusahan untuk mengetahui keinginan customer secara luas, mendapatkan feedback secara langsung, dan mengenali langsung dampak sentimen terhadap penjualan, serta efektivitas dan penerimaan pelangan terhadap pemasaran yang dilakukan.
The Call centere Mantra
Penyimpanan hasil perbincangan atau laporan customer dalam bentuk text yang kemudian digunakan sebagai data untuk analisa masalah yang dihadapai customer, memberikan kemampuan bagi perusahaan untuk memberikan tanggapan yang cepat maupun secara langsung terhadap masalah yang dihadapi customer, serta kemampuan unutk mendeteksi penurunan loyalitas customer dikarenakan masalah dan ketidakpuasaan.
Risk: Patterns  for Modeling and Management
Memberikan kempuaan pengunaan data secara penuh dan analisis dalam pemodelan resiko dan menejemen resiko untuk memberikan pengetahuan akan resiko dan penanggulangannya secara tepat dan langsung
Big data and The Energy Sector
Memberikan kemampuan penyimpanan dan pemrosesan data secara langsung dari berbagai sumber(sensor), analisa dan kemudahan dalam pengenalan noise untuk memisahkannya dari signal.

ANALISA SOLUSI BIG DATA
Sejumlah vendor di pasar saat ini mendukung solusi data yang besar . Berikut ini adalah daftar beberapa solusi diantaranya adalah :
IBM ( www.ibm.com ) mengambil pendekatan perusahaan untuk data yang besar dan mengintegrasikan seluruh platform termasuk embedding / bundling nya analisis . Produknya termasuk gudang ( warehouse InfoSphere ) yang memiliki built -in data-mining sendiri dan cubing kemampuan . ini baru PureData Systems ( kemasan teknologi analisis canggih ke dalam platform sistem terintegrasi ) mencakup banyak dikemas analitis integrasi . Produk InfoSphere Streaming Its terintegrasi dengan Paket perangkat lunak statistik statistik untuk Ilmu Sosial ( SPSS ) untuk mendukung real-time analisis prediktif , termasuk kemampuan untuk dinamis memperbarui model berdasarkan data real-time . Hal ini bundling terbatas penggunaan lisensi Cognos Business Intelligence dengan data kunci besar yang kemampuan platform ( kelas enterprise Hadoop , komputasi aliran , dan solusi gudang ) .
SAS ( www.sas.com ) memberikan beberapa pendekatan untuk menganalisis data besar via infrastrukturnya analisis kinerja tinggi dan yang statistic software . SAS menyediakan beberapa pilihan pemrosesan terdistribusi . ini termasuk dalam database analytics , in- memory analytics , dan komputasi grid . Penyebaran bisa di tempat atau di awan .
Tableau ( www.tableausoftware.com ) , sebuah business analytics dan data perusahaan perangkat lunak visualisasi , menawarkan kemampuan visualisasi untuk berjalan di atas peralatan dan infrastruktur lain yang ditawarkan oleh  berbagai besar mitra data, termasuk Cirro , EMC Greenplum , Karmasphere , Teradata / Aster, HP Vertica , Hortonworks , ParAccel , IBM Netezza , dan sejumlah lain .
Oracle ( www.oracle.com ) menawarkan berbagai alat untuk melengkapi yang besar platform data disebut Oracle Exadata . Ini termasuk analisis canggih melalui bahasa pemrograman R , serta database in- memory pilihan dengan Oracle Exalytics di memori mesin dan data Oracle gudang . Exadata terintegrasi dengan platform perangkat keras nya .
Pentaho ( www.pentaho.com ) menyediakan analisis bisnis open source melalui edisi komunitas dan perusahaan. Pentaho mendukung terkemuka Distribusi Hadoop - based dan mendukung kemampuan asli, seperti NFS kinerja tinggi sistem file mountable MapR itu


0 comments:

Post a Comment