Sementara banyak teknologi Big Data yang cukup matang untuk digunakan untuk beberapa tujuan khusus seperti kasus penggunaan produksi, masih baru muncul dalam beberapa hal. Dengan demikian, jalan ke depan tidak selalu jelas. Sebagai organisasi mengembangkan strategi Big Data, ada sejumlah dimensi yang perlu dipertimbangkan ketika memilih mitra teknologi, termasuk:
1. Big Data Online vs Offline
2. Model Lisensi Software
3. Komunitas Banding
4. Pengembang
5. Kecerdasan Sistem
6. Tujuan Umum vs Solusi
1. Big Data Online vs Offline
Big Data dapat mengambil bentuk baik online dan offline. Big Online data mengacu pada data yang dibuat, disimpan , diubah, dikelola dan / atau dianalisis secara real-time untuk mendukung operasional aplikasi dan pengguna mereka. Big Data lahir secara online. Latency untuk aplikasi ini harus sangat rendah dan ketersediaan harus tinggi dalam rangka memenuhi SLA dan harapan pengguna untuk kinerja aplikasi dengan desain tampilan yang modern. Ini termasuk susunan yang kompleksdari aplikasi, dari berita jaringan sosial feed, untuk Analytics untuk server iklan real-time untuk aplikasi CRM yang kompleks. Contoh database Big Data online meliputi MongoDB dan database lainnya yang NoSQL.
Big Data Offline mencakup aplikasi yang memasukan data, mengubah, mengelola dan / atau menganalisis Big Data dalam konteks batch. Mereka biasanya tidak membuat data baru. Untuk aplikasi ini, waktu respon bisa lambat (sampai ber jam atau hari), yang sering diterima untuk jenis kasus penggunaan. Karena mereka biasanya menghasilkan output yang statis (operasional), seperti laporan atau dashboard, mereka bahkan dapat berjalan dengan mode offline sementara tanpa mempengaruhi produk tujuan atau akhir keseluruhan. Contoh aplikasi Big Data offline meliputi Hadoop berbasis; data warehouse modern; ekstrak, transform, load (ETL) aplikasi; dan alat-alat bisnis intelijen .
Organisasi mengevaluasi mana teknologi Big Data untuk mengadopsi harus mempertimbangkan bagaimana mereka berniat untuk menggunakan data mereka. Bagi mereka yang ingin membangun aplikasi yang mendukung real-time, dalam kasus penggunaan operasional, mereka akan membutuhkan menyimpan data operasional seperti MongoDB. Bagi mereka yang membutuhkan tempat untuk melakukan lama berjalan analisis offline, mungkin untuk menginformasikan proses pengambilan keputusan, solusi secara offline seperti Hadoop dapat menjadi alat yang efektif. Organisasi mengejar kedua kasus penggunaan bisa melakukannya bersama-sama, dan mereka kadang-kadang akan menemukan integrasi antara online dan offline teknologi Big Data. Misalnya, MongoDB menyediakan integrasi dengan Hadoop.
2. Model Lisensi Software
Ada tiga jenis umum lisensi untuk teknologi perangkat lunak Big Data:
- Proprietary. Produk software dimiliki dan dikendalikan oleh sebuah perusahaan perangkat lunak. Kode sumber tidak tersedia untuk pemegang lisensi. Pelanggan biasanya lisensi produk melalui lisensi abadi yang memberikan hak mereka untuk digunakan terbatas, dengan biaya pemeliharaan tahunan untuk dukungan dan upgrade perangkat lunak. Contoh model ini meliputi database dari Oracle, IBM dan Terradata.
- Open-Source. Produk perangkat lunak dan kode sumber yang bebas tersedia untuk digunakan. Perusahaan menguangkan produk perangkat lunak dengan menjual langganan dan produk yang berdekatan dengan nilai tambah komponen, seperti alat-alat manajemen dan layanan dukungan. Contoh model ini meliputi MongoDB (oleh MongoDB, Inc.) dan Hadoop (oleh Cloudera dan lain-lain).
- Cloud Service. Layanan ini diselenggarakan dalam lingkungan berbasis Koneksi sangat luar pusat data pelanggan dan disampaikan melalui Internet publik. Model bisnis dominan meteran (yaitu, pay-per-use) atau berbasis langganan. Contoh model ini termasuk Google App Engine dan Amazon Elastic MapReduce.
Bagi ribuan perusahaan, peraturan dan kebijakan internal sekitar privasi data yang membatasi kemampuan mereka untuk memanfaatkan solusi berbasis cloud. Akibatnya, sebagian besar inisiatif Big Data didorong dengan teknologi dikerahkan on-premise. Sebagian pelopor Big Data adalah perusahaan web yang mengembangkan perangkat lunak dan perangkat keras yang kuat, yang mereka membuka-bersumber kepada masyarakat yang lebih besar. Dengan demikian, sebagian besar perangkat lunak yang digunakan untuk proyek-proyek Big Data adalah open-source.
3. Komunitas
Pada awal-awal Big Data, ada kesempatan untuk belajar dari orang lain. Organisasi harus mempertimbangkan berapa banyak inisiatif lain sedang dikejar menggunakan teknologi yang sama dan dengan tujuan yang sama. Untuk memahami adopsi teknologi tertentu yang, organisasi-organisasi harus mempertimbangkan hal berikut:
- Jumlah pengguna
- Prevalensi lokal, acara komunitas terorganisir
- Kesehatan dan aktivitas forum online seperti Google Groups dan StackOverflow
- Ketersediaan konferensi, seberapa sering mereka terjadi dan apakah mereka menghadiri konferensi tersebut
4. Pengembang Banding
Pasar untuk bakat Big Data sangatlah ketat. Insinyur atas bangsa dan ilmuwan data yang sering berduyun-duyun ke perusahaan seperti Google dan Facebook, yang memiliki pikiran cerdas dan tempat-tempat di mana satu akan terkena teknologi yang terdepan. Jika perusahaan ingin bersaing untuk bakat ini, mereka harus menawarkan lebih dari uang.
Dengan menawarkan pengembang kesempatan untuk bekerja pada masalah yang sulit, dan dengan menggunakan teknologi yang memiliki minat pengembang yang kuat, sebuah komunitas dinamis, dan masa depan jangka panjang yang menguntungkan, organisasi dapat menarik pikiran cerdas. Mereka juga dapat meningkatkan calon dengan memilih teknologi yang mudah dipelajari dan digunakan - yang sering orang-orang yang paling menarik bagi pengembang. Selain itu, teknologi yang memiliki daya tarik yang kuat pengembang cenderung membuat tim lebih produktif yang merasa diberdayakan oleh alat mereka daripada dibebani oleh buruk dirancang, teknologi warisan.Tim pengembang produktif mengurangi waktu ke pasar untuk inisiatif baru dan mengurangi biaya pengembangan, juga.
5. Kecerdasan Sistem Big Data
Organisasi harus menggunakan produk Big Data yang memungkinkan mereka untuk menjadi tangkas. Mereka akan mendapatkan keuntungan dari teknologi yang keluar dari jalan dan memungkinkan tim untuk fokus pada apa yang bisa mereka lakukan dengan data mereka, daripada bagaimana untuk menggunakan aplikasi dan infrastruktur baru.Ini akan membuatnya mudah untuk mengeksplorasi berbagai jalur dan hipotesis untuk mengekstraksi nilai dari data dan iterate cepat dalam menanggapi perubahan kebutuhan bisnis.
Dalam konteks ini, kelincahan maupun kecerdasan sistem dari big data dapat dilihat dari beberapa aspek antara lain terdiri dari tiga komponen utama:
- Kemudahan Penggunaan. Sebuah teknologi yang mudah bagi pengembang untuk belajar dan memahami - baik karena cara itu architected, ketersediaan alat dan informasi, atau keduanya - akan memungkinkan tim untuk mendapatkan proyek-proyek Big Data dimulai dan untuk mewujudkan nilai cepat . Teknologi dengan kurva belajar yang curam dan sumber daya yang lebih sedikit untuk mendukung pendidikan akan membuat jalan lebih lama untuk pelaksanaan proyek.
- Fleksibilitas teknologi. Produk ini harus membuatnya relatif mudah untuk mengubah persyaratan pada fly-seperti bagaimana data dimodelkan, data yang digunakan, dimana data ditarik dari dan bagaimana itu akan diproses sebagai tim mengembangkan temuan baru dan beradaptasi dengan internal dan eksternal membutuhkan. Model dinamis data (juga dikenal sebagai skema) dan skalabilitas kemampuan untuk mencari.
- Lisensi Freedom. Produk Open-source biasanya lebih mudah untuk mengadopsi, sebagai tim dapat memulai dengan cepat dengan versi komunitas gratis dari perangkat lunak. Mereka juga biasanya lebih mudah untuk skala dari sudut pandang perizinan, sebagai tim dapat membeli lebih banyak lisensi sebagai persyaratan meningkat. Sebaliknya, dalam banyak kasus vendor software proprietary memerlukan besar, pembelian lisensi dimuka, yang membuat lebih sulit bagi tim untuk mendapatkan bergerak cepat dan untuk skala di masa depan.
6. Tujuan Umum vs Solusi
Organisasi terus mencoba untuk standarisasi pada teknologi yang lebih sedikit untuk mengurangi kompleksitas, untuk meningkatkan kompetensi mereka dalam alat dipilih dan membuat hubungan vendor mereka lebih produktif.Organisasi harus mempertimbangkan apakah mengadopsi teknologi Big Data membantu mereka mengatasi inisiatif tunggal atau banyak inisiatif. Jika teknologi ini tujuan umum, keahlian, infrastruktur, keterampilan, integrasi dan investasi lainnya dari proyek awal dapat diamortisasi di banyak proyek. Organisasi mungkin menemukan bahwa teknologi niche mungkin lebih cocok untuk satu proyek, tapi itu alat tujuan yang lebih umum adalah pilihan yang lebih baik bagi organisasi secara keseluruhan.