Konsep Teknologi Informasi POLITALA
Nama
: Achmad Dwi Normansyah
Kelas
: 1A Teknik Informatika
NIM :
1801301001
BIG
DATA
A. Pengertian Big Data
Big Data ialah istilah umum
untuk segala kumpulan himpunan data dalam jumlah yang sangat besar dan kompleks
sehingga menjadikannya sulit untuk ditangani atau di proses jika hanya
menggunakan manajemen basis data biasa atau aplikasi pemroses data tradisional.
Big Data menjamin pemrosesan solusi
data dengan varian baru maupun yang sudah ada untuk memberikan manfaat nyata
bagi bisnis. Namun pengolahan data dengan ukuran dan kompleksitas besar tetap
sekedar solusi teknologi kecuali jika dikaitkan dengan tujuan bisnis.
Hal terpenting dari Big Data
bukanlah sekedar kemampuan teknis untuk mengolah data melainkan maanfaat yang
dapat disadari oleh perusahaan dengan menggunakan Big Data Analytics Termilogi
Big Data diyakini berasal datri perusahaan pencariaan web yang mengolah data
dengan gregasi yang terdistribusi sangat besar dan tidak terstruktur.
Artikel ini akan mengupas beberapa contoh penerapan teknologi Big Data dalam
bidang kesehatan.
1. Teknologi Hadoop untuk Pemantauan
Kondisi Vital Pasien
Beberapa rumah sakit di seluruh
dunia telah menggunakan Hadoop untuk membantu stafnya bekerja secara efisien
dengan Big Data. Tanpa Hadoop, sebagian besar sistem layanan kesehatan hampir
tidak mungkin menganalisis data yang tidak terstruktur.
Children's Healthcare of Atlanta merawat lebih dari 6.200
anak di unit ICU mereka. Rata-rata durasi tinggal di ICU Pediatrik bervariasi
dari satu bulan sampai satu tahun. Children's Healthcare of Atlanta menggunakan
sensor di samping tempat tidur yang membantu mereka terus melacak kondisi vital
pasien seperti tekanan darah, detak jantung dan pernafasan. Sensor ini
menghasilkan data yang sangat besar, dan sistem yang lama tidak mampu untuk
menyimpan data tersebut lebih dari 3 hari karena terkendala biaya storage.
Padahal rumah sakit ini perlu menyimpan tanda-tanda vital tersebut untuk
dianalisa. Jika ada perubahan pola, maka perlu ada alert untuk tim dokter dan
asisten lain.
Sistem tersebut berhasil diimplementasikan dengan
menggunakan komponen ekosistem Hadoop : Hive, Flume, Sqoop, Spark, dan Impala.
Setelah keberhasilan project tersebut, project berbasis Hadoop selanjutnya yang
mereka lakukan adalah riset mengenai asma dengan menggunakan data kualitas
udara selama 20 tahun dari EPA (Environment Protection Agency). Tujuannya:
mengurangi kunjungan IGD dan rawat inap untuk kejadian terkait asma pada
anak-anak.
2. Valence health : peningkatan kualitas
layanan dan reimbursements
Valence
health menggunakan Hadoop untuk membangun data lake yang merupakan penyimpanan
utama data perusahaan. Valence memproses 3000 inbound data feed dengan 45 jenis
data setiap harinya. Data kritikal ini meliputi hasil tes lab, data rekam
medis, resep dokter, imunisasi, obat, klaim dan pembayaran, serta klaim dari dokter
dan rumah sakit, yang digunakan untuk menginformasikan keputusan dalam
peningkatan baik itu pendapatan ataupun reimbursement. Pertumbuhan jumlah klien
yang pesat dan peningkatan volume data terkait semakin membebani infrastruktur
yang ada.
Sebelum menggunakan big data, mereka
membutuhkan waktu hingga 22 jam untuk memproses 20 juta records data hasil
laboratorium. Penggunaan big data memangkas waktu siklus dari 22 jam menjadi 20
menit, dengan menggunakan hardware yang jauh lebih sedikit. Valence Health juga
mampu menangani permintaan pelanggan yang sebelumnya sulit untuk diselesaikan.
Misalnya jika seorang klien menelpon dan mengatakan bahwa ia telah mengirimkan
file yang salah 3 bulan yang lalu, dan perlu untuk menghapus data tersebut.
Sebelumnya dengan solusi database tradisional, mereka memerlukan 3 sampai 4
minggu. Dengan memanfaatkan MapR snapshot yang menyediakan point-in-time
recovery, Valence dapat melakukan roll-back dan menghapus file tersebut dalam
hitungan menit.
3.
Hadoop dalam Pengobatan Kanker
dan Genomics
Salah satu alasan terbesar mengapa kanker belum dapat
dibasmi sampai sekarang adalah karena kanker bermutasi dalam pola yang berbeda
dan bereaksi dengan cara yang berbeda berdasarkan susunan genetik seseorang.
Oleh karena itu, para peneliti di bidang onkologi menyatakan bahwa untuk
menyembuhkan kanker, pasien perlu diberi perawatan yang disesuaikan dengan
jenis kanker berdasarkan genetika masing-masing pasien.
Ada sekitar 3 miliar pasangan nukleotida yang membentuk DNA
manusia, dan diperlukan sejumlah besar data untuk diorganisir secara efektif
jika kita ingin melakukan analisis. Teknologi big data, khususnya Hadoop dan
ekosistemnya memberikan dukungan yang besar untuk paralelisasi dan proses
pemetaan DNA.
David Cameron, Perdana Menteri Inggris telah mengumumkan
dana pemerintah sebesar £ 300 juta pada bulan Agustus, 2014 untuk proyek 4
tahun dengan target memetakan 100.000 genom manusia pada akhir tahun 2017
bekerja sama dengan perusahaan Bioteknologi Amerika Illumina dan Genomics
Inggris. Tujuan utama dari proyek ini adalah memanfaatkan big data dalam dunia
kesehatan untuk mengembangkan personalized medicine bagi pasien kanker.
Arizona State University mengadakan sebuah proyek penelitian yang meneliti
jutaan titik di DNA manusia untuk menemukan variasi penyebab kanker sedang
berlangsung. Proyek ini merupakan bagian dari Complex Adaptive Systems
Initiative (CASI), yang mendorong penggunaan teknologi untuk menciptakan solusi
bagi permasalahan dunia yang kompleks. Dengan menggunakan Apache Hadoop, tim
peneliti universitas dapat memeriksa variasi dalam jutaan lokasi DNA untuk
mengidentifikasi mekanisme kanker dan bagaimana jaringan berbagai gen mendorong
kecenderungan dan efek kanker pada individu. "Proyek kami memfasilitasi
penggunaan data genomik berskala besar, sebuah tantangan bagi semua institusi
penelitian yang menangani pecision medicine," kata Jay Etchings, direktur
komputasi riset ASU. Ekosistem Hadoop dan struktur data lake terkait
menghindarkan setiap peneliti dan pengguna klinis untuk mengelola sendiri jejak
data genomik yang besar dan kompleks.
4.
UnitedHealthcare: Fraud, Waste,
and Abuse
Saat ini setidaknya 10% dari pembayaran asuransi Kesehatan
terkait dengan klaim palsu. Di seluruh dunia kasus ini diperkirakan mencapai
nilai miliaran dolar. Klaim palsu bukanlah masalah baru, namun kompleksitas
kecurangan asuransi tampaknya meningkat secara eksponensial sehingga
menyulitkan perusahaan asuransi kesehatan untuk menghadapinya.
UnitedHealthCare adalah sebuah perusahaan asuransi yang
memberikan manfaat dan layanan kesehatan kepada hampir 51 juta orang.
Perusahaan ini menjalin kerja sama dengan lebih dari 850.000 orang tenaga
kesehatan dan sekitar 6.100 rumah sakit di seluruh negeri. Payment Integrity
group/divisi integritas pembayaran mereka memiliki tugas untuk memastikan bahwa
klaim dibayar dengan benar dan tepat waktu. Sebelumnya pendekatan mereka untuk
mengelola lebih dari satu juta klaim per hari (sekitar 10 TB data tiap harinya)
bersifat ad hoc, sangat terikat oleh aturan, serta terhambat oleh data yang
terpisah-pisah. Solusi yang diambil oleh UnitedHealthCare adalah pendekatan
dual mode, yang berfokus pada alokasi tabungan sekaligus menerapkan inovasi
untuk terus memanfaatkan teknologi terbaru.
Dalam hal pengelolaan tabungan, divisi tersebut membuat
“pabrik” analisis prediktif di mana mereka mengidentifikasi klaim yang tidak
akurat secara sistematis dan tepat. Saat ini Hadoop merupakan data framework
berplatform tunggal yang dilengkapi dengan tools untuk menganalisa informasi
dari klaim, resep, plan peserta, penyedia layanan kesehatan yang dikontrak, dan
hasil review klaim terkait. Mereka mengintegrasikan semua data dari beberapa
silo di seluruh bisnis, termasuk lebih dari 36 aset data. Saat ini mereka memiliki
banyak model prediktif (PCR, True Fraud, Ayasdi, dll.) yang menyediakan
peringkat provider yang berpotensi melakukan kecurangan, sehingga mereka dapat
mengambil tindakan yang lebih terarah dan sistematis.
5.
Liaison Technologies: Streaming
System
of Record for Healthcare
Liaison Technologies menyediakan solusi berbasis cloud untuk
membantu organisasi dalam mengintegrasikan, mengelola, dan mengamankan data di
seluruh perusahaan. Salah satu solusi vertikal yang mereka berikan adalah untuk
industri kesehatan dan life science, yang harus menjawab dua tantangan :
memenuhi persyaratan HIPAA dan mengatasi pertumbuhan format dan representasi
data.
Dengan MapR Stream, permasalahan data lineage dapat
terpecahkan karena stream menjadi sebuah SOR (System of Record) dengan
berfungsi sebagai log yang infinite dan immutable dari setiap perubahan data.
Tantangan kedua, yaitu format dan representasi data, bisa digambarkan dengan
contoh berikut: rekam medis pasien dapat dilihat dengan beberapa cara yang
berbeda (dokumen, grafik, atau pencarian) oleh pengguna yang berbeda, seperti
perusahaan farmasi, rumah sakit, klinik, atau dokter.
Dengan melakukan streaming terhadap perubahan data secara
real-time ke basis data, grafik, dan basis data MapR-DB, HBase, MapR-DB JSON, pengguna
akan selalu mendapatkan data paling mutakhir dalam format yang paling sesuai.
TERIMA KASIH ATAS KUNJUNGANNYA :-)
0 Komentar