داده های بزرگ Big Data
داده های بزرگ یا Big Data چیست؟
داده های بزرگ یا داده های عظیم (Big Data)، اصطلاحی رایج برای مخازن دادهای بزرگ و پیچیده (نظیر پایگاهدادههای برخی از سازمانها) است که پردازش موثر و کارامد آنها در زمانی مناسب و معقول از عهده روشها و نرمافزارهای معمولی برنمیآید.
در دنیای امروزی با رشد فوق العاده سریع دادههای دیجیتال روبرو هستیم به طوری که روزانه میلیونها گیگابایت داده جدید توسط کاربران شبکههای اجتماعی، سامانههای مربوط به جمعآوری داده در سازمانها، حسگرهای صوتی و تصویری، رسانهها و … تولید میشود.
بدیهی است این حجم از دادهها بدون تحلیل و پردازش فاقد کارایی و مفهوم مناسب و کاربردی خواهند بود. اما از سوی دیگر افزایش حجم دادهها پیچیدگیهایی پیرامون تحلیل، جستجو، به اشتراک گذاری، فضای مورد نیاز برای ذخیرهسازی، انتقال، مصورسازی، حریم خصوصی و … به وجود آورده که تحقق آنها را از عهدهی روشهای معمولی تقریبا ناممکن کرده است.
از جمله روشها و تکنولوژیهایی که برای کار با دادههای بزرگ و پردازش و تحلیل موثر آنها مورد استفاده قرار میگیرد میتوان به پردازش موازی دیتابیسها، سیستمهای فایل توزیعی، داده کاوی و … اشاره نمود.
لازم به ذکر است امروزه دادههای تولید شده توسط بسیاری از دولتها، صنایع، بخشهای مرتبط با سلامت، آموزش، رسانههای تصویری و صوتی و وبسایتهای بزرگ دادهمحوری همچون ویکیپدیا، شبکههای اجتماعی نظیر فیس بوک، فروشگاههای بزرگ و … همگی در زمرهی دادههای بزرگ به حساب میآیند.