Big Data چیست؟

“Big Data” در ترجمه ی لغوی به معنی داده ی عظیم می باشد که در حوزه ی علم داده یک اصطلاح برای حجم داده هایی است که از دید داده کاوی ارزشمند هستند. با وجود اینکه این عبارت به مقیاس مشخصی اشاره ندارد ولی امروزه به حجم داده در حدود پتابایت (Peta Byte) و بیشتر داده ی عظیم گفته می شود. “Big Data” به مجموعه ای از تکنیک ها و تکنولوژی ها گفته می شود که موجب پیدا شدن داده های ارزشمندی میشوند که در میان حجم عظیم داده، یا داده با پیچیدگی بالا نهفته هستند و با ابزارهای معمول نمیتوان به آنها دسترسی پیدا کرد.

در مقابل مفهوم Big Data مفهوم Small Data وجود دارد. Big Data داده هایی هستند که فقط توسط ماشین قابل پردازشند و Small Data داده هایی هستند که توسط انسان قابلیت تحلیل دارند. برای درک بهتر اینطور تصور کنید که Small Data همان داده ی قابل ذخیره سازی در یک فرم کاغذی هستند ولی در مورد Big Data به ده ها و حتی صدها سرور برای ذخیره و بازیابی نیازمند هستیم. به همین دلیل مفهوم Cloud Computing همواره در کنار Big Data قرار دارد.

در صنعت، از مدلی به نام “3Vs” برای توصیف داده عظیم استفاده می شود. این نام به حروف اول سه عبارت Volume (حجم داده)، Velocity (سرعت داده های ورودی و نتایج خروجی)  و Variety (تنوع داده ها) اشاره دارد.

 

امروزه بعضی از سازمان ها V دیگری به این مدل اضافه کرده اند و مدل 4Vs را بوجود آورده اند. V چهارم از Veracity به معنی صحت داده ها می باشد.

Big Data با استفاده از خاصیت های ذیل قابل توصیف است:

  • Volume (حجم): حجم داده معیار Big Data بودن یا نبودن است و همچنین نشاندهنده ی ارزش و پتانسیل داده برای کاوش می باشد.
  • Variety (تنوع): پردازشگران داده می بایست بدانند داده ها به چه دسته بندی تعلق دارند تا بر اساس آن تصمیم گیری کنند. هرچه تنوع این دسته ها بیشتر باشد به همان اندازه عمل پردازش و استخراج داده می تواند سخت تر باشد.
  • Velocity (سرعت): منظور سرعت تولید داده و پردازش داده است. بسته به اینکه داده ها با چه سرعتی تجدید می شوند و یا اینکه شما با چه سرعتی نیاز دارید داده ی خروجی را استخراج کنید میبایست راه حل های متفاوتی ارايه نمایید.
  • Variability (تفاوت): هر عنصر داده ای دارای چندین خصوصیت است. وقتی تفاوت این خصوصیات بین داده ها زیاد باشد، داده ناپایدار نامیده می شود و استخراج داده از آن سخت تر خواهد بود.
  • Veracity (درستی): درستی داده ی خروجی با درستی داده ی ورودی رابطه ی مستقیم دارد. بدیهی است اگر داده ی غلط به مورد پردازش قرار گیرد (به عنوان مثال افراد در پر کردن پرسشنامه ها صداقت نداشته باشند) داده ی خروجی هم غلط خواهد بود. حتی با درست یودن داده ی ورودی قبل از پردازش، آن را پیش پردازش می کنند به این معنی که داده های پرت را از مابقی داده ها حذف می کنند تا داده ها همگرا شوند و نتیجه ی دقیق تری حاصل گردد.
  • Complexity (پیچیدگی): به دلیل حجم بسیار بالای داده، داده ها از منابع مختلفی وارد می شوند و می بایست این داده ها را در کنار هم قرار داد تا نتیجه ی مورد نظر حاصل شود. به این وضعیت به اصطلاح پیچیدگی داده می گویند.

Big Data کاربرد های متعددی دارد. هر جا که شما با حجم بالایی از داده برخورد کنید روشهای Big Data می توانند به شما در تصمیم گیری بهتر (با اطمینان بیشتر) کمک کنند که این مورد موجب کاهش ریسک، کاهش هزینه ها و افزایش بهره وری عملیاتی می شود. از جمله کاربردهای امروزی Big Data  می توان به: حل مشکلات تصمیم گیری کلان دولت ها، یافتن علایق افراد و کابرد آن ها در تبلیغات انتخاباتی، تحقیقات دارویی، روند وقوع حوادث طبیعی و بسیاری موارد دیگر اشاره کرد.

رایان طبیب

 
·  نظر دهی 
· اشتراک گذاری :


برچسب ها   :
Big ,
Data ,










برای ارسال نظر ‎‏ ، همین امروز در وب سایت رایان طبیب ثبت نام کنید.

ورود


مقالات طراحی سایت

مقالات سئو و بهینه سازی سایت

مقالات علمی

کلیه حقوق متعلق به رایان طبیب می باشد.
طراحی سایت،بهینه سازی سایت،طراحی وب سایت،بهینه سازی وب سایت،سئو,صابر فضلی احمدی,Saber Fazli Ahmadi
طراحی سایت حرفه ای،طراحی وب،طراحی وب سايت،فروشگاه،بهینه سازی،طراحی وب سایت،سئو,صابر فضلی احمدی,Saber Fazli Ahmadi
طراحی و توسعه سایت رایان طبیب | 2018 ©