تا چندین دهه گذشته، علوم عمدتا حاصل سه الگوی مرتبط بود: آزمایشگاهی، نظری، و محاسباتی. ورود اینترنت و محاسبات رایانهای به طرز عجیبی ظرفیت جمعآوری، ذخیره، و اشتراک داده را افزایش داد. در نتیجه، سرعت تولید داده به قدری زیاد شده است که خروجی دادههای علمی هر ساله 30 درصد رشد میکند. حجم دادهها نیز هر دو سال دو برابر میشود. این حجم از داده را اصطلاحا بیگ دیتا یا کلان داده میگویند.
پیشینه تحقیق، 5 نکته کلیدی در نگارش آن
تفاوت مقاله ISI تحقیقی و مقاله مروری
بیگ دیتا از کجا میآید؟
بیگ دیتا یا سونامی داده شامل دادههای حاصل از اینترنت، تلفنهای هوشمند، مطالعات علمی، تجارتها، دولتها و منابع دیگر میشود. دنیای آکادمیک پذیرای این حجم بالای داده بود. زیرا با ورود این داده ها راههای جدیدی برای جستجوی محققین ایجاد شده است. در واقع بیگ دیتا به عنوان الگوی جدیدی از علم در نظر گرفته میشود. در کلان داده حجم بالایی از داده جمعآوری و تحلیل میشوند.
کاربرد بیگ دیتا چیست؟
بیگ دیتا نه تنها به دلیل کمیت بالای آن بلکه بخاطر کاربردهایش بر سر زبانها افتاده است. وجود حجم بالای داده موجب تغییر در طبیعت علم شده است. امروزه پیشرفتهای دانش وابستگی بیشتری به دادهها دارند. محققین در شاخههای مختلف علمی کلان داده را به عنوان یک روش استاندارد در نظر میگیرند. در حالی که پیشتر، تنها شاخههایی مثل فیزیک ذرات پرانرژی یا همجوشی هستهای به بیگ دیتا متکی بودند. پتانسیل کلان داده امروزه در شاخههای مختلف در حال بررسی است. شاخههای مثل بیولوژی، شیمی، فیزیک، فضانوردی، و غیره از کلان داده جهت تهیه مدلهای بهتر کمک میگیرند.
مرور سیستماتیک یا نظام مند چیست؟
طبق نظر محققین، بیگ دیتا فرصتهای جدید زیادی را برای شاخههای پزشکی ایجاد میکند. زیرا تشخیص بیماریهای پیچیده در سطح مولکولی را میتوان با تاریخچه درمانی و تشخیص پزشکی ترکیب کرد. کاربرد دیگر بیگ دیتا Large Hardon Collider است که در هر ثانیه 40 میلیون بار داده را ثبت میکند. با این کار نظریههای موجود در فیزیک را آزمایش میکنند. بیگ دیتا در مدیریت شهری و منابع طبیعی، مطالعه تغییرات آب و هوا، اتخاذ استراتژیهای سیاسی و مطالعه نحوه گسترش ایدهها کاربرد دارد. جدای از اینها، وجود دادههای گوناگون در سرتاسر دنیا افقهای جدیدی را نمایان کرده است. محققین میتوانند دادههای مختلفی را با یکدیگر به اشتراک بگذارند و با یکدیگر همکاری کنند.
چالش های پیشرو
در حالی که محققین، کلان داده را فرصت مناسبی برای علم میدانند بسیاری از آمارگران در مورد آن هشدار میدهند. زیرا آنها معتقدند کلان داده نقاط ضعف فراوانی دارد. یکی از چالشهای مهم در کار با کلان داده ذخیره و مدیریت داده است. مجموعههای بیگ دیتا به قدری پیچیده هستند که با روشهای سنتی نمیتوان آنها را تحلیل کرد. علاوه بر این، اگر یک تحقیق صرفا بر اساس دادهها انجام شود ممکن است اشتباهی رخ دهد. برای جلوگیری از این اشتباه باید دقت بالایی در تحلیل و بررسی دادهها به خرج داد.
آیا کلان داده به معنی داده خوب است؟ محققین در کار با کلان داده با چه چالشهایی روبرو هستند. این سوالات در پستهای بعدی مورد بحث قرار میگیرند.