في الأجزاء السابقة تحدثنا عن تعريف الثورة الصناعية الرابعة والذكاء الاصطناعي وإنترنت الاشياء وفي هذا الجزء اتحدث عن البيانات الضخمة والتي تمثل الوقود الحقيقي للثورة الصناعية الرابعة و يعتمد عليها الذكاء الاصطناعي وكل التقنيات الحديثة ، لذا فقد خصصت هذا الجزء للحديث عن البيانات الضخمة والتي يمكن تعريفها بأنها بيانات كبيرة ومتباينة ومتنوعة وديناميكية حيث تنشأ وتنتج بواسطة الأشخاص والأدوات والألات والأجهزة والطائرات ومراكز الابحاث والمراصد الكونية والفلكية ….. الخ ، كما أنها تتطلب تقنيات جديدة ومبتكرة للتخزين والاسترجاع والتطوير والادارة والتحليل وهذا ما سنستعرضه في الجزء القادم إن شاء الله .
فمنذ ألاف السنين يقوم الإنسان بتدوين حاضره وماضيه وتاريخه على الحوائط والجدران والمعابد والكهوف والمقابر والجلود والأوراق وقد انتجت البشرية منذ فجر التاريخ حتى 2003م 5 مليارات جيجا بايت .وفي عام 2011م كان يتم انتاج 5 مليارات جيجا بايت كل يومين وفي عام 2013 تم انتاج 5 مليارات جيجا كل 10 دقائق . الملفت للنظر أن 90 % من البيانات للعالم انتجت خلال السنتين الماضيتين فقط .
لذا فإن البيانات الضخمة أصبحت من الموارد الهامة التي تتميز بالوفرة على عكس الموارد التقليدية الطبيعية والتي تتميز بالندرة وأتوقع بأن النظريات الاقتصادية ستتعرض الى اعادة نظر للمعايير والأسس التي بنيت عليها .
ومن خصائص البيانات الضخمة :
1 – السرعة :
وهي سرعة تدفق البيانات التي تصل إلينا على سبيل المثال، أن كل 60 ثانية يتم تحميل ساعات من اللقطات على اليوتيوب الذي ينتج بيانات. فمن الممكن تخيل سرعة تراكم البيانات في الساعة أو اليوم أو الشهر وهكذا.
2 – الحجم :
حيث يزيد حجم البيانات مما يُعيق معالجتها بالطرق العادية. وهذه الزيادة بسبب تعدد مصادر البيانات وأجهزة الاستشعارات عالية الدقة والبنية التحتية القابلة للتطوير. يستخدم الناس في العالم غالبًا كل أنواع الأجهزة من تليفون وكمبيوتر وساعة رقمية ……ألخ . وأصبح حجم البيانات لدينا يصل إلى 2.5 كوينتليون بايت يوميًا ما يعادل أكثر من 10 مليون قرص(DVDs). . وهذه البيانات في تزايد مستمر كل ثانية الآن .
3 – التنوع :
تتنوع البيانات على شكل صور أو فيديوهات أو أرقام أو تغريدات ومنشورات. حيث يزداد تنوع البيانات بسبب دخول عدد كبير من التكنولوجيات الجديدة للتليفون ووسائل التواصل الاجتماعي والفيديو وغيرها.
4 – الصدق:
حيث نوعية وأصل البيانات وتطابقها مع الحقائق والوقائع والاكتمال والنزاهة. وتتكلف الشركات مبالغ ومجهودات عالية ويزداد تتبع البيانات وتحري الدقة دائمًا للتأكد من المصداقية. و80 ٪ من البيانات تقريبا غير منتظمة، لذلك يجب دائمًا ابتكار طرق لتنظيم وترتيب واستكمال وتحليل وتكامل ودمج البيانات.
5 – القيمة :
تحويل البيانات إلى قيمة لجلب فوائد طبية واجتماعية واقتصادية وسياسية ، وفوائد للموظف والعميل وتطوير الشخصية وكل مناحي الحياة .
والمذهل في البيانات الضخمة أن انتاجها وفير وبغزارة تزداد كل ثانية فمثلا يتم انتاج التالي على سبيل المثال :
– أكثر من 9000 تغريدة على تويتر في الثانية الواحدة
– أكثر من 1000 صورة على الانستجرام في الثانية الواحدة
– أكثر من 85000 عملية بحث على جوجل في الثانية الواحدة
– أكثر من 8000 فيديو على اليوتيوب يتم رفعه في الثانية الواحدة
– أكثر من 2 مليون ايميل في الثانية الواحدة
– أكثر من 80 مليار رسالة على الواتس يوميا
– أكثر من 2.8 مليار مستخدم نشط شهريا و 1.84 مليار مستخدم نشط يوميا على الفيس بوك .
– بلغت عدد الصور على الفيس بوك 350 مليار صورة .
– أكثر من 4 مليون إعجاب كل دقيقة على الفيس بوك .
– أكثر من 3 مليار مستخدم للإنترنت .
كل هذه البيانات في الماضي القريب كانت تنتج من وثائق وملفات شخصية من الشركات وبعض الجهات الحكومية والمجتمع المدني والأن يتم انتاج بيانات اكثرضخامة وكثافة من كل شيء تقريبا مقارنة بالعصر الماضي . وللحديث بقية عن الاستخدام والفائدة لتلك البيانات التي فاقت قيمة النفط والذهب والموارد الطبيعية وماهي المعالجات والوظائف التي تقوم بتلك المعالجة للإستفادة منها.
د.أشرف عطية
رئيس شركة اومجيا سوفت