ما هي البيانات الضخمة - شرح بسيط بمثال

يتم استخدام مصطلح البيانات الضخمة(Big Data) بشكل متزايد في كل مكان تقريبًا على هذا الكوكب - عبر الإنترنت وخارجه. ولا تتعلق بالكمبيوتر فقط. يأتي هذا المصطلح تحت مصطلح شامل يسمى تكنولوجيا المعلومات(Information Technology) ، والذي أصبح الآن جزءًا من جميع التقنيات ومجالات الدراسات والشركات الأخرى تقريبًا. البيانات الضخمة(Big Data) ليست صفقة كبيرة. الضجيج المحيط به هو بالتأكيد صفقة كبيرة جدًا لإرباكك. تلقي هذه المقالة نظرة على ماهية البيانات الضخمة(Big Data) . يحتوي أيضًا على مثال لكيفية استخدام NetFlix لبياناته ، أو بالأحرى البيانات الضخمة(Big Data) ، لخدمة احتياجات عملائها بشكل أفضل.

ما هي البيانات الضخمة

ما هي البيانات الضخمة

كانت البيانات الموجودة في خوادم شركتك مجرد بيانات حتى يوم أمس - تم فرزها وحفظها. فجأة ، أصبحت البيانات الضخمة(Big Data) شائعة ، والآن أصبحت البيانات في شركتك هي البيانات الكبيرة(Big Data) . يغطي المصطلح كل جزء من البيانات التي خزنتها مؤسستك حتى الآن. يتضمن البيانات المخزنة في السحب وحتى عناوين URL(URLs) التي قمت بوضع إشارة مرجعية عليها. ربما لم تقم شركتك برقمنة جميع البيانات. ربما لم تكن قد نظمت جميع البيانات بالفعل. ولكن بعد ذلك ، أصبحت جميع البيانات الرقمية والورقية والمنظمة وغير المهيكلة مع شركتك هي الآن بيانات كبيرة(Big Data) .

باختصار ، فإن جميع البيانات - سواء كانت مصنفة أم لا - الموجودة في الخوادم الخاصة بك تسمى بشكل جماعي BIG DATA . يمكن استخدام كل هذه البيانات للحصول على نتائج مختلفة باستخدام أنواع مختلفة من التحليل. ليس من الضروري أن تستخدم جميع التحليلات جميع البيانات. يستخدم التحليل المختلف أجزاء مختلفة من BIG DATA لإنتاج النتائج والتنبؤات اللازمة.

البيانات الضخمة(Big Data) هي في الأساس البيانات التي تقوم بتحليلها من أجل النتائج التي يمكنك استخدامها للتنبؤات والاستخدامات الأخرى. عند استخدام مصطلح البيانات الضخمة(Big Data) ، تعمل شركتك أو مؤسستك فجأة باستخدام تقنية معلومات(Information) عالية المستوى لاستنتاج أنواع مختلفة من النتائج باستخدام نفس البيانات التي قمت بتخزينها عن قصد أو عن غير قصد على مر السنين.

ما حجم البيانات الضخمة

في الأساس ، جميع البيانات مجتمعة هي بيانات كبيرة(Big Data) ، لكن العديد من الباحثين يتفقون على أن البيانات الضخمة -(Big Data –) على هذا النحو - لا يمكن التلاعب بها باستخدام جداول البيانات العادية والأدوات العادية لإدارة قواعد البيانات. إنهم بحاجة إلى أدوات تحليل خاصة مثل Hadoop (سنقوم بدراسة هذا في منشور منفصل) بحيث يمكن تحليل جميع البيانات دفعة واحدة (قد تشمل تكرارات التحليل).

على عكس ما ورد أعلاه ، على الرغم من أنني لست خبيرًا في هذا الموضوع ، إلا أنني أود أن أقول إن البيانات مع أي مؤسسة - كبيرة أو صغيرة ، منظمة أو غير منظمة - هي بيانات كبيرة لتلك المنظمة وأن المنظمة قد تختار أدواتها الخاصة لتحليل البيانات.(Contrary to the above, though I am not an expert on the subject, I would say that data with any organization – big or small, organized or unorganized – is Big Data for that organization and that the organization may choose its own tools to analyze the data.)

عادةً ، لتحليل البيانات ، اعتاد الأشخاص على إنشاء مجموعات بيانات مختلفة بناءً على واحد أو أكثر من الحقول الشائعة بحيث يصبح هذا التحليل سهلاً. في حالة البيانات الضخمة(Big Data) ، ليست هناك حاجة لإنشاء مجموعات فرعية لتحليلها. لدينا الآن أدوات يمكنها تحليل البيانات بغض النظر عن حجمها. من المحتمل أن هذه الأدوات نفسها تصنف البيانات حتى أثناء تحليلها.

أجد أنه من المهم ذكر جملتين من كتاب "البيانات الضخمة" لجيمي غوترمان(Jimmy Guterman) :

Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”

-و-

“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”

لذلك ترى أن كلا من الحجم والتحليل جزء مهم من البيانات الضخمة(Big Data) .

قراءة(Read) : ما هو التنقيب عن البيانات؟(What is Data Mining?)

مفاهيم البيانات الضخمة

هذه نقطة أخرى حيث لا يتفق معظم الناس. يقول بعض الخبراء أن مفاهيم البيانات الضخمة(Big Data Concepts) تتكون من ثلاثة مفاهيم:

  1. مقدار
  2. سرعة
  3. متنوع

يضيف البعض الآخر القليل من V إلى المفهوم:

  1. التصور
  2. الصدق (الموثوقية)
  3. تقلب و
  4. قيمة

سأغطي مفاهيم البيانات الضخمة(Big Data) في مقال منفصل لأن هذا المنشور أصبح كبيرًا بالفعل. في رأيي ، فإن الثلاثة الأولى من V تكفي لشرح مفهوم البيانات الضخمة(Big Data) .

مثال البيانات الضخمة - كيف(Big Data Example – How NetFlix) استخدمته NetFlix لإصلاح مشاكلها

بحلول عام 2008 ، كان هناك انقطاع في NetFlix بسبب ترك العديد من العملاء في الظلام. بينما لا يزال بإمكان البعض الوصول إلى خدمات البث ، لم يتمكن معظمهم من ذلك. تمكن بعض العملاء من الحصول على أقراص DVD(DVDs) المستأجرة بينما فشل البعض الآخر. ذكرت مدونة على صحيفة وول ستريت جورنال(Wall Street Journal) أن Netflix قد بدأت للتو في البث عند الطلب.

دفع انقطاع التيار الكهربائي الإدارة إلى التفكير في المشاكل المستقبلية المحتملة ، وبالتالي ؛ تحولت إلى البيانات الضخمة(Big Data) . قامت بتحليل مناطق حركة المرور العالية ، والنقاط الحساسة ، ومعدل نقل الشبكة ، وما إلى ذلك باستخدام تلك البيانات وعملت عليها لتقليل وقت التوقف عن العمل إذا ظهرت مشكلة مستقبلية عندما أصبحت عالمية. هذا هو الرابط(the link) إلى مدونة وول ستريت جورنال(Wall Street Journal Blog) ، إذا كنت ترغب في التحقق من أمثلة البيانات الضخمة(Big Data) .

يلخص ما ورد أعلاه ماهية البيانات الضخمة بلغة الشخص العادي. يمكنك تسميتها مقدمة أساسية للغاية. أخطط لكتابة عدد قليل من المقالات حول العوامل المرتبطة مثل - المفاهيم(Concepts) والتحليل والأدوات(Analysis) واستخدامات البيانات الضخمة (Tools)والبيانات(uses of Big Data) الضخمة 3 V وما إلى ذلك. وفي الوقت نفسه ، إذا كنت ترغب في إضافة أي شيء إلى ما سبق ، فيرجى التعليق والمشاركة معنا.

اقرأ التالي(Read next) : ما هو تجريف الويب(Web Scraping) ؟



About the author

بعد ما يقرب من 20 عامًا في صناعة التكنولوجيا ، تعلمت الكثير عن منتجات Apple وكيفية تخصيصها لتلبية احتياجاتي. على وجه الخصوص ، أعرف كيفية استخدام نظام iOS الأساسي لإنشاء مظاهر مخصصة والتفاعل مع المستخدمين من خلال تفضيلات التطبيق. أعطتني هذه التجربة رؤى قيمة حول كيفية تصميم Apple لمنتجاتها وأفضل طريقة لتحسين تجربة المستخدم.



Related posts