ما هي البيانات الضخمة - شرح بسيط بمثال
يتم استخدام مصطلح البيانات الضخمة(Big Data) بشكل متزايد في كل مكان تقريبًا على هذا الكوكب - عبر الإنترنت وخارجه. ولا تتعلق بالكمبيوتر فقط. يأتي هذا المصطلح تحت مصطلح شامل يسمى تكنولوجيا المعلومات(Information Technology) ، والذي أصبح الآن جزءًا من جميع التقنيات ومجالات الدراسات والشركات الأخرى تقريبًا. البيانات الضخمة(Big Data) ليست صفقة كبيرة. الضجيج المحيط به هو بالتأكيد صفقة كبيرة جدًا لإرباكك. تلقي هذه المقالة نظرة على ماهية البيانات الضخمة(Big Data) . يحتوي أيضًا على مثال لكيفية استخدام NetFlix لبياناته ، أو بالأحرى البيانات الضخمة(Big Data) ، لخدمة احتياجات عملائها بشكل أفضل.
ما هي البيانات الضخمة
كانت البيانات الموجودة في خوادم شركتك مجرد بيانات حتى يوم أمس - تم فرزها وحفظها. فجأة ، أصبحت البيانات الضخمة(Big Data) شائعة ، والآن أصبحت البيانات في شركتك هي البيانات الكبيرة(Big Data) . يغطي المصطلح كل جزء من البيانات التي خزنتها مؤسستك حتى الآن. يتضمن البيانات المخزنة في السحب وحتى عناوين URL(URLs) التي قمت بوضع إشارة مرجعية عليها. ربما لم تقم شركتك برقمنة جميع البيانات. ربما لم تكن قد نظمت جميع البيانات بالفعل. ولكن بعد ذلك ، أصبحت جميع البيانات الرقمية والورقية والمنظمة وغير المهيكلة مع شركتك هي الآن بيانات كبيرة(Big Data) .
باختصار ، فإن جميع البيانات - سواء كانت مصنفة أم لا - الموجودة في الخوادم الخاصة بك تسمى بشكل جماعي BIG DATA . يمكن استخدام كل هذه البيانات للحصول على نتائج مختلفة باستخدام أنواع مختلفة من التحليل. ليس من الضروري أن تستخدم جميع التحليلات جميع البيانات. يستخدم التحليل المختلف أجزاء مختلفة من BIG DATA لإنتاج النتائج والتنبؤات اللازمة.
البيانات الضخمة(Big Data) هي في الأساس البيانات التي تقوم بتحليلها من أجل النتائج التي يمكنك استخدامها للتنبؤات والاستخدامات الأخرى. عند استخدام مصطلح البيانات الضخمة(Big Data) ، تعمل شركتك أو مؤسستك فجأة باستخدام تقنية معلومات(Information) عالية المستوى لاستنتاج أنواع مختلفة من النتائج باستخدام نفس البيانات التي قمت بتخزينها عن قصد أو عن غير قصد على مر السنين.
ما حجم البيانات الضخمة
في الأساس ، جميع البيانات مجتمعة هي بيانات كبيرة(Big Data) ، لكن العديد من الباحثين يتفقون على أن البيانات الضخمة -(Big Data –) على هذا النحو - لا يمكن التلاعب بها باستخدام جداول البيانات العادية والأدوات العادية لإدارة قواعد البيانات. إنهم بحاجة إلى أدوات تحليل خاصة مثل Hadoop (سنقوم بدراسة هذا في منشور منفصل) بحيث يمكن تحليل جميع البيانات دفعة واحدة (قد تشمل تكرارات التحليل).
على عكس ما ورد أعلاه ، على الرغم من أنني لست خبيرًا في هذا الموضوع ، إلا أنني أود أن أقول إن البيانات مع أي مؤسسة - كبيرة أو صغيرة ، منظمة أو غير منظمة - هي بيانات كبيرة لتلك المنظمة وأن المنظمة قد تختار أدواتها الخاصة لتحليل البيانات.(Contrary to the above, though I am not an expert on the subject, I would say that data with any organization – big or small, organized or unorganized – is Big Data for that organization and that the organization may choose its own tools to analyze the data.)
عادةً ، لتحليل البيانات ، اعتاد الأشخاص على إنشاء مجموعات بيانات مختلفة بناءً على واحد أو أكثر من الحقول الشائعة بحيث يصبح هذا التحليل سهلاً. في حالة البيانات الضخمة(Big Data) ، ليست هناك حاجة لإنشاء مجموعات فرعية لتحليلها. لدينا الآن أدوات يمكنها تحليل البيانات بغض النظر عن حجمها. من المحتمل أن هذه الأدوات نفسها تصنف البيانات حتى أثناء تحليلها.
أجد أنه من المهم ذكر جملتين من كتاب "البيانات الضخمة" لجيمي غوترمان(Jimmy Guterman) :
“Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”
-و-
“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”
لذلك ترى أن كلا من الحجم والتحليل جزء مهم من البيانات الضخمة(Big Data) .
قراءة(Read) : ما هو التنقيب عن البيانات؟(What is Data Mining?)
مفاهيم البيانات الضخمة
هذه نقطة أخرى حيث لا يتفق معظم الناس. يقول بعض الخبراء أن مفاهيم البيانات الضخمة(Big Data Concepts) تتكون من ثلاثة مفاهيم:
- مقدار
- سرعة
- متنوع
يضيف البعض الآخر القليل من V إلى المفهوم:
- التصور
- الصدق (الموثوقية)
- تقلب و
- قيمة
سأغطي مفاهيم البيانات الضخمة(Big Data) في مقال منفصل لأن هذا المنشور أصبح كبيرًا بالفعل. في رأيي ، فإن الثلاثة الأولى من V تكفي لشرح مفهوم البيانات الضخمة(Big Data) .
مثال البيانات الضخمة - كيف(Big Data Example – How NetFlix) استخدمته NetFlix لإصلاح مشاكلها
بحلول عام 2008 ، كان هناك انقطاع في NetFlix بسبب ترك العديد من العملاء في الظلام. بينما لا يزال بإمكان البعض الوصول إلى خدمات البث ، لم يتمكن معظمهم من ذلك. تمكن بعض العملاء من الحصول على أقراص DVD(DVDs) المستأجرة بينما فشل البعض الآخر. ذكرت مدونة على صحيفة وول ستريت جورنال(Wall Street Journal) أن Netflix قد بدأت للتو في البث عند الطلب.
دفع انقطاع التيار الكهربائي الإدارة إلى التفكير في المشاكل المستقبلية المحتملة ، وبالتالي ؛ تحولت إلى البيانات الضخمة(Big Data) . قامت بتحليل مناطق حركة المرور العالية ، والنقاط الحساسة ، ومعدل نقل الشبكة ، وما إلى ذلك باستخدام تلك البيانات وعملت عليها لتقليل وقت التوقف عن العمل إذا ظهرت مشكلة مستقبلية عندما أصبحت عالمية. هذا هو الرابط(the link) إلى مدونة وول ستريت جورنال(Wall Street Journal Blog) ، إذا كنت ترغب في التحقق من أمثلة البيانات الضخمة(Big Data) .
يلخص ما ورد أعلاه ماهية البيانات الضخمة بلغة الشخص العادي. يمكنك تسميتها مقدمة أساسية للغاية. أخطط لكتابة عدد قليل من المقالات حول العوامل المرتبطة مثل - المفاهيم(Concepts) والتحليل والأدوات(Analysis) واستخدامات البيانات الضخمة (Tools)والبيانات(uses of Big Data) الضخمة 3 V وما إلى ذلك. وفي الوقت نفسه ، إذا كنت ترغب في إضافة أي شيء إلى ما سبق ، فيرجى التعليق والمشاركة معنا.
اقرأ التالي(Read next) : ما هو تجريف الويب(Web Scraping) ؟
Related posts
Big Data Consumption. ما هي استخدامات Big Data
ما هو Data Analytics وما هو عليه
ما هو الفرق بين Data and Information
كيفية تثبيت Drupal باستخدام WAMP على Windows
Best Software & Hardware Bitcoin Wallets ل Windows، IOS، Android
Task Management Software مجانا لإدارة العمل الجماعي
حدث خطأ أثناء التحقق من التحديثات في VLC
Best Laptop Backpacks ل Men and Women
ما هو Silly Window Syndrome - Explanation and Prevention
كيفية إغلاق Payoneer Account الخاص بك؟
Best مجانا Secure Digital Notebook Software & Online Services
ما هو Blue Whale Challenge Dare Game
كيفية تحويل Binary إلى نص باستخدام هذا النص إلى Binary Converter
جلب الخاص بك Device (BYOD) Advantages، Best Practices، إلخ
Setup Internet Radio Station مجانا على Windows PC
كيفية استخدام Template لإنشاء مستند مع LibreOffice
Automate.io هو بديل automation tool and IFTTT مجاني
ما هي Virtual Credit Cards وكيف وأين تحصل عليها؟
مغلق من Plex Server and Server Settings؟ هنا هو الإصلاح!
Microsoft Identity Manager: ميزات، Download