مقالات

17.2: هياكل البيانات الثنائية - الرياضيات


الطريقة الأكثر شيوعًا لتخزين البيانات ذات الوضعين هي مصفوفة بيانات مستطيلة من الممثلين (الصفوف) حسب الأحداث (الأعمدة). الشكل 17.1 حذاء جزء من مجموعة البيانات القيمة التي سنستخدمها هنا (البيانات> العرض).

الشكل 17.1: مصفوفة بيانات مستطيلة لبيانات التبرعات السياسية في كاليفورنيا

على سبيل المثال ، قدمت جمعية المعلمين في كاليفورنيا تبرعات معارضة لمبادرات الاقتراع السابع والتاسع والعاشر ، وتبرعًا لدعم الاقتراع الثامن.

من الأساليب الشائعة جدًا والمفيدة جدًا للبيانات ثنائية الوضع تحويلها إلى مجموعتي بيانات ذات وضع واحد ، ودراسة العلاقات داخل كل وضع على حدة. على سبيل المثال ، يمكننا إنشاء مجموعة بيانات للروابط بين كل من الفاعلين ، وقياس قوة العلاقة بين كل زوج من الممثلين بعدد المرات التي ساهموا فيها في نفس الجانب من المبادرات ، ملخصة عبر 40 مبادرة. يمكننا أيضًا إنشاء مجموعة بيانات ذات نمط واحد لعلاقات كل مبادرة تلو الأخرى ، مع ترميز قوة العلاقة بعدد المانحين المشتركين بين كل زوج من المبادرات. ال البيانات> الانتماءات يمكن استخدام الأداة لإنشاء مجموعات بيانات أحادية الوضع من مصفوفة بيانات مستطيلة ذات وضعين. يعرض الشكل 17.2 مربع حوار نموذجي.

الشكل 17.2: حوار البيانات> الانتماءات لإنشاء علاقات بين الفاعلين والجهات المانحة في كاليفورنيا

هناك العديد من الخيارات هنا.

لقد اخترنا صف الوضع (الجهات الفاعلة) لهذا المثال. لإنشاء مجموعة بيانات أحادية الوضع بمبادرة من مبادرة ، كنا سنختار عمودي.

هناك طريقتان بديلتان:

ال طريقة المنتجات المتقاطعة يأخذ كل إدخال في الصف للممثل A ، ويضربه في نفس الإدخال للممثل B ، ثم يجمع النتيجة. عادة ، يتم استخدام هذه الطريقة للبيانات الثنائية لأن النتيجة هي عدد التواجد المشترك. مع البيانات الثنائية ، يكون كل منتج واحدًا فقط إذا كان كلا الفاعلين "حاضرين" في الحدث ، ويعطي المجموع عبر الأحداث عدد الأحداث المشتركة - وهو مقياس قيم للقوة.

مثالنا أكثر تعقيدًا بعض الشيء لأننا طبقنا طريقة المنتجات المشتركة على البيانات القيمة. هنا ، إذا لم يتبرع أي من الفاعلين لمبادرة (0 * 0 = 0) ، أو إذا تبرع أحدهما والآخر لم يتبرع (0 * -1 أو 0 * +1 = 0) ، فلا يوجد رابط. إذا تم التبرع بكلاهما في نفس الاتجاه (-1 * -1 أو +1 * +1 = 1) ، فهناك رابط إيجابي. إذا تم التبرع بكلاهما ، ولكن في اتجاهين متعاكسين (+1 * -1 = -1) ، فهناك ربطة عنق سلبية. مجموع النواتج المتقاطعة هو عدد قيم لغالبية الروابط الإيجابية أو السلبية.

ال طريقة الحد الأدنى يفحص إدخالات الممثلين في كل حدث ، ويختار الحد الأدنى للقيمة. بالنسبة للبيانات الثنائية ، تكون النتيجة مماثلة لطريقة الضرب المتقاطع (إذا كان كلاهما أو أي من الفاعلين صفرًا ، يكون الحد الأدنى صفرًا ؛ فقط إذا كان كلاهما واحدًا هو الحد الأدنى). بالنسبة للبيانات القيّمة ، فإن طريقة الحد الأدنى تقول بشكل أساسي: إن العلاقة بين الفاعلين تساوي أضعف روابط الفاعلين بالحدث. يستخدم هذا النهج بشكل شائع عند قياس البيانات الأصلية على أنها قيمة.

يوضح الشكل 17.3 نتيجة تطبيق طريقة المنتجات المتقاطعة على بياناتنا القيمة.

شكل 17.3: قوة التعادل بين الممثل والممثل (الشكل 17.2)

شاركت نقابة المعلمين في 16 حملة (يحسب الناتج المتقاطع للصف نفسه عدد الأحداث). اتخذت الجمعية نفس الموقف من القضايا مثل الحزب الديمقراطي (الممثل 7) عشر مرات أكثر من اتخاذ الموقف المعاكس (أو لا). اتخذت جمعية المطعم (العقدة 10) موقفًا معاكسًا للسيد بنج (العقدة 9) بشكل متكرر أكثر من دعم الموقف (أو عدمه). باستخدام هذه الخوارزمية ، قمنا بالتقاط الكثير ، ولكن ليس كل المعلومات الموجودة في البيانات الأصلية. يمكن أن تكون النتيجة -1 ، على سبيل المثال ، نتيجة اتخاذ ممثلين لمواقف معاكسة بشأن قضية واحدة ؛ أو ، قد يعني ذلك أن كلا الطرفين اتخذ مواقف بشأن عدة قضايا - وباختصار ، فقد اختلفا مرة أخرى أكثر مما اتفقا عليه.

أصبحت المصفوفات الناتجة أحادية النمط للممثلين على حدة والأحداث على حدة مصفوفات ذات قيمة تشير إلى قوة الارتباط على أساس التواجد المشترك. يمكن الآن تطبيق أي من طرق التحليل أحادي النمط على هذه المصفوفات لدراسة البنية الدقيقة أو البنية الكلية.

يتم تخزين البيانات ذات الوضعين أحيانًا بطريقة ثانية ، تسمى المصفوفة "ثنائية الجزء". يتم تكوين مصفوفة ثنائية القسم عن طريق إضافة الصفوف كأعمدة إضافية ، والأعمدة كصفوف إضافية. على سبيل المثال ، ستتكون المصفوفة الثنائية من بيانات الجهات المانحة لدينا من 68 صفًا (23 جهة فاعلة تليها 45 مبادرة) و 68 عمودًا (23 جهة فاعلة تليها 45 مبادرة). كتلتا الفاعل على حدة في المصفوفة متطابقة مع المصفوفة الأصلية ؛ عادةً ما يتم ترميز الكتلتين الجديدتين (الممثلين حسب الممثلين والأحداث حسب الأحداث) كأصفار. ال تحويل> ثنائي الأطراف تقوم الأداة بتحويل المصفوفات المستطيلة ذات الوضعين إلى مصفوفات ثنائية الوضع ثنائية الأجزاء. يوضح الشكل 17.4 مربع حوار نموذجي.

شكل 17.4: حوار التحويل> ثنائي الحزب لبيانات التبرعات السياسية في كاليفورنيا

ال القيمة لملء العلاقات داخل الوضع عادة ما تكون صفرية ، لذلك لا يتم ربط الممثلين إلا من خلال التواجد المشترك في الأحداث ، والأحداث مرتبطة فقط من خلال وجود ممثلين مشتركين.

بمجرد وضع البيانات في شكل مصفوفة مربعة ثنائية الأجزاء ، يمكن تطبيق العديد من الخوارزميات التي تمت مناقشتها في مكان آخر في هذا النص لبيانات أحادية النمط. هناك حاجة إلى قدر كبير من الحذر في التفسير ، لأن الشبكة التي يتم تحليلها هي شبكة غير عادية للغاية تكون فيها العلاقات عبارة عن روابط بين العقد على مستويات مختلفة من التحليل. بمعنى ما ، يتم التعامل مع الجهات الفاعلة والأحداث كأشياء اجتماعية على مستوى واحد من التحليل ، ويمكن استكشاف خصائص مثل المركزية والاتصال. هذا النوع من التحليل نادر نسبيًا ، لكن لديه بعض الإمكانيات الإبداعية المثيرة للاهتمام.

وبشكل أكثر شيوعًا ، نسعى إلى إبقاء الممثلين والأحداث "منفصلين" ولكن "متصلين" والبحث عن أنماط في كيفية ربط الفاعلين للأحداث معًا ، وكيف تربط الأحداث الممثلين معًا. سوف ندرس بعض التقنيات لهذه المهمة لاحقًا في هذا الفصل. على الرغم من ذلك ، فإن الخطوة الأولى الجيدة في أي تحليل للشبكة هي تصور البيانات.


شاهد الفيديو: #031 Data Structures - Binary Search Algorithm With Implementation (كانون الثاني 2022).