مقالات

2.3.4.4E: معادلة الانحدار (تمرين)


استخدم المعلومات التالية للإجابة على التدريبات الخمسة التالية. أنتجت عينة عشوائية من عشرة رياضيين محترفين البيانات التالية حيث (س ) هو عدد التأكيدات التي حصل عليها اللاعب و (ص ) هو مبلغ المال الذي حصل عليه (بملايين الدولارات).

(س ) (ص ) (س ) (ص )
02512
3849
2739
1303
513410

تمرين 12.4.2

ارسم مخطط مبعثر للبيانات.

تمرين 12.4.3

استخدم الانحدار لإيجاد معادلة الخط الأنسب.

إجابه

( قبعة {y} = 2.23 + 1.99x )

تمرين 12.4.4

ارسم الخط الأنسب في مخطط التشتت.

تمرين 12.4.5

ما هو ميل الخط الأنسب؟ ما أنه لا يمثل؟

إجابه

الميل هو 1.99 ( (ب = 1.99 )). هذا يعني أنه مقابل كل صفقة تأييد يحصل عليها اللاعب المحترف ، يحصل على أجر 1.99 مليون دولار آخر في المتوسط ​​كل عام.

تمرين 12.4.6

ما هو (y ) - تقاطع الخط الأنسب؟ ما أنه لا يمثل؟

تمرين 12.4.7

ماذا تعني قيمة (r ) الصفر؟

إجابه

هذا يعني أنه لا يوجد ارتباط بين مجموعات البيانات.

تمرين 12.4.8

عندما (n = 2 ) و (r = 1 ) ، هل البيانات مهمة؟ يشرح.

تمرين 12.4.9

عندما (n = 100 ) و (r = -0.89 ) ، هل هناك ارتباط مهم؟ يشرح.


12.4E: معادلة الانحدار (تمرين)

استخدم المعلومات التالية للإجابة على التدريبات الخمسة التالية. أنتجت عينة عشوائية من عشرة رياضيين محترفين البيانات التالية حيث (س ) هو عدد المصادقات التي حصل عليها اللاعب و (ص ) هو مبلغ المال الذي حصل عليه (بملايين الدولارات).

(س ) (ص ) (س ) (ص )
0 2 5 12
3 8 4 9
2 7 3 9
1 3 0 3
5 13 4 10

ارسم مخطط مبعثر للبيانات.

استخدم الانحدار لإيجاد معادلة الخط الأنسب.

ارسم الخط الأنسب في مخطط التشتت.

ما هو ميل الخط الأنسب؟ ما أنه لا يمثل؟

الميل هو 1.99 ( (ب = 1.99 )). هذا يعني أنه مقابل كل صفقة تأييد يحصل عليها اللاعب المحترف ، يحصل في المتوسط ​​على 1.99 مليون دولار في الأجر كل عام.

ما هو (y ) - تقاطع السطر الأنسب؟ ما أنه لا يمثل؟

ماذا تعني قيمة (r ) الصفر؟

هذا يعني أنه لا يوجد ارتباط بين مجموعات البيانات.

عندما (n = 2 ) و (r = 1 ) ، هل البيانات مهمة؟ يشرح.

عندما (n = 100 ) و (r = -0.89 ) ، هل هناك ارتباط مهم؟ يشرح.


خط انحدار المربعات الصغرى

إعطاء أي مجموعة من أزواج الأرقام (باستثناء عندما يكون كل ملف x- القيم هي نفسها) والمخطط المبعثر المقابل ، يوجد دائمًا خط مستقيم واحد بالضبط يناسب البيانات بشكل أفضل من أي شيء آخر ، بمعنى تقليل مجموع الأخطاء التربيعية. يطلق عليه خط انحدار المربعات الصغرى. علاوة على ذلك ، هناك صيغ لمنحدر و ذ-تقاطع.

تعريف

نظرا لمجموعة من الأزواج (س ، ص) من الأرقام (حيث ليس كل x- القيم هي نفسها) ، هناك خط ص ^ = β ^ 1 س + ^ 0 يناسب البيانات بشكل أفضل بمعنى تقليل مجموع الأخطاء التربيعية. يطلق عليه خط انحدار المربعات الصغرى الخط الأنسب لمجموعة من بيانات العينة بمعنى تقليل مجموع الأخطاء التربيعية. . منحدره β ^ 1 و ذ-تقاطع β ^ 0 يتم حسابها باستخدام الصيغ

β ^ 1 = S S x y S S x x a n d β ^ 0 = y - - β ^ 1 x -

S S x x = Σ x 2-1 n (Σ x) 2، S S x y = Σ x y - 1 n (Σ x) (Σ y)

x - هو يعني كل x-القيم، ص - هو يعني كل ذ- القيم و ن هو عدد الأزواج في مجموعة البيانات.

المعادلة ص ^ = β ^ 1 س + ^ 0 تحديد خط انحدار المربعات الصغرى يسمى معادلة انحدار المربعات الصغرى المعادلة y ^ = β ^ 1 x + β ^ 0 لخط انحدار المربعات الصغرى. .

تذكر من القسم 10.3 "نمذجة العلاقات الخطية مع وجود العشوائية" أن الخط الذي يحتوي على المعادلة y = β 1 x + β 0 يسمى خط الانحدار السكاني. الأرقام β ^ 1 و β ^ 0 عبارة عن إحصائيات تقدر المعلمات السكانية β 1 و β 0.

سنحسب خط انحدار المربعات الصغرى لمجموعة البيانات المكونة من خمس نقاط ، ثم للحصول على مثال عملي أكثر سيكون مثالًا آخر قيد التشغيل لإدخال مفاهيم جديدة في هذا القسم والأقسام الثلاثة التالية.

مثال 2

ابحث عن خط انحدار المربعات الصغرى لمجموعة البيانات المكونة من خمس نقاط

وتحقق من أنها تلائم البيانات بشكل أفضل من السطر y ^ = 1 2 x - 1 الوارد في القسم 10.4.1 "ملاءمة ملاءمة الخط المستقيم للبيانات".

في الممارسة الفعلية ، يتم حساب خط الانحدار باستخدام حزمة حسابية إحصائية. لتوضيح معنى الصيغ نعرض الحسابات في شكل جدول.

في السطر الأخير من الجدول لدينا مجموع الأرقام في كل عمود. باستخدامهم نحسب:

SS xx = x 2-1 n (Σ x) 2 = 208-1 5 (28) 2 = 51.2 SS xy = Σ xy - 1 n (Σ x) (Σ y) = 68-1 5 (28) (9) = 17.6 x - = Σ xn = 28 5 = 5.6 y - = Σ yn = 9 5 = 1.8

β ^ 1 = S S x y S S x x = 17.6 51.2 = 0.34375 و β ^ 0 = y - - β ^ 1 x - = 1.8 - (0.34375) (5.6) = - 0.125

خط انحدار المربعات الصغرى لهذه البيانات هو

ترد حسابات قياس مدى ملاءمتها لبيانات العينة في الجدول 10.2 "الأخطاء في ملاءمة البيانات مع خط انحدار المربعات الصغرى". مجموع الأخطاء التربيعية هو مجموع الأرقام في العمود الأخير ، وهو 0.75. إنه أقل من 2 ، مجموع الأخطاء التربيعية لملاءمة الخط y ^ = 1 2 x - 1 لمجموعة البيانات هذه.

الجدول 10.2 الأخطاء في ملاءمة البيانات بخط انحدار المربعات الصغرى

x ذ ص ^ = 0.34375 س - 0.125 ذ - ذ ^ (ص - ص ^) 2
2 0 0.5625 −0.5625 0.31640625
2 1 0.5625 0.4375 0.19140625
6 2 1.9375 0.0625 0.00390625
8 3 2.6250 0.3750 0.14062500
10 3 3.3125 −0.3125 0.09765625

مثال 3

يوضح الجدول 10.3 "بيانات عن عمر وقيمة السيارات المستعملة من طراز وطراز محددين" العمر بالسنوات وقيمة البيع بالتجزئة بآلاف الدولارات لعينة عشوائية من عشر سيارات من نفس الطراز والطراز.

  1. أنشئ الرسم التخطيطي المبعثر.
  2. احسب معامل الارتباط الخطي ص. فسر قيمته في سياق المشكلة.
  3. حساب خط انحدار المربعات الصغرى. ارسمها على الرسم التخطيطي المبعثر.
  4. فسر معنى منحدر خط انحدار المربعات الصغرى في سياق المشكلة.
  5. لنفترض أن سيارة عمرها أربع سنوات من هذا الطراز والطراز تم اختيارها عشوائيًا. استخدم معادلة الانحدار للتنبؤ بقيمة البيع بالتجزئة.
  6. لنفترض أن سيارة عمرها 20 عامًا من هذا الطراز والطراز قد تم اختيارها عشوائيًا. استخدم معادلة الانحدار للتنبؤ بقيمة البيع بالتجزئة. فسر النتيجة.
  7. علق على صلاحية استخدام معادلة الانحدار للتنبؤ بسعر سيارة جديدة تمامًا من هذا الطراز والطراز.

الجدول 10.3 بيانات عن عمر وقيمة السيارات المستعملة من طراز وطراز محددين

x 2 3 3 3 4 4 5 5 5 6
ذ 28.7 24.8 26.0 30.5 23.8 24.6 23.8 20.4 21.6 22.1

الشكل 10.7 مخطط مبعثر لعمر وقيمة السيارات المستعملة

يجب علينا أولاً حساب S S x x و S S x y و S S y y مما يعني حساب Σ x و y و Σ x 2 و Σ y 2 و Σ x y. باستخدام جهاز كمبيوتر نحصل عليه

Σ س = 40 ص = 246.3 × 2 = 174 ص ص 2 = 6154.15 × ص = 956.5

SS xx = x 2-1 n (Σ x) 2 = 174-1 10 (40) 2 = 14 SS xy = Σ xy - 1 n (Σ x) (Σ y) = 956.5 - 1 10 (40) (246.3) = - 28.7 SS yy = y 2-1 n (Σ y) 2 = 6154.15 - 1 10 (246.3) 2 = 87.781

ص = S S x y S S x x · S S y y = - 28.7 (14) (87.781) = - 0.819

يرتبط عمر وقيمة هذا الطراز والطراز من السيارات ارتباطًا سلبيًا إلى حد ما. مع تقدم العمر ، تميل قيمة السيارة إلى الانخفاض.

باستخدام قيم Σ x و y المحسوبة في الجزء (ب) ،

س - = Σ س ن = 40 10 = 4 وص - = Σ ص ن = 246.3 10 = 24.63

وهكذا باستخدام قيم S S x x و S S x y من الجزء (ب) ،

β ^ 1 = S S x y S S x x = - 28.7 14 = - 2.05 و β ^ 0 = y - - β ^ 1 x - = 24.63 - (- 2.05) (4) = 32.83

المعادلة y ^ = β ^ 1 x + ^ 0 لخط انحدار المربعات الصغرى لهذه البيانات النموذجية هي

يوضح الشكل 10.8 "مخطط التشتت وخط الانحدار لعمر وقيمة السيارات المستعملة" مخطط مبعثر مع رسم بياني لخط انحدار المربعات الصغرى متراكبًا.

الشكل 10.8 مخطط مبعثر وخط انحدار لعمر وقيمة السيارات المستعملة

    المنحدر −2.05 يعني زيادة كل وحدة في x (سنة إضافية من العمر) ينخفض ​​متوسط ​​قيمة هذا الطراز والمركبة بحوالي 2.05 وحدة (حوالي 2،050 دولارًا).

نظرًا لأننا لا نعرف شيئًا عن السيارة بخلاف عمرها ، فإننا نفترض أنها ذات قيمة متوسطة تقريبًا ونستخدم متوسط ​​قيمة جميع المركبات ذات الأربع سنوات من هذا الطراز والطراز كتقديرنا. متوسط ​​القيمة هو ببساطة قيمة y ^ التي تم الحصول عليها عند إدخال الرقم 4 من أجل x في معادلة انحدار المربعات الصغرى:

وهو ما يعادل 24630 دولارًا أمريكيًا.

الآن نقوم بإدخال x = 20 في معادلة انحدار المربعات الصغرى للحصول على

ص ^ = - 2.05 (20) + 32.83 = - 8.17

والذي يتوافق مع - 8،170 دولارًا أمريكيًا. هناك شيء خاطئ ، لأن السلبية لا معنى لها. نشأ الخطأ من تطبيق معادلة الانحدار على قيمة x ليس في نطاق x- القيم في البيانات الأصلية من سنتين إلى ست سنوات.

تطبيق معادلة الانحدار y ^ = β ^ 1 x + β ^ 0 على قيمة x خارج نطاق x- يتم استدعاء القيم في مجموعة البيانات استقراء. إنه استخدام غير صالح لمعادلة الانحدار ويجب تجنبه.

للتأكيد نسلط الضوء على النقاط التي أثارها الجزأين (و) و (ز) من المثال.

تعريف

عملية استخدام معادلة انحدار المربعات الصغرى لتقدير قيمة ذ بقيمة x هذا لا يقع في نطاق x- تسمى القيم في مجموعة البيانات التي تم استخدامها لتشكيل خط الانحدار الاستقراء عملية استخدام معادلة انحدار المربعات الصغرى لتقدير قيمة ذ في x القيمة ليست في النطاق المناسب. . إنه استخدام غير صالح لمعادلة الانحدار يمكن أن يؤدي إلى أخطاء ، وبالتالي يجب تجنبه.


الاحالة: تمارين الانحدار الخطي

سؤال البحث: هل عدد ساعات العمل أسبوعيا (أسبوع العمل) توقع دخل الأسرة (الإيرادات)?

باستخدام مجموعة بيانات Polit2SetA ، قم بإجراء انحدار بسيط باستخدام Family Income (الإيرادات) كمتغير الناتج (ص) وعدد ساعات العمل في الأسبوع (أسبوع العمل) كمتغير مستقل (X). عند إجراء أي تحليل انحدار ، تكون المتغيرات التابعة (النتيجة) دائمًا (ص) وتوضع على المحور ص ، والمتغير المستقل (المتنبئ) دائمًا (س) ويوضع على المحور س.

اطلب أوراق الحل الشامل بشأن التعيين: تمارين الانحدار الخطي

اتبع هذه الخطوات عند استخدام SPSS:

1. افتح مجموعة بيانات Polit2SetA.

2. انقر فوق حلل، ثم انقر فوق تراجع، من ثم خطي.

3. انقل المتغير التابع (الإيرادات) في المربع المسمى "تابع" بالنقر فوق زر السهم. المتغير التابع هو متغير مستمر.

4. انقل المتغير المستقل (أسبوع العمل) في المربع المسمى "مستقل".

5. انقر فوق إحصائيات زر (الجانب الأيمن من المربع) وانقر فوق الوصف, تقديرات, فاصل الثقة (يجب أن تكون 95٪) ، و نموذج صالح، ثم انقر فوق يكمل.

6. انقر فوق حسنا.

من خلال تحليل مخرجات SPSS ، أجب عن الأسئلة التالية. أجب عن الأسئلة 1 & # 8211 10 بشكل فردي ، وليس في شكل فقرة

1. ما هو حجم العينة الإجمالي؟

2. ما هو متوسط ​​الدخل ومتوسط ​​عدد ساعات العمل؟

3. ما هو معامل الارتباط بين متغيرات النتيجة والمتنبئ؟ هل هي مهمة؟ كيف تصف قوة العلاقة واتجاهها؟

4. ما قيمة R تربيع (معامل التحديد)؟ فسر القيمة.

5. تفسير الخطأ المعياري للتقدير؟ ما هي المعلومات التي توفرها هذه القيمة للباحث؟

6. يتم تحديد ملاءمة النموذج من خلال نتائج جدول ANOVA (F الإحصاء = 37.226 ، 1،376 درجة حرية ، و ص القيمة .001). بناءً على هذه النتائج ، هل يتناسب النموذج مع البيانات؟ اشرح باختصار. (تلميح: نتيجة مهمة تشير إلى ملاءمة نموذج جيد.)

7. بناءً على المعامِلات ، ما قيمة التقاطع y (النقطة التي يتقاطع عندها الخط الأفضل مع المحور y)؟

8. بناءً على الناتج ، اكتب معادلة الانحدار للتنبؤ بدخل الأسرة.

9. باستخدام معادلة الانحدار ، ما هو دخل الأسرة الشهري المتوقع للمرأة العاملة 35 ساعة في الأسبوع؟

10. باستخدام معادلة الانحدار ، ما هو دخل الأسرة الشهري المتوقع للمرأة العاملة 20 ساعة في الأسبوع؟

في هذه المهمة نحاول توقع درجة CES-D (الاكتئاب) لدى النساء. سؤال البحث هو: إلى أي مدى يتنبأ العمر والتحصيل العلمي والتوظيف وسوء الصحة وسوء الصحة بالاكتئاب؟

باستخدام مجموعة بيانات Polit2SetC ، قم بتشغيل انحدار متعدد باستخدام نقاط CES-D (مجلس التنمية الاقتصادية والاجتماعية) كمتغير النتيجة (ص) وعمر المستفتى (عمر)، التحصيل العلمي (تعليم)، يعمل حاليا (اعمل الان) ، العدد ، أنواع الإساءة (نابوس) ، وسوء الصحة (فقير) كمتغيرات مستقلة (X). عند إجراء أي تحليل انحدار ، تكون المتغيرات التابعة (النتيجة) دائمًا (ص) وتوضع على المحور ص ، والمتغير المستقل (المتنبئ) دائمًا (س) ويوضع على المحور س.

اتبع هذه الخطوات عند استخدام SPSS:

1. افتح مجموعة بيانات Polit2SetC.

2. انقر فوق تحليل ، ثم انقر فوق تراجع، من ثم خطي.

3. حرك المتغير التابع ، درجة CES-D (مجلس التنمية الاقتصادية والاجتماعية) في المربع المسمى "تابع" من خلال النقر على زر السهم. المتغير التابع هو متغير مستمر.

4. انقل المتغيرات المستقلة (عمر, تعليم, اعمل الان، و فقير) في المربع المسمى "مستقل". هذه هي الكتلة الأولى من المتغيرات التي يتم إدخالها في التحليل (الخانة 1 من 1). انقر فوق الجزء السفلي (أعلى يمين المربع المستقل) ، الذي يحمل علامة "التالي" ، وسيمنحك هذا مربعًا آخر لإدخال الكتلة التالية من المتغيرات المستقلة (الكتلة 2 من 2). ها أنت ذا للدخول (نابوس). ملحوظة: تأكد من أن مربع الأسلوب ينص على "أدخل".

5. انقر فوق إحصائيات زر (الجانب الأيمن من المربع) وانقر فوق الوصف, تقديرات, فاصل الثقة (يجب أن تكون 95٪) ، تغيير مربع R، و نموذج صالح، ثم انقر فوق يكمل.

6. انقر فوق حسنا.

(عند الإجابة على جميع الأسئلة ، استخدم البيانات الموجودة على لوحة المعاملات من النموذج 2). أجب عن الأسئلة 1 & # 8211 5 بشكل فردي ، وليس في شكل فقرة

1. قم بتحليل البيانات من مخرجات SPSS واكتب فقرة تلخص النتائج. (استخدم المثال الموجود في ملف إخراج SPSS كدليل لكتابتك.)

2. أي من المتنبئين كان من المتنبئين المهمين في النموذج؟

3. أي من المتنبئين كان هو المتنبئ الأكثر صلة في النموذج؟

4. تفسير المعامِلات غير المعيارية للتحصيل العلمي وسوء الحالة الصحية.

5. إذا أردت توقع درجة CES-D الحالية للمرأة بناءً على التحليل ، فماذا ستكون معادلة الانحدار غير المعيارية؟ قم بتضمين المعاملات غير القياسية في المعادلة.

Gray، J.R.، Grove، S.K.، & amp Sutherland، S. (2017). ممارسة بيرنز آند غروف لأبحاث التمريض: التقييم والتوليف وتوليد الأدلة (الطبعة الثامنة). سانت لويس ، ميزوري: سوندرز إلسفير.

يؤكد هذا الفصل أن التحليلات التنبؤية تستند إلى نظرية الاحتمالات بدلاً من نظرية القرار. كما يحلل كيف يلعب التباين دورًا مهمًا في الانحدار الخطي البسيط والانحدار المتعدد.

الإحصاء وتحليل البيانات لأبحاث التمريض

يناقش هذا القسم من الفصل 9 معادلة الانحدار البسيطة ويحدد المكونات الرئيسية للانحدار ، بما في ذلك أخطاء التنبؤ ، والمتبقي ، وانحدار المربعات الصغرى ، وانحدار المربع الصغرى العادي.

يركز الفصل 10 على الانحدار المتعدد كإجراء إحصائي ويشرح الإحصائيات متعددة المتغيرات وعلاقتها بمفاهيم الانحدار المتعددة والمعادلات والاختبارات.

يقدم هذا الفصل لمحة عامة عن الانحدار اللوجستي ، وهو شكل من أشكال التحليل الإحصائي المستخدم بشكل متكرر في أبحاث التمريض.


الفصل 12: الانحدار الخطي البسيط

تهدف التدريبات التالية إلى (1) توفير ممارسة تحليل البيانات باستخدام الانحدار الخطي البسيط و (2) مراجعة وتعزيز قدرتنا على تجميع البيانات. السبب في تأكيدنا على هاتين المهارتين معًا هو أننا ، في كثير من الحالات ، نريد تحليل البيانات التي تتضمن فقط بعض الملاحظات (والمتغيرات) مع استبعاد الآخرين. تحقيقًا لهذه الغاية ، نستخدم بيانات Cars93 من الحزمة R المسماة MASS. إذا لزم الأمر ، تأكد من الرجوع إلى الفصل 2 للحصول على إرشادات محددة حول كيفية الوصول إلى Cars93 ، مع إيلاء اهتمام خاص للمناقشة الموجزة التي تسبق مباشرة التمرين 1 في نهاية الفصل. ولأن الانحدار هو المنهج التحليلي النهائي للكتاب ، فإننا نعيد النظر في العديد من وظائف R الأكثر فائدة والتي تم تناولها سابقًا في الكتاب ، من أجل الممارسة فقط.

1. قم باستيراد بيانات Cars93 إلى الكائن المسمى E12_1. ما هي أسماء المتغيرات؟ كم عدد الملاحظات المدرجة؟ أوجد (1) القيم الدنيا والقصوى ، (2) الوسيط والمتوسط ​​، (3) الربعيان الأول والثالث ، و (4) الانحراف المعياري للمتغيرين ، MPG.city و EngineSize. التعليق على النتائج الأولية الخاصة بك.

مكتبة (ماس)
##
## إرفاق الحزمة: 'MASS'
## تم إخفاء الكائن التالي من "package: introstats":
##
## السكن
# تعليق 1. استيراد Cars93 في الكائن المسمى E12_1.
E12_1 & lt- سيارات 93
# تعليق 2. استخدم الدالة nrow () للعثور على الرقم
# من الملاحظات.
nrow (E12_1)
## [1] 93
# تعليق 3. استخدم وظيفة names () لسرد أسماء المتغيرات.
أسماء (E12_1)
## [1] "الشركة المصنعة" "الطراز" "النوع"
## [4] "الحد الأدنى للسعر" "السعر" "السعر الأقصى"
## [7] "MPG.city" "MPG.highway" "AirBags"
## [10] "DriveTrain" "الأسطوانات" "EngineSize"
## [13] "حصان" "RPM" "Rev.per.mile"
## [16] "Man.trans.avail" "Fuel.tank.capacity" "الركاب"
## [19] "الطول" "قاعدة العجلات" "العرض"
## [22] "Turn.circle" "Rear.seat.room" "Luggage.room"
## [25] "الوزن" "الأصل" "الصنع"
# تعليق 4. استخدم وظيفة الملخص () للعثور على الأساسي
#descriptive Statistics for MPG.city and EngineSize.
الملخص (E12_1 $ MPG.city)
## دقيقة. 1st Qu. متوسط ​​متوسط ​​3rd Qu. الأعلى.
## 15.00 18.00 21.00 22.37 25.00 46.00
الملخص (E12_1 $ EngineSize)
## دقيقة. 1st Qu. متوسط ​​متوسط ​​3rd Qu. الأعلى.
## 1.000 1.800 2.400 2.668 3.300 5.700
# تعليق 5. استخدم الدالة sd () للعثور على الانحراف المعياري
# من كل متغير.
sd (E12_1 $ MPG.city)
## [1] 5.619812
sd (E12_1 $ EngineSize)
## [1] 1.037363

إجابه:تتضمن بيانات Cars93 93 ملاحظة عبر 27 متغيرًا. الوصف-
يتم توفير إحصاءات tive لـ MPG.city و EngineSize في التعليقين 4 و 5.

2. هل يبدو MPG.city و EngineSize مرتبطين بأي طريقة منهجية؟ تعليق.

المؤامرة (E12_1 $ EngineSize ، E12_1 $ MPG.city ،
pch = 19 ،
xlab = 'حجم المحرك (لترات)' ،
ylab = "أميال المدينة لكل جالون" ،
main = 'العلاقة بين مدينة ميلا في الغالون وحجم المحرك (لترات)')

إجابه: يشير نمط النقاط الذي كشف عنه مخطط التشتت إلى أن العلاقة مرتبطة بشكل سلبي. السؤال المهم هو ما إذا كانت العلاقة خطية ، يشير مخطط التشتت إلى أنه من المحتمل أن يكون منحنيًا أكثر من الخطي. لحل هذه المشكلة ، ننتقل بعد ذلك إلى المؤامرة المتبقية.

3. قم بعمل وفحص قطعة أرض متبقية. هل يكشف نمط النقاط عن أي شيء قد يجعلنا نتساءل عن الافتراضات التي يقوم عليها الاستخدام المناسب لتحليل الانحدار لاستكشاف العلاقة بين MPG.city و EngineSize؟

# تعليق 1. استخدم الدالة lm () لإنشاء كائن النموذج

# المسمى slr1 (أول انحدار خطي بسيط).

# تعليق 2. استخدم الدالة plot () لإنشاء مخطط متبقي.

# لاحظ أنه يجب تضمين القيم المتبقية (slr1) كوسيطة.

ريست (slr1) ،
أبلين (ح = 0) ،
pch = 19 ،
xlab = 'حجم المحرك (لترات)' ،
ylab = "المخلفات" ،
main = "مخلفات ضد المتغير المستقل")

إجابه: عندما يكون حجم المحرك بين (تقريبًا) 1.5 و 4.75 لترًا ، تكشف البقايا عن علاقة خطية معقولة بين MPG.city و EngineSize. ومع ذلك ، فإن هذا النمط يميل إلى الانهيار لكل من القيم العلوية والسفلية لحجم المحرك: بالنسبة للمركبات التي لديها أصغر حجم محرك (أقل من 1.5 لتر) وأكبر حجم محرك (فوق 4.75) ، فإن نمط المخلفات يكشف أن الافتراضات الأساسية لم يتم الوفاء بالتطبيق الصحيح للانحدار بشكل جيد.

4. هناك عدة طرق ممكنة لإدارة مشكلة العلاقات غير الخطية بين المتغيرات ، مثل ما واجهناه في هذه الحالة. تتضمن إحدى الطرق تحويل المتغيرات - عن طريق اللوغاريتمات ، والأسس ، وما إلى ذلك - بطريقة تجعلها قسري لتكون أكثر ارتباطًا خطيًا. (يشار إلى هذه الفئة من الأساليب أحيانًا باسم GLM أو النموذج الخطي العام، لم يتم تناولها في هذا الكتاب.) إجراء آخر يتطلب تضمين متغيرات إضافية في نموذج الانحدار المتعدد (محور الفصل 13). بدلاً من ذلك ، يتضمن النهج الذي نستخدمه هنا تعيين البيانات وفقًا لبعض المواصفات - مثل تقسيم البيانات إلى أجزاء فرعية بطريقة تتضمن ، على سبيل المثال ، المركبات المصنعة في الولايات المتحدة فقط أو جميع المركبات ذات المحركات الأصغر (أي عدد أقل لتر من الإزاحة). التوقع (أو الأمل) هو أنه من خلال التقسيم الجزئي ، قد تلبي البيانات الناتجة الافتراضات الكامنة وراء التطبيق المناسب لتحليل الانحدار. كخطوة أولى ، قم بتعيين البيانات المخزنة في الكائن E12_1 جزئيًا بطريقة تستبعد جميع المركبات ذات حجم المحرك الأكبر من المتوسط. (راجع التعليق 4 تحت التمرين الأول أعلاه.) قم بتسمية هذا الكائن الجديد E12_2. تحقق للتأكد من أن E12_2 يتوافق مع هذا المطلب. كم عدد الملاحظات المتبقية في الكائن الجديد؟ أدرج أول 3 ملاحظات قائمة بآخر 3 ملاحظات. إذا لزم الأمر ، راجع النقطة الثالثة من ملحق الفصل 2 ، "هل يمكننا استخراج مجموعة بيانات فرعية من مجموعة بيانات أكبر؟"

# تعليق 1. استخدم الفهرسة [] اضبط قيمة حجم المحرك المتوسط ​​على 2.4.

E12_2 & lt- E12_1 [E12_1 $ EngineSize & lt = 2.40، c (MPG.city، EngineSize)]

# تعليق 2. استخدم الدالتين max () و min () للعثور على الحد الأقصى

# والقيم الدنيا لـ EngineSize في E12_2.

# تعليق 3. أدرج أول 3 وآخر 3 ملاحظات في E12_2.

## MPG.city EngineSize
## 1 25 1.8
## 6 22 2.2
## 12 25 2.2

## MPG.city EngineSize
## 90 21 2.0
## 92 21 2.3
## 93 20 2.4

# تعليق 4. استخدم الدالة nrow () للعثور على عدد
#observations مخزنة في E12_2.

إجابه: يتم تشغيل حجم المحرك المتغير الآن من مستوى منخفض يبلغ 1 إلى 2.4 لترًا ن = 49 ملاحظة مخزنة في كائن E12_2.

5. بالنسبة لـ E12_2 ، هل يبدو أن MPG.city و EngineSize يظهران مرتبطين بطريقة منهجية؟

ylab = "أميال المدينة لكل جالون" ،

main = 'العلاقة بين مدينة ميلا في الغالون وحجم المحرك (لترات)')

إجابه: نعم ، تم الكشف عن نمط النقاط في مخطط التشتت لبيانات E12_2
يقترح أن المتغيرين ، MPG.city و EngineSize ، قد يكون سلبًا و
ذات الصلة خطيًا. هذه ليست مفاجأة ، بالطبع ، لأنها تؤكد ما
نحن نؤمن بهذه العلاقة في المقام الأول.

6. قم بعمل وفحص قطعة أرض متبقية. هل يظهر نمط النقاط مرتبًا خطيًا أكثر مما كان عليه في التمرين السابق عندما اشتملت البيانات على مركبات ذات محركات كبيرة بالإضافة إلى المركبات ذات المحركات الأصغر؟

# تعليق 1. استخدم الدالة lm () لإنشاء كائن النموذج المسمى

# slr2 (الانحدار الخطي البسيط الثاني).

# تعليق 2. استخدم الدالة plot () لإنشاء مخطط متبقي.

# لاحظ أنه يجب تضمين القيم المتبقية (slr2) كوسيطة.

main = "مخلفات ضد المتغير المستقل")

إجابه: نعم ، بصرف النظر عن 3 أو 4 قيم متطرفة لقيم حجم المحرك أقل من 1.5 لتر ، فإن قطعة الأرض المتبقية لا تكشف عن انتهاكات خطيرة للافتراضات.

7. كجزء من عمل الرسم المتبقي في التمرين السابق ، استخدمنا الوظيفة lm () لإنشاء كائن النموذج slr2. هذه خطوة مهمة في التحليل المتبقي لأن كائن النموذج (slr2) يتضمن جميع المعلومات المهمة المرتبطة بمشكلة الانحدار المحددة المطروحة ، بما في ذلك معادلة الانحدار المقدرة نفسها. ما هي معادلة الانحدار المقدرة؟

SLR2
##
## مكالمة:
## lm (الصيغة = MPG.city

حجم المحرك ، البيانات = E12_2)
##
## المعاملات:
## (اعتراض) حجم المحرك
## 46.15 -10.87

إجابه: معادلة الانحدار المقدرة ŷ = ب0 + ب1x = 46.15 – 10.87x، أين ŷ هو المتغير التابع المتوقع ، MPG.city ، و x هو المتغير المستقل ، حجم المحرك.

8. أوجد تقديرات فاصل الثقة 95 و 99 في المائة لمعامل الانحدار ب1. صف ما تعنيه فترات الثقة هذه.

#تعليق. استخدم الدالة confint (، المستوى =) للعثور على ملف

## تقديرات فترة الثقة لمعامل الانحدار.

## 2.5 % 97.5 %
## (تقاطع) 40.09671 52.207573
## حجم المحرك -14.03045 -7.714777

## 0.5 % 99.5 %
## (اعتراض) 38.07151 54.232777
## حجم المحرك -15.08657 -6.658656

إجابه: هناك احتمال 95٪ أن معامل الانحدار يقع في الفترة من -14.03045 إلى -7.714777 ، وهناك احتمال بنسبة 99٪ أن يقع في الفترة من -15.08657 إلى -6.658656.

9. ماذا تخبرنا معادلة الانحدار المقدرة؟

إجابه: يمكننا تفسير معادلة الانحدار المقدرة ŷ = 46.15–10.87x بهذه الطريقة: بالنسبة لفئة المركبات التي يبلغ حجم محركها 2.4 لتر أو أقل ، يرتبط تغيير حجم المحرك بمقدار 1 لتر بتغيير 10.87 ميلًا للغالون الواحد عند قيادة السيارة في مدينة. علاوة على ذلك ، تخبرنا العلامة السالبة أن MPG.city و EngineSize يرتبطان عكسيًا: مع زيادة حجم المحرك (النقصان) ، تنخفض MPG.city (الزيادات). نعرف هذا لأن معامل الانحدار ب1 = –10.87. مصطلح الاعتراض ب0 = 46.15 تعني أقل بالنسبة لنا ، باستثناء عندما نقوم بالتنبؤات ، لأنها تعني أن السيارة التي تحتوي على 0 لتر من الإزاحة يجب أن تحصل على 46.15 ميلًا للغالون في القيادة في المدينة.

10. ما هي قوة الارتباط بين المتغيرين MPG.city و Engine Size؟ أوجد معامل التحديد ص 2 باستخدام التعبير التالي ل ص 2 (لا تستخدم وظيفة الملخص () لفك ضغط إحصائيات الانحدار التي سنستخدمها لاحقًا). يوفر هذا التمرين فرصة أخرى لصقل مهاراتك في البرمجة.

# تعليق 1. أوجد المجموع الكلي للمربعات ، ss_y.

ss_y & lt- sum ((E12_2 $ MPG.city - متوسط ​​(E12_2 $ MPG.city)) ^ 2)

# تعليق 2. أوجد المجموع المتبقي للمربعات ، ss_res.

# تعليق 3. أوجد معامل التحديد.

إجابه: معامل التحديد ، ص 2 = 0.505143.

11. ماذا معامل التحديد ص 2 ـ الكشف عن نموذج الانحدار؟

إجابه: ال ص 2 يشير إلى نسبة التباين في MPG.city المتغير التابع الذي تم شرحه (أو احتسابه) من خلال التباين في حجم المحرك المتغير المستقل. في هذه الحالة ، تكون هذه النسبة 0.505143 ، أو 51٪ تقريبًا. أكثر من ذلك ، لأن ص 2 = 0.505143 ، نعلم أيضًا أن ما يقرب من 49 ٪ من التباين في MPG.city لا يزال غير معروف ، حتى بعد النظر في الارتباط مع EngineSize.

12. ما هو برنامج ر قيمة المعامل ب1 على محرك متغير مستقل؟ لا تستخدم وظيفة الملخص () بل اكتب رمز R (ممارسة رائعة).

نظرًا لأن العثور على إجابة هذا السؤال يتطلب جزءًا أكثر تعقيدًا من التعليمات البرمجية ، فإننا نقسم الحل إلى عدة أجزاء.

(أ) التعبير عن ر يتم العثور على القيمة بأخذ نسبة المعامل نفسه إلى الخطأ القياسي.

(ب) إيجاد المقام (أي الخطأ المعياري سب 1) من التعبير أعلاه
يتطلب حساب نسبة أخرى

حيث بسط هذه النسبة سص / س يكون

s_xy & lt- sqrt (sum ((المتبقية (slr2) ^ 2)) / (nrow (E12_2) - 2))

وأين مقام هذه النسبة

ssx & lt- sqrt (sum ((E12_2 $ EngineSize - mean (E12_2 $ EngineSize)) ^ 2))

يمكن الآن إيجاد النسبة بقسمة القيمة الأولى (أعلاه) على الثانية.

(ج) يتطلب بسط الإحصاء t معامل الانحدار ب1

b1 & lt- sum ((E12_2 $ EngineSize - متوسط ​​(E12_2 $ EngineSize)) *

sum ((E12_2 $ EngineSize - يعني (E12_2 $ EngineSize)) ^ 2)

(د) وأخيرا ، فإن ر تم العثور على الإحصاء بقسمة معامل الانحدار ب1 بواسطة الخطأ المعياري سب1.

13. ما هي القيمة الاحتمالية ل ر = 6.926538?

ملاحظة: للراحة والدقة ، نستخدم ر من التمرين السابق كالوسيطة الأولى للدالة pt ()

# تعليق 1. نظرًا لأن إحصائية القيمة الاحتمالية لها قيمة صغيرة جدًا ، فإننا
#can تجاوز الافتراضي للإبلاغ عنه في التدوين العلمي.

# تعليق 2. استخدم الدالة pt () مع (n-2) = 47 درجة من الحرية.
# تذكر أنه نظرًا لأن هذا اختبار ذو ذيلتين ، فنحن بحاجة إلى الضرب

# بواسطة 2.

14. استخدم ملخص () وظيفة المستخرج للتحقق من عملنا. تذكر أن تستخدم ملف
نموذج الكائن slr2 كالوسيطة.

#Comment استخدم وظيفة abstract () لاستخراج الإحصائيات المطلوبة.

حجم المحرك ، البيانات = E12_2)
##
## المخلفات:
## الحد الأدنى 1Q متوسط ​​3Q كحد أقصى
## -15.0177 -1.5814 -0.1451 1.7676 12.1568
##
## المعاملات:
## تقدير الأمراض المنقولة جنسياً. خطأ t قيمة العلاقات العامة (& gt | t |)
## (اعتراض) 46.15 3.01 15.333 & lt 0.0000000000000002 ***
## حجم المحرك -10.87 1.57 -6.927 0.0000000106 ***
## ---
## Signif. الرموز: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 "1
##
## الخطأ المعياري المتبقي: 4.061 على 47 درجة من الحرية
## تربيع R متعدد: 0.5051 ، مربع R المعدل: 0.4946
## إحصائية F: 47.98 في 1 و 47 DF ، القيمة الاحتمالية: 0.00000001056

تؤكد جميع النتائج التي تم التوصل إليها باستخدام وظيفة الملخص () ما تم العثور عليه في التدريبات السابقة. أي أن معادلة الانحدار المقدرة هي ŷ = 46.15 10.87x معامل التحديد هو ص 2 = 0.505143 ر الإحصاء ر = 6.926538 والقيمة p = 0.00000001056443.

15. استخدم معادلة الانحدار لإيجاد القيم المتوقعة لـ MPG.city للقيم التالية لـ EngineSize (لترات الإزاحة): 1.25 ، 1.50 ، 1.75 ، 2.00 ، 2.25.

إجابه: القيم المتوقعة لـ MPG.city لـ EngineSize من 1.25 و 1.50 و 1.75 و 2.00 و 2.25 لتر (بالترتيب) هي 32.56138 و 29.84322 و 27.12507 و 24.40692 و 21.68876 ميل لكل جالون.

# تعليق 1. استخدم data.frame () لإنشاء كائن جديد يحتوي على 1.25 ،
# 1.50 و 1.75 و 2.00 و 2.25. قم بتسمية الكائن الجديد size_new.

size_new & lt- data.frame (حجم المحرك & lt- c (1.25 ، 1.50 ، 1.75 ، 2.00 ، 2.25))

# تعليق 2. استخدم وظيفة التنبؤ () لتوفير القيم المتوقعة
عدد الأميال للغالون الواحد للمركبات التي تحتوي على 1.25 و 1.50 و 1.75 و 2.00 و
# 2.25 لتر حجم المحرك.

## 1 2 3 4 5
## 32.56138 29.84322 27.12507 24.40692 21.68876

16. ما هي القيم المتوقعة من MPG.city التي تم استخدامها لمعايرة المقدرة
معادلة الانحدار ŷ = 46.15–10.87x؟ استيراد تلك القيم المتوقعة في كائن
تم التنبأ بالأميال المسماة وإدراج العناصر الثلاثة الأولى والأخيرة.

# تعليق 1. استخدم الوظيفة المجهزة (SLR2) لإنشاء المتوقع
# قيم المتغير التابع. استيراد تلك القيم إلى
#the الكائن المسمى mileage_predicted.

# تعليق 2. استخدم وظائف الرأس (، 3) والذيل (، 3) لإدراج ملفات
# القيم الثلاث الأولى والأخيرة للقيمة المتوقعة.

## 1 6 12
## 26.58144 22.23239 22.23239

## 90 92 93
## 24.40692 21.14513 20.05787

17. أضف كائن الأميال المتوقع (الذي تم إنشاؤه في التمرين السابق) إلى E12_2 ، وقم بتسمية الكائن الناتج E12_3. ضع قائمة بالعناصر الأربعة الأولى والأخيرة. أوجد ارتباط المتغيرات الفعلية والمتوقعة أي ارتباط MPG.city والأميال المتوقعة. بمجرد حساب الارتباط ، قم بتربيعه (أي ارفعه إلى القوة الثانية). هل يبدو معامل الارتباط التربيعي مألوفًا؟

# تعليق 1. استخدم الدالة cbind () لربط العمود
#mileage_predicted #to E12_2. اسم الكائن الجديد E12_3.

E12_3 & lt- cbind (E12_2 ، عدد الأميال المتوقعة)

# تعليق 2. ضع قائمة بالعناصر الأربعة الأولى والأخيرة من E12_3.

## MPG.city EngineSize الأميال_المتوقعة
## 1 25 1.8 26.58144
## 6 22 2.2 22.23239
## 12 25 2.2 22.23239
## 13 25 2.2 22.23239

## MPG.city EngineSize الأميال_المتوقعة
## 88 25 1.8 26.58144
## 90 21 2.0 24.40692
## 92 21 2.3 21.14513
## 93 20 2.4 20.05787

# تعليق 3. أوجد ارتباط الفعلي والمتوقع
# المتغيرات المستقلة. قم بتخزين القيمة في كائن يسمى r.

r & lt- cor (E12_3 $ MPG.city ، E12_3 $ عدد الكيلومترات_المتوقعة)

# تعليق 4. ربّع قيمة r.

مربع ارتباط فعلي المتغير التابع و تعتمد على توقعها متغير يساوي معامل التحديد ، ص 2 .

18. إنشاء مخطط تشتت مع MPG.city على المحور الرأسي ، حجم المحرك على المحور الأفقي. أضف تسميات إلى كلا المحورين بالإضافة إلى العنوان الرئيسي. أخيرًا ، باستخدام وظيفة abline () ، أضف خط انحدار إلى مخطط التشتت.

xlab = "حجم المحرك" (لترات) "،
ylab = "أميال المدينة لكل جالون" ،
main = "أفضل خط عبر مخطط الانتشار" ،
pch = 19 ،
col = "أزرق")

19. للحصول على تدريب إضافي على هيكلة بياناتنا قبل تحليلها ، نقوم الآن بتجميع E12_1 حسب الأصل. بالنسبة لهذا التمرين: (1) أنشئ كائنًا جديدًا من مجموعة البيانات الأصلية ، E12 _1 ، والذي يتضمن فقط المركبات من أصل غير أمريكي (وبالتالي باستثناء جميع المركبات من أصل أمريكي) وقم بتسميته E12_4 (2) ابحث عن متوسط ​​حجم المحرك لـ المركبات غير الأمريكية ، و (3) إنشاء كائن جديد ، يسمى E12_5 ، يتضمن فقط (أ) تلك المركبات التي تحتوي على MPG.city أقل من أو تساوي الوسيط وفقط (ب) المتغيرين ، MPG.city و EngineSize . بعبارة أخرى ، قم بتعيين مجموعة البيانات الأصلية ، E12_1 ، لتشمل فقط المتغيرين ، MPG.city و EngineSize ، والمركبات التي هي من أصل غير أمريكي فقط والتي تتميز بمحركات ذات إزاحة (باللترات) عند أو أقل من الوسيط للفئة ذات الصلة. فقط للتأكد من أن E12_5 "يبدو" كما ينبغي ، قم بتشغيل بعض الوظائف نفسها التي تم استخدامها في التمرين 1.

# تعليق 1. مجموعة البيانات بحيث تشمل فقط المركبات من خارج الولايات المتحدة

#الأصل. اسم كائن جديد E12_4.

E12_4 & lt- E12_1 [الذي (E12_1 $ Origin == 'non-USA') ،]

# تعليق 2. ابحث عن متوسط ​​حجم المحرك للعينة بما في ذلك فقط
# مركبات من خارج الولايات المتحدة الأمريكية
.

# تعليق 3. نظرًا لأن الوسيط يبلغ 2.2 لترًا ، فقم بتعيين البيانات مرة واحدة
# مرة أخرى لتشمل فقط المركبات ذات المحرك 2.2 لتر (أو أقل)
#الإزاحة. اسم الكائن الجديد E12_5.

E12_5 & lt- E12_4 [E12_4 $ EngineSize & lt = 2.20، c ('MPG.city'، 'EngineSize')]

# تعليق 4. استخدم الدالة abstract () للعثور على الوصفي الأساسي
# إحصائيات MPG.city و EngineSize

## دقيقة. 1st Qu. متوسط ​​متوسط ​​3rd Qu. الأعلى.
## 17.00 22.75 25.50 27.54 29.25 46.00

## دقيقة. 1st Qu. متوسط ​​متوسط ​​3rd Qu. الأعلى.
## 1.000 1.500 1.700 1.708 2.000 2.200

# تعليق 5. استخدم nrow () التابع لإيجاد عدد المشاهدات.

# تعليق 6. استخدم وظيفة الأسماء () لتأكيد أن E12_5 يتضمن
# متغيرين فقط ، MPG.city و EngineSize.

إجابه: تتضمن مجموعة البيانات الجديدة ، E12_5 ، 24 ملاحظة عبر المتغيرين ، MPG.city و EngineSize. تم الإبلاغ عن الإحصائيات الوصفية لكلا المتغيرين تحت التعليق 4. لاحظ أن الحد الأقصى لقيمة EngineSize هو 2.2 ، مما يؤكد أن البيانات تتضمن فقط ما نريد ، من حيث الملاحظات والمتغيرات والقيود. هذه الممارسة المتمثلة في "النظر تحت غطاء المحرك (أو غطاء المحرك)" هي ممارسة سليمة. إنه يسمح لنا بالتحقق من أن البيانات تبدو بالفعل كما ينبغي.

20. بالنسبة لفئة المركبات من أصل غير أمريكي ، قم بعمل المتغيرين MPG.city و
حجم المحرك ، يبدو أنه مرتبط بطريقة منهجية؟ إذا كان الأمر كذلك ، فكيف؟

pch = 19 ،
xlab = 'حجم المحرك (لترات)' ،
ylab = "أميال المدينة لكل جالون" ،
main = 'العلاقة بين مدينة ميلا في الغالون وحجم المحرك (لترات)')

إجابه: نعم ، يبدو أن نمط النقاط يسير (تقريبًا) من الزاوية العلوية اليسرى إلى الزوايا اليمنى السفلية من مخطط التشتت ، مما يعني ارتباطًا سلبيًا: ترتبط أحجام المحرك الأكبر بأميال أقل لكل جالون (في القيادة في المدينة). ولكن بسبب بعض الحالات الشاذة ، لا نتوقع أن يكون ص 2 أن تكون عالية جدًا ، وربما ليست كذلك ص 2 = 0.50.

21. قم بعمل وفحص قطعة أرض متبقية. هل يكشف نمط النقاط عن أي سبب يمنعنا من استخدام الانحدار لتحليل هذه البيانات؟ هل هناك أي انحرافات جذرية عن الافتراضات الكامنة وراء الاستخدام المناسب لهذه المنهجية؟

# تعليق 1. استخدم الدالة lm () لإنشاء كائن النموذج المسمى
# slr3 (يرمز slr3 إلى الانحدار الخطي البسيط الثالث).

# تعليق 2. استخدم الدالة plot () لإنشاء مخطط متبقي.
# لاحظ أنه يجب تضمين القيم المتبقية (slr3) كوسيطة.

ريست (slr3) ،
أبلين (ح = 0) ،
pch = 19 ،
xlab = 'حجم المحرك (لتر)' ،
ylab = "المخلفات" ،
main = "مخلفات ضد المتغير المستقل")

إجابه: قد تكون منطقة المشاكل المحتملة الوحيدة التي كشفت عنها المؤامرة المتبقية في نطاق المحركات الأصغر ، خاصة عند 1.5 لتر وأقل. بالنسبة للمركبات ذات المحركات الأكبر ، يبدو افتراض التباين المستمر مرضيًا. لذلك ، على الرغم من أن البيانات بعيدة عما يمكن أن نصفه بـ "حسن التصرف" ، فإن الانتهاكات لا تبدو خطيرة بما يكفي لجعلنا نتخلى عن الانحدار كمنهج تحليلي واعد.

22. ما هي معادلة الانحدار المقدرة؟

حجم المحرك ، البيانات = E12_5)
##
## المعاملات:
## (اعتراض) حجم المحرك
## 51.27 -13.89

23. أوجد تقديرات فاصل الثقة 75 و 90 في المائة لمعامل الانحدار ب1. كيف يجب أن نفسر معنى تقديرات فترة الثقة هذه؟

## 1 2.5 % 87.5 %
## (تقاطع) 44.60803 57.94082
## حجم المحرك -17.72209 -10.06260

## 5 % 95 %
## (تقاطع) 41.58615 60.962698
## حجم المحرك -19.45811 -8.326578

إجابه: هناك احتمال 75٪ أن معامل الانحدار يقع في الفترة من -17.72209 إلى -10.06260 ، وهناك احتمال 90٪ أن يقع في الفترة من -19.45811 إلى -8.326578.

24. ماذا تخبرنا معادلة الانحدار المقدرة؟

إجابه: معادلة الانحدار المقدرة ŷ = 51.27 – 13.89x يمكن تفسيره بهذه الطريقة: لفئة المركبات من أصل غير أمريكي | وبأحجام محرك تبلغ 2.2 لترًا أو أقل | يرتبط تغيير حجم المحرك بمقدار 1 لتر بتغيير 13.89 ميلًا للغالون الواحد عندما تكون السيارة القيادة في المدينة. العلامة السلبية ب1 = –13.89 ، يخبرنا أيضًا أنه كلما زاد حجم المحرك (ينقص) ، تنخفض MPG.city (تزداد). على الرغم من مصطلح التقاطع ، ب0 = 51.27 ، غير قابل للتفسير بشكل مفيد ، سنجد أنه من الضروري تضمينه في معادلة الانحدار عندما نريد توقع أو عمل تنبؤات.

25. ما هي قوة الارتباط بين المتغيرين MPG.city و Engine Size؟ أوجد معامل التحديد ص 2 باستخدام التعبير التالي لـ r 2 (لا تستخدم وظيفة abstract () لفك ضغط إحصائيات الانحدار التي سنستخدمها لاحقًا). يوفر هذا التمرين فرصة أخرى لصقل مهاراتك في البرمجة.

# تعليق 1. أوجد المجموع الكلي للمربعات ، ss_y.

ss_y & lt- sum ((E12_5 $ MPG.city - متوسط ​​(E12_5 $ MPG.city)) ^ 2)

# تعليق 2. أوجد المجموع المتبقي للمربعات ، ss_res.

# تعليق 3. أوجد معامل التحديد.

إجابه: معامل التحديد ، ص 2 = 0.455044.

26. ماذا يعني معامل التحديد ص 2 تخبرنا عن نموذج الانحدار؟

إجابه: ال ص 2 هي نسبة التباين في MPG.city المتغير التابع الذي يتم حسابه (أو شرحه) من خلال التباين في EngineSize ، المتغير المستقل. متي ص 2 = 0.455044 ، نفهم أن هذه النسبة تبلغ حوالي 45٪. نحن نعلم أيضًا أن ما يقرب من 55٪ من التباين في MPG.city لا يزال غير واضح ، حتى بعد أخذ EngineSize في الاعتبار.

27. ما هو ملف ر قيمة المعامل ب1 على محرك متغير مستقل؟ لا تستخدم وظيفة الملخص () بل اكتب الرمز (مزيد من التدريب).

إجابه: ر = –4.286
نظرًا لأن العثور على إجابة هذا السؤال يتطلب جزءًا أكثر تعقيدًا من التعليمات البرمجية ، فإننا نقسم الحل إلى عدة أجزاء.

(أ) يمكن إيجاد التعبير عن قيمة t بأخذ نسبة المعامل
نفسها للخطأ القياسي.

(ب) إيجاد المقام (أي الخطأ المعياري sب1) من التعبير أعلاه
يتطلب حساب نسبة أخرى

حيث بسط هذه النسبة سص | س يكون

s_xy & lt- sqrt (sum ((المتبقية (slr3) ^ 2)) / (nrow (E12_5) - 2))

وأين مقام هذه النسبة

ssx & lt- sqrt (sum ((E12_5 $ EngineSize - mean (E12_5 $ EngineSize)) ^ 2))

يمكن الآن إيجاد النسبة بقسمة القيمة الأولى (أعلاه) على الثانية.
هذه هي قيمة سب1

(ج) يتطلب بسط الإحصاء t معامل الانحدار ب1

b1 & lt- sum ((E12_5 $ EngineSize - متوسط ​​(E12_5 $ EngineSize)) *

مجموع ((E12_5 $ EngineSize - متوسط ​​(E12_5 $ EngineSize)) ^ 2)

(د) وأخيرا ، فإن ر تم العثور على الإحصاء بقسمة معامل الانحدار ب1 بواسطة
خطأ تقليدي سب 1 .

28. ما هي القيمة الاحتمالية ل ر = –4.286051?

إجابه: قيمة p = (2) (p (t ≤ t = –4.286051 مدافع = 22)) = 0.0003000032.
ملاحظة: للراحة والدقة ، نستخدم ملف ر من التمرين السابق باسم
الوسيطة الأولى للدالة pt ().

#تعليق. استخدم الدالة pt () مع (n-2) = 22 درجة من الحرية.
# تذكر أنه نظرًا لأن هذا ذيلان ، فنحن بحاجة إلى الضرب في 2.

29. استخدم الدالة المستخرج abstract () للتحقق من عملنا. تذكر أن تستخدم ملف
الكائن النموذجي slr3 كالوسيطة.

إجابه: ملخص (slr3)
##
## مكالمة:
## lm (الصيغة = MPG.city

حجم المحرك ، البيانات = E12_5)
##
## المخلفات:
## الحد الأدنى 1Q متوسط ​​3Q كحد أقصى
## -16.2144 -1.7278 -0.6574 1.8710 11.5641
##
## المعاملات:
## تقدير الأمراض المنقولة جنسياً. خطأ t قيمة العلاقات العامة (& gt | t |)
## (اعتراض) 51.274 5.642 9.088 0.00000000668 ***
## حجم المحرك -13.892 3.241 -4.286 0.0003 ***
## ---
## Signif. الرموز: 0 '***' 0.001 '**' 0.01 '*' 0.05 '. 0.1 "1
##
## الخطأ المعياري المتبقي: 5.305 على 22 درجة من الحرية
## تربيع R متعدد: 0.455 ، مربع R المعدل: 0.4303
## إحصائية F: 18.37 في 1 و 22 DF ، قيمة p: 0.0003

تم التوصل إلى جميع النتائج باستخدام ملخص () الوظيفة CON rm ما تم العثور عليه في التدريبات السابقة. معادلة الانحدار المقدرة ŷ = 51.274-13.892x معامل الاختلاف هو ص 2 = 0.455 فإن إحصاء t هو t = -4.286051 والقيمة p = 0.0003000032.

30. استخدم معادلة الانحدار المقدرة لإيجاد القيم المتوقعة لـ MPG.city للقيم التالية لـ EngineSize (لترات الإزاحة): 1.25 ، 1.50 ، 1.75 ، 2.00 ، 2.25.

إجابه: القيم المتوقعة لـ MPG.city لـ EngineSize هي 1.25 و 1.50 و 1.75 و 2.00 و 2.25 لتر (بالترتيب) 33.90899 و 30.43591 و 26.96282 و 23.48973 و 20.01665 ميل للغالون.

# تعليق 1. استخدم data.frame () لإنشاء كائن جديد يحتوي على 1.25 ،
# 1.50 و 1.75 و 2.00 و 2.25. قم بتسمية الكائن الجديد size_new.

size_new & lt- data.frame (حجم المحرك & lt- c (1.25 ، 1.50 ، 1.75 ، 2.00 ، 2.25))

# تعليق 2. استخدم وظيفة التنبؤ () لتوفير القيم المتوقعة
عدد الأميال للغالون الواحد للمركبات التي تحتوي على 1.25 و 1.50 و 1.75 و 2.00 و

# 2.25 لتر حجم المحرك.

توقع (slr3 ، size_new)
## 1 2 3 4 5
## 33.90899 30.43591 26.96282 23.48973 20.01665

31. ما هي القيم المتوقعة لـ MPG.city التي تم استخدامها لمعايرة معادلة الانحدار المقدرة ŷ= 51.274–13.892x؟ قم باستيراد تلك القيم المتوقعة في كائن يسمى الأميال المتوقعة وقم بإدراج العناصر الثلاثة الأولى والأخيرة.

# تعليق 1. استخدم الوظيفة المجهزة (SLR3) لإنشاء المتوقع
# قيم المتغير التابع. استيراد تلك القيم إلى
#the الكائن المسمى mileage_predicted.

# تعليق 2. استخدم وظائف الرأس (، 3) والذيل (، 3) لإدراج ملفات
# القيم الثلاث الأولى والأخيرة للقيمة المتوقعة.

## 1 9 40
## 26.26820 37.38208 29.04667

## 86 88 90
## 20.71126 26.26820 23.48973

32. أضف عدد الأميال المتوقع كائن (تم إنشاؤه في التمرين السابق) إلى E12_5 ، وقم بتسمية الكائن الناتج E12_6. ضع قائمة بالعناصر الأربعة الأولى والأخيرة. أوجد ارتباط المتغيرات الفعلية والمتوقعة أي ارتباط MPG.city والأميال المتوقعة. بمجرد أن تحصل على الارتباط ، قم بتربيعه (أي ارفعه إلى القوة الثانية). علق على مربع الارتباط. ما هذا؟

# تعليق 1. استخدم الدالة cbind () لربط العمود
#mileage_predicted #to E12_5. قم بتسمية الكائن الجديد E12_6.

E12_6 & lt- cbind (E12_5 ، عدد الأميال المتوقعة)

# تعليق 2. ضع قائمة بالعناصر الأربعة الأولى والأخيرة من E12_6.

## MPG.city EngineSize الأميال_المتوقعة
## 1 25 1.8 26.26820
## 39 46 1.0 37.38208
## 40 30 1.6 29.04667
## 42 42 1.5 30.43591

## MPG.city EngineSize الأميال_المتوقعة
## 85 25 2.2 20.71126
## 86 22 2.2 20.71126
## 88 25 1.8 26.26820
## 90 21 2.0 23.48973

# تعليق 3. أوجد ارتباط الفعلي والمتوقع
# المتغيرات المستقلة. قم بتخزين القيمة في كائن يسمى r.

r & lt- cor (E12_6 $ MPG.city، E12_6 $ عدد الأميال المتنبأ بها)

# تعليق 4. ربّع قيمة r.

## [1] 0.455044
مربع ارتباط فعلي المتغير التابع و وتوقع يعتمد متغير يساوي معامل التحديد ، ص 2 .

33. إنشاء مخطط تشتت مع MPG.city على المحور الرأسي ، حجم المحرك على المحور الأفقي. أضف تسميات إلى كلا المحورين بالإضافة إلى تعيين العنوان الرئيسي باللون الأزرق كلون النقاط. أخيرًا ، باستخدام وظيفة abline () ، أضف خط انحدار إلى مخطط التشتت.

xlab = 'حجم المحرك (لترات)' ،
ylab = 'أميال المدينة لكل جالون ،
main = "أفضل خط عبر مخطط الانتشار" ،
pch = 19 ،
col = "أزرق")

34. يوفر هذا التمرين فرصة إضافية لـ (1) العثور على مجموعة من البيانات من مصدر على الإنترنت (اختيار مصدر ، أي مصدر) ، (2) إنشاء إطار بيانات (انظر الفصل 1 التذييل ، إذا لزم الأمر) ، و (3) ) تحليله باستخدام بعض الطرق المرتبطة بالانحدار الخطي البسيط. ابحث وسجل درجات الحرارة المرتفعة والمنخفضة خلال اليوم (بالدرجات فهرنهايت) للمدن الـ 14 التالية من جميع أنحاء العالم: أوكلاند ، بكين ، القاهرة ، لاغوس ، لندن ، مكسيكو سيتي ، مومباي ، باريس ، ريو دي جانيرو ، سيدني ، طوكيو ، تورنتو وفانكوفر وزيورخ. يمكن العثور على هذه المعلومات (بالدرجات فهرنهايت) بسهولة بعد بحث موجز.

(أ) استخدم c () لإنشاء 3 كائنات ، واحد لكل اسم مدينة ، وواحد لدرجة الحرارة المرتفعة ، وواحد لدرجة الحرارة المنخفضة. تم تسجيل البيانات ليوم 19 ديسمبر 2016.

city ​​& lt- c ("أوكلاند" ، "بكين" ، "القاهرة" ، "لاغوس" ، "لندن" ، "مكسيكو سيتي" ، "مومباي" ، "باريس" ، "ريو دي جانيرو" "سيدني" ، "طوكيو" و "تورنتو" و "فانكوفر" و "زيورخ")

عالية & lt- ج (71 ، 45 ، 65 ، 91 ، 46 ، 67 ، 88 ، 44 ، 92 ، 88 ، 57 ، 20 ، 42 ، 40)

منخفض & lt- ج (56 ، 23 ، 48 ، 76 ، 37 ، 45 ، 71 ، 35 ، 73 ، 65 ، 39 ، 15 ، 39 ، 29)

(ب) استخدم data.frame () لإنشاء إطار بيانات يتكون من اسم كل مدينة ودرجات حرارة مرتفعة ومنخفضة. اعرض النتيجة للتحقق من عملك.

WorldTemps & lt- data.frame (المدينة = المدينة ، مرتفع = مرتفع ، منخفض = منخفض)
WorldTemps
## مدينة عالية منخفضة
## 1 أوكلاند 71 56
## 2 بكين 45 23
## 3 القاهرة 65 48
## 4 لاغوس 91 76
## 5 لندن 4637
## 6 مكسيكو سيتي 67 45
## 7 مومباي 88 71
## 8 باريس 44 35
## 9 ريو دي جانيرو 92 73
## 10 سيدني 8865
## 11 طوكيو 5739
## 12 تورنتو 20 15
## 13 فانكوفر 4239
## 14 زيورخ 40 29

(ج) اصنع مخطط تشتت مرتفع مقابل درجات حرارة منخفضة. قم بإنشاء عنوان رئيسي ، وقم بتسمية كل محور بشكل مناسب ، واستخدم pch = لتحديد كيفية ظهور النقاط. هل يبدو أن نمط النقاط يشير إلى أن العلاقة بين درجات الحرارة العالية والمنخفضة خطية؟

pch = 19 ،
xlab = "منخفض" ،
ylab = "مرتفع" ،
main = "درجات حرارة عالية ومنخفضة خلال اليوم")

Amswer: يوضح المخطط المبعثر أن العلاقة بين درجات الحرارة المرتفعة والمنخفضة خلال اليوم هي علاقة إيجابية وخطية.

(د) تقدير وكتابة معادلة الانحدار: ŷ = ب0 + ب1x. اجعل درجة الحرارة المرتفعة هي المتغير التابع لدرجة الحرارة المنخفضة ، المتغير المستقل.

منخفضة ، البيانات = WorldTemps)
reg_eq_temps
##
## مكالمة:
## lm (الصيغة = عالية

منخفضة ، البيانات = WorldTemps)
##
## المعاملات:
## (اعتراض) منخفض
## 7.763 1.148

معادلة الانحدار المقدرة هي: ŷ = 7.763 + 1.148x

ملخص (reg_eq_temps)
##
## مكالمة:
## lm (الصيغة = عالية

منخفضة ، البيانات = WorldTemps)
##
## المخلفات:
## الحد الأدنى 1Q متوسط ​​3Q كحد أقصى
## -10.533 -3.991 -1.051 3.884 10.834
##
## المعاملات:
## تقدير الأمراض المنقولة جنسياً. خطأ t قيمة العلاقات العامة (& gt | t |)
## (اعتراض) 7.76313 4.27689 1.815 0.0946.
## منخفض 1.14795 0.08546 13.433 0.0000000136 ***
## ---
## Signif. الرموز: 0 '***' 0.001 '**' 0.01 '*' 0.05 '. 0.1 "1
##
## الخطأ المعياري المتبقي: 5.918 على 12 درجة من الحرية
## تربيع R متعدد: 0.9376 ، مربع R المعدل: 0.9325
## إحصائية F: 180.5 في 1 و 12 DF ، القيمة الاحتمالية: 0.00000001363

ال ص 2 تساوي 0.9376 ، مما يشير إلى أن حوالي 93.76٪ من التباين في المتغير التابع يتم تفسيره من خلال التباين في المتغير المستقل.

(و) ما هي القيمة الاحتمالية؟ هل معادلة تقدير الانحدار مهمة؟ لما و لما لا

نظرًا لأن قيمة p = 0.0000000136 أقل بكثير من القيم المعتادة التي حددناها لـ α - على سبيل المثال ، 0.05 ، 0.01 ، وما إلى ذلك - فإننا نقول إن معادلة الانحدار المقدرة مهمة.

35. متغير تابع ذ يتراجع على متغير مستقل x حجم العينة ن = 32.

إجابه: 0.7183.

(ب) إذا ب 1 = –0.041215 و الصورة ب 1 = 0.004712 ، ما هي قيمة إحصاء الاختبار ر?

إجابه: = 2(ص (ر & lt –8.75 df = n – k – 1)) = 2 (ص (ر & lt –8.75 مدافع = 30)) = 0.00000000093

2 * نقطة (-8.75 ، 30)
## [1] 0.0000000009313949

(د) هل معادلة الانحدار المقدرة مهمة عند α = 0.01 مستوى؟

إجابه: نعم ، نظرًا لأن قيمة p = 0.00000000093 & ltα = 0.01 ، فإننا نستنتج أن القيمة المقدرة
معادلة الانحدار مهمة.

(هـ) إذا ب0 = 29.599855 ، اكتب معادلة الانحدار ، ŷ = ب0 + ب1x.

إجابه: ŷ = 29.599855 – 0.041215x

36. يستخدم هذا التمرين مجموعة بيانات mtcars المثبتة في R. (تذكر أنه لمشاهدة جميع مجموعات البيانات المثبتة ، قم ببساطة بإدخال البيانات () في موجه R في وحدة التحكم لعرض مجموعة بيانات mtcars نفسها ، أدخل mtcars في موجه R لمعرفة المزيد حول مجموعة البيانات ، بما في ذلك المتغيرات والملاحظات ، أدخل؟ mtcars في الموجه وانتظر حتى تفتح صفحة المساعدة R.) في هذه الحالة ، نحن مهتمون بالعلاقة بين وقت ربع ميل للسيارة و إجمالي حصانا.

(أ) قم بإنشاء مخطط مبعثر للمتغيرين. ماذا يشير نمط النقاط حول العلاقة (إن وجدت) بين المتغيرات؟

إجابه: يوضح مخطط التشتت أن العلاقة بين قوة الحصان الإجمالية وربع ميل في الوقت (بالثواني) سالبة وخطية (تقريبًا).

pch = 19 ،
xlab = "إجمالي قوة الحصان" ،
ylab = "ربع ميل الوقت (بالثواني)")

(ب) ترك ربع ميل هو المتغير التابع ، تقدير معادلة الانحدار. اكتب معادلة الانحدار ، ŷ = ب0 + ب1x.

حصان ، بيانات = mtcars)
##
## المعاملات:
## (اعتراض) حصان
## 20.55635 -0.01846

معادلة الانحدار المقدرة هي: ŷ = 20.55635 – 0.01846x.

ملخص (reg_eq_mtcars)
##
33
## مكالمة:
## lm (الصيغة = qsec

حصان ، بيانات = mtcars)
##
## المخلفات:
## الحد الأدنى 1Q متوسط ​​3Q كحد أقصى
## -2.1766 -0.6975 0.0348 0.6520 4.0972
##
## المعاملات:
## تقدير الأمراض المنقولة جنسياً. خطأ t قيمة العلاقات العامة (& gt | t |)
## (اعتراض) 20.556354 0.542424 37.897 & lt 0.0000000000000002 ***
## حصان -0.018458 0.003359 -5.495 0.00000577 ***
## ---
## Signif. الرموز: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 "1
##
## الخطأ المعياري المتبقي: 1.282 على 30 درجة من الحرية
## تربيع R متعدد: 0.5016 ، مربع R المعدل: 0.485
## إحصاء F: 30.19 في 1 و 30 DF ، القيمة الاحتمالية: 0.000005766
ال ص 2 هي 0.5016 ، مما يشير إلى أن ما يقرب من 50.16٪ من التباين في المتغير التابع يتم تفسيره من خلال التباين في المتغير المستقل.

إجابه: القيمة الاحتمالية = 0.000005766

(هـ) هل معادلة الانحدار المقدرة مهمة عند α = 0.05 مستوى؟

إجابه: بما أن قيمة p = 0.000005766 أقل بكثير من القيم المعتادة لـ αنقول أن معادلة الانحدار المقدرة مهمة.

37. يرجى استخدام مجموعة بيانات mtcars للإجابة على الأسئلة التالية.

(أ) أوجد وقت ربع ميل المتوقع لقيم القدرة الحصانية الإجمالية من مجموعة البيانات المستخدمة في التحليل الأصلي. اذكر القيم المتوقعة لآخر أربع ملاحظات.

## فورد بانتيرا إل فيراري دينو مازيراتي بورا فولفو 142 إي

## 15.68336 17.32615 14.37282 18.54440

(ب) أوجد القيم المتوقعة لربع ميل من الزمن للقيم التالية لإجمالي القدرة الحصانية: 100 ، 125 ، 160 ، 225 ، و 250.

new_values ​​& lt- data.frame (hp & lt- c (100، 125، 160، 225، 250))

## 1 2 3 4 5
## 18.71052 18.24906 17.60302 16.40323 15.94178

(ج) هل يمكننا استخدام معادلة الانحدار المقدرة لعمل تنبؤات بربع ميل من الوقت عندما يكون إجمالي القدرة الحصانية 40 أو 350؟ لما و لما لا؟

إجابه: عندما نعلم أن الحد الأدنى والحد الأقصى لقيم حصان المتغير هما 52 و 335 على التوالي ، يجب ألا نستخدم معادلة الانحدار المقدرة لعمل تنبؤات بناءً على القيم التي تقع أعلى أو أقل من هذا النطاق. سيفعل بعض المحللين ذلك على أي حال ، ولكن يجب على المرء أن يمضي بحذر شديد عند تقديم أي ادعاءات تنبؤية بناءً على معادلة الانحدار المقدرة.

38. يستكشف هذا التمرين العلاقة (إن وجدت) بين متغيرين من المتغيرات الخمسة المدرجة في بيانات الاقتراع (الموجودة على موقع الويب المصاحب): x1 = العمر يقاس بالسنوات و x3 = نفس الجنس ، والذي يتم قياسه على مقياس ليكرت من 1 إلى 7 كرد فعل على العبارة ، "الموافقة على حق الأزواج من نفس الجنس في الزواج". يسجل المستفتى رفضًا قويًا بموافقة قوية بواقع 1 ، واستقلالية نسبية مع استجابة في منتصف النطاق من 1 إلى 7.

(أ) اصنع مخطط مبعثر لـ x3 ضد x1. هل ترى أي انتهاكات محتملة للافتراضات الكامنة وراء التطبيق الصحيح للانحدار الخطي البسيط على هذه البيانات؟ ماذا تخبرك طبيعة النمط؟ هل تعتقد أنه يمكن استخدام الانحدار لاستكشاف العلاقة بين المتغيرين؟

إجابه: يكشف مخطط التشتت عن العلاقة السلبية والخطية (نسبيًا) بين عمر الشخص ومدى موافقته على حق الأزواج من نفس الجنس في الزواج. بشكل عام ، يبدو أن مقاومة فكرة أن الأزواج من نفس الجنس يجب أن يكون لهم الحق في الزواج تزداد مع تقدم العمر. ومع ذلك ، كما هو الحال مع معظم المؤامرات ، فإن العلاقة ليست مثالية. ومع ذلك ، قد يبدو تحليل الانحدار وسيلة واعدة لاستكشاف العلاقة بين هذين المتغيرين.

xlab = "العمر" ،
ylab = "مشاهدات زواج المثليين" ،
pch = 19)

(ب) اكتب معادلة الانحدار. في هذه الحالة ، هل من المنطقي التحديد x1 أو x3 كمتغير تابع؟ هذا هو ، هل يجب عليك تحديد النموذج على أنه x3 = ب0 + ب1x1؟ أو مثل x1 = ب0 + ب3x3؟ لماذا ا؟

إجابه: سوف نحدد على الأرجح x3، الزواج من نفس الجنس ، كمتغير تابع و x1، العمر ، كمتغير مستقل. على الرغم من أننا لا نستخدم تحليل الانحدار لإثبات العلاقة السببية ، فمن المنطقي أن نقول إن الموافقة على حق الأزواج من نفس الجنس في الزواج يتراجع مع تقدم العمر أكثر من العكس.

معادلة الانحدار المقدرة ŷ = 11.757 - 0.168x.

x1 ، البيانات = الاستقصاء)
reg_eq_polling
##
## مكالمة:
## lm (الصيغة = x3

x1 ، البيانات = الاستقصاء)
##
## المعاملات:
## (اعتراض) x1
## 11.757 -0.168

ملخص (reg_eq_polling)
##
## مكالمة:
## lm (الصيغة = x3

x1 ، البيانات = الاستقصاء)
##
## المخلفات:
## الحد الأدنى 1Q متوسط ​​3Q كحد أقصى
## -1.8535 -1.0235 -0.2935 0.6705 2.8025
##
## المعاملات:
## تقدير الأمراض المنقولة جنسياً. خطأ t قيمة العلاقات العامة (& gt | t |)
## (اعتراض) 11.7573 1.2276 9.577 0.000000159 ***
## x1 -0.1680 0.0265 -6.340 0.000018289 ***
## ---
## Signif. الرموز: 0 '***' 0.001 '*' * 0.01 '*' 0.05 '.' 0.1 "1
##
## الخطأ المعياري المتبقي: 1.296 على 14 درجة من الحرية
## تربيع R متعدد: 0.7417 ، مربع R المعدل: 0.7232
## إحصاء F: 40.19 في 1 و 14 DF ، قيمة p: 0.00001829

إجابه: ص 2 = 0.7417

إجابه: القيمة الاحتمالية = 0.00001829

(هـ) هل معادلة الانحدار مهمة عند α = 0.05 مستوى؟

إجابه: بما أن قيمة p = 0.00001829 أقل من القيم المعتادة لـ α، نقول أن
معادلة الانحدار المقدرة مهمة.

(و) أوجد تقدير فاصل الثقة 95٪ لمعامل الانحدار؟

Confint (reg_eq_polling ، المستوى = 0.95)

## 2.5 % 97.5 %
## (اعتراض) 9.1242484 14.3903218
## x1 -0.2248278 -0.1111626

(ز) يذكر بالكلمات معنى تقدير فاصل الثقة.

إجابه: هناك احتمال 95٪ أن معامل الانحدار يقع في الفترة
من -0.2248278 إلى -0.1111626.

(ح) ما هي استنتاجاتك حول تحليل الانحدار.

إجابه: معادلة الانحدار المقدرة ŷ = 11.757-0.168x يسمح لنا باستنتاج أن التغيير لمدة سنة واحدة يرتبط بتغيير -0.168 في الموافقة. (نعلم هذا لأن معامل الانحدار هو ب1 = -0.168.) في هذه الحالة ، معنى مصطلح التقاطع ، ب0 = 11.757 ، أقل وضوحًا لأنها تمثل القيمة المتوقعة للموافقة لشخص عمره صفر. ومع ذلك ، من المهم الاحتفاظ بمصطلح التقاطع في المعادلة لأنه يجب تضمينه عندما نريد عمل تنبؤات.

المستعرض غير مدعوم

أنت تستخدم إصدار متصفح لم يعد مدعومًا بواسطة هذا الموقع وقد ينتج عنه تجربة أقل من الأمثل.


معامل التحديد ومعامل الارتباط

انظر إلى Scattergram لبياناتك أولاً

يمكنك استخدام المعادلات الموضحة أعلاه للعثور على خط الانحدار لأي مجموعة من الأرقام. على سبيل المثال ، بالنظر إلى أزواج الأرقام ، (16،42) ، (1،54) ، (14،60) ، (4،70) ، (0،48) ، (6،41) ، (2،59) ، (10،64) ، (0،45) ، (8،69) ، باستخدام الصيغ الموضحة أعلاه ، تكون معادلة خط الانحدار y = 0.115653 x + 54.4945. ومع ذلك ، انظر إلى الشكل المبعثر لهذه الأرقام.

يبدو أنه لا توجد علاقة خطية بين متغيري x و y. لذلك ، قبل محاولة حساب خط الانحدار ، والذي يجب استخدامه فقط عند وجود علاقة خطية بين المتغيرات ، قم بعمل مخطط مبعثر. إذا أوضح مخطط الانتشار أنه لا توجد علاقة خطية بين المتغيرات ، فلا تستخدم الانحدار الخطي.

ما هو معامل التحديد

انظر إلى الأشكال المبعثرة التالية.

في كلتا الحالتين ، يبدو أن هناك علاقة خطية بين متغيري x و y. ومع ذلك ، إذا تخيلت خطوط الانحدار أعلى مخططات التشتت ، يمكنك أن ترى أنه في الرسم البياني الأيسر ستكون النقاط أقرب إلى خط الانحدار منها في الرسم البياني الأيمن. معامل التحديد هو الرقم الذي يقيس درجة اقتراب النقاط من خط الانحدار. يطلق الإحصائيون على درجة التقارب هذه "جودة الملائمة".

يتم قياس التباين في قيم y بواسطة الانحراف المعياري لقيم y. يقاس الانحراف المعياري بـ

لتحديد معامل التحديد ، يتم استخدام الجزء العلوي الداخلي فقط من هذه الصيغة ، ويتم استبدال x بـ y. يطلق عليه المجموع الكلي للمربعات أو SST ، ويعطى بواسطة (y مع وجود شريط فوقه هو متوسط ​​أو متوسط ​​قيم y):

يمكن إظهار أنه يمكن التعبير عن SST كمجموع من المصطلحين المسمى SSR و SSE. يتم إعطاء SSR ، أو مجموع المربعات بسبب الانحدار بواسطة الصيغة (y مع "قبعة" فوقها تشير إلى قيمة y التي تم العثور عليها باستخدام معادلة الانحدار على قيمة x للعثور على قيمة y المقابلة):

يقيس SSR مقدار التباين الإجمالي في قيم y الموضح بواسطة خط الانحدار. يُطلق على مقدار التباين الإجمالي الذي لم يفسره خط الانحدار مجموع مربعات الخطأ ويُشار إليه بواسطة SSE. الصيغة لذلك هي:

ترتبط هذه الكميات الثلاث بالصيغة (التي يمكن عرضها جبريًا):

ينتج عن قسمة طرفي هذه الصيغة على SST المعادلة

في هذه المعادلة ، يُطلق على SSR / SST اسم معامل التحديد - فهو يقيس نسبة التباين في قيم y التي يشرحها خط الانحدار. الضرب في 100 يعطي النسبة المئوية للتغير في قيم y التي يفسرها الانحدار. يُشار إلى معامل التحديد بالرمز r 2. بالنسبة للبيانات الموضحة في الرسم البياني الثلاثة الأخير أعلاه ، فإن معامل التحديد هو 3046.68 / 3187.67 = 0.96. لذا فإن حوالي 96٪ من التباين في قيم y يفسرها الانحدار. 4٪ الباقية غير مفسرة أو خطأ في الاختلاف.

صيغ حساب SST و SSR هي:

كيف يتم حساب معامل الارتباط

الارتباط يقيس درجة العلاقة الخطية بين متغيرين وهو الجذر التربيعي لمعامل التحديد. يُشار إليه بالرمز r وهو الجذر التربيعي لمعامل التحديد ، r 2. نظرًا لأن r 2 يمكن أن تقع فقط بين 0 و 1 ، يجب أن تقع r بين -1 و 1. أيضًا ، نظرًا لأن قيم r 2 بالقرب من 1 تشير إلى أن خط الانحدار يقع بالقرب من نقاط البيانات ، أي أن خط الانحدار يشرح معظم التباين في قيم y ، تشير قيم r بالقرب من -1 أو +1 أيضًا إلى انحدار يتم فيه شرح معظم التباين في y بواسطة خط الانحدار. تشير قيم r بالقرب من +1 إلى خط انحدار ذي ميل موجب ، مما يعني أن هناك علاقة خطية مباشرة بين متغيري x و y ، بينما تشير قيم r بالقرب من -1 إلى خط انحدار ذي ميل سلبي يشير إلى وجود غير مباشر أو معكوس العلاقة الخطية بين المتغيرات.

صيغة أخرى لحساب معامل الارتباط هي:

حيث تم تحديد الرموز في الصيغة أعلاه.

العلاقة بين معامل الارتباط و Scattergram وخط الانحدار

يأخذك هذا الارتباط إلى عرض توضيحي تفاعلي يوضح العلاقة بين معامل الارتباط وخط الانحدار. عندما تفتح الصفحة ، انقر فوق Interactive Scatterplot. بعد فتح محاكاة مخطط التشتت ، يمكنك وضع نقاط على الشاشة بالنقر فوق زر الماوس. بعد وضع النقطة الثانية ، سيتم رسم خط الانحدار. بالإضافة إلى ذلك ، سيتم عرض معامل الارتباط والإحصائيات الأخرى.

يوجد هنا ارتباط إلى عرض توضيحي آخر للعلاقة بين مخطط مبعثر أو مخطط مبعثر ومعامل الارتباط. بمجرد فتح الصفحة ، انقر فوق الرمز + بجوار التطبيق الإحصائي - سيتغير العرض ، ثم انقر فوق + بجوار الارتباط ، ثم انقر فوق + بجوار التطبيقات الصغيرة ، وأخيراً انقر فوق فيلم الارتباط. عند تشغيل الفيلم ، سترى العلاقة بين النقاط في المستوى ومعامل الارتباط.

حساب خطوط الانحدار ومعاملات التحديد

قم بإجراء حسابات الانحدار التالية على FOCUS: قاعدة البيانات باستخدام Webstat2. يمكنك فتح Webstat2 بالضغط على الزر البرتقالي أعلاه.

1. قم بعمل مخطط مبعثر للنقاط حيث يكون SAT Math هو المتغير y و SAT Verbal هو المتغير x. ثم ابحث عن خط الانحدار ورسمه على مخطط تبعثر النقاط ، وابحث عن معامل التحديد ومعامل الارتباط. اربط هذه المعاملات بخط الانحدار المرسوم على الرسم البياني.

2. افعل نفس الشيء كما في الرقم 1 ولكن اجعل HS GPA متغير x و GPA التراكمي متغير y.

3. أخيرًا ، أجب عن نفس الأسئلة كما في 1 ولكن استخدم الساعات كمتغير x و hsgpa كمتغير y.


معاينة المحتوى

يستخدم الانحدار متغيرًا توضيحيًا واحدًا أو أكثر ( (x )) للتنبؤ بمتغير استجابة واحد ( (y )). في هذه الدورة ، سوف نتعلم بالتحديد عن الانحدار الخطي البسيط. الجزء "البسيط" هو أننا سنستخدم متغيرًا توضيحيًا واحدًا فقط. إذا كان هناك متغيرين توضيحيين أو أكثر ، فإن الانحدار الخطي المتعدد ضروري. الجزء "الخطي" هو أننا سنستخدم خطًا مستقيمًا للتنبؤ بمتغير الاستجابة باستخدام المتغير التوضيحي. على عكس الارتباط ، في الانحدار يهم أي متغير يسمى (x ) وأي متغير يسمى (y ). في حالة الانحدار ، يكون المتغير التوضيحي دائمًا (x ) ومتغير الاستجابة دائمًا (y ). يجب أن يكون كل من (x ) و (y ) متغيرات كمية.

قد تتذكر من فئة الجبر أن صيغة الخط المستقيم هي (y = mx + b ) ، حيث (m ) هو الميل و (b ) هو تقاطع y. ال ميل هو مقياس لمدى انحدار الخط في الجبر ، ويوصف هذا أحيانًا على أنه "التغيير في y على التغيير في x" ، ( ( frac < Delta y> < Delta x> )) ، أو "الارتفاع فوق يركض." يشير الميل الموجب إلى خط يتحرك من أسفل اليسار إلى أعلى اليمين. يشير المنحدر السالب إلى خط يتحرك من أعلى اليسار إلى أسفل اليمين. ال تقاطع ص هو الموقع على المحور الصادي حيث يمر الخط. بمعنى آخر ، عندما (س = 0 ) ثم (ص = ص - تقاطع ).

في الإحصائيات ، نستخدم صيغًا متشابهة:

( واسعة) = القيمة المتوقعة لـ (ص ) لقيمة معينة من (س )
(أ ) = (ص ) - التقاطع
(ب ) = المنحدر

في المجتمع ، يُشار إلى تقاطع y على أنه ( beta_0 ) ("beta sub 0") أو ( alpha ) ("alpha"). يشار إلى المنحدر كـ ( beta_1 ) ("beta sub 1") أو فقط ( beta ) ("beta").

يستخدم الانحدار الخطي البسيط البيانات المأخوذة من عينة لبناء الخط الأنسب. ولكن ما الذي يجعل السطر "أفضل ملاءمة"؟ الطريقة الأكثر شيوعًا لإنشاء خط انحدار خطي بسيط ، والطريقة الوحيدة التي سنستخدمها في هذه الدورة ، هي طريقة المربعات الصغرى. طريقة المربعات الصغرى تعثر على قيم تقاطع y والميل التي تجعل مجموع المربعات المتبقية (تعرف أيضًا بمجموع الأخطاء التربيعية أو SSE) صغيرًا قدر الإمكان.

(ص ) = القيمة الفعلية لـ (ص )
( واسعة) = القيمة المتوقعة لـ (ص )


تتضمن حلول Balbharati للرياضيات والإحصاء 2 (التجارة) معيار 12th HSC State Maharashtra State Board الفصل 3 (الانحدار الخطي) جميع الأسئلة مع الحل والشرح التفصيلي. سيؤدي ذلك إلى إزالة شكوك الطلاب حول أي سؤال وتحسين مهارات التطبيق أثناء التحضير لامتحانات المجلس. ستساعدك الحلول التفصيلية خطوة بخطوة على فهم المفاهيم بشكل أفضل وتوضيح ارتباكاتك ، إن وجدت. موقع Shaalaa.com لديه حلول مجلس ولاية ماهاراشترا للرياضيات والإحصاء 2 (التجارة) المعيار الثاني عشر HSC ولاية ماهاراشترا بطريقة تساعد الطلاب على فهم المفاهيم الأساسية بشكل أفضل وأسرع.

علاوة على ذلك ، نقدم في موقع Shaalaa.com مثل هذه الحلول حتى يتمكن الطلاب من الاستعداد للامتحانات الكتابية. يمكن أن تكون حلول الكتب المدرسية من Balbharati مساعدة أساسية للدراسة الذاتية وتعمل كدليل مثالي للمساعدة الذاتية للطلاب.

المفاهيم التي تم تناولها في الرياضيات والإحصاء 2 (التجارة) المعيار الثاني عشر لمجلس ولاية ماهاراشترا HSC الفصل 3 الانحدار الخطي هو الانحدار ، وأنواع الانحدار الخطي ، وملاءمة الانحدار الخطي البسيط ، وطريقة المربعات الصغرى ، وخطوط الانحدار X على Y و Y على X أو معادلة خط الانحدار ، خصائص معاملات الانحدار.

يعد استخدام حلول اختبار المجلس الثاني عشر من Balbharati تمرين الانحدار الخطي من قبل الطلاب طريقة سهلة للتحضير للامتحانات ، حيث إنها تتضمن حلولًا مرتبة حسب الفصل أيضًا. الأسئلة التي يتضمنها Balbharati Solutions هي أسئلة مهمة يمكن طرحها في الاختبار النهائي. يفضل طلاب الحد الأقصى لامتحان المجلس الثاني عشر لمجلس ولاية ماهاراشترا حلول Balbharati Textbook Solutions للحصول على درجات أكثر في الامتحان.


نتائج

أكمل ما مجموعه 80 من الذكور الأصحاء في سن الكلية (ن = 43) والإناث (ن = 37) الدراسة. تراوحت أعمار غالبية المشاركين بين 18 و 20 عامًا (76٪) وبيضاء (84٪). كانت مجموعة الاشتقاق الفرعية (ن = 50) متوازنة بين الجنسين ولديها تمثيل نسبي للأفراد من خمسة مستويات للياقة البدنية (عشرة مشاركين لكل مجموعة خمسة ذكور وخمس إناث) كما حددتها الكلية الأمريكية للطب الرياضي (طومسون ، جوردون ، & # x00026 بيسكاتيلو ، 2009). تتكون المجموعة الفرعية للتحقق من الصحة (ن = 30) من الذكور والإناث المتبقين الذين تتراوح مستويات اللياقة البدنية من ضعيف جدًا إلى ممتاز / متفوق. كانت تلك الموجودة في المجموعة الفرعية للاشتقاق أصغر من المجموعة الفرعية للتحقق من الصحة (ع = 0.027). يتم تلخيص خصائص المشاركين في الجدول 1.

الجدول 1

خصائص المشاركين حسب المجموعة الفرعية

الكل (ن = 80)الاشتقاق (ن = 50)التحقق من الصحة (ن = 30)
صفاتم& # x000b1SDام دي انم& # x000b1SDام دي انم& # x000b1SDام دي ان
& # x02003Male ، ن (٪)44 (54%) 25 (50%) 19 (61%)
& # x02003Age * 19.6 & # x000b1 1.6 19.2 & # x000b1 1.6 20.7 & # x000b1 1.5
& # x02003 الدهون في الجسم (٪)19.5 & # x000b1 8.7 18.9 & # x000b1 8.8 20.5 & # x000b1 8.6
& # x02003 الوزن (كجم)69.9 & # x000b112.8 67.6 & # x000b1 10.8 73.6 & # x000b1 15.0
& # x02003 ارتفاع (م)1.7 & # x000b1 0.1 1.7 & # x000b1 0.1 1.7 & # x000b1 0.1
& # x02003BMI (kg & # x000b7m -2)23.8 & # x000b1 3.3 23.2 & # x000b1 2.4 24.8 & # x000b1 4.2
النشاط البدني أ
& # x02003 المشي1433 & # x000b1 24529241293 & # x000b1 12748501648 & # x000b1 3620939
& # x02003 نشاط معتدل633 & # x000b1929340702 & # x000b1 988360516 & # x000b1 810360
& # x02003 نشاط قوي1058 & # x000b1 13417201055 & # x000b1 11677201059 & # x000b1 1585600
اللياقة القلبية التنفسية ب
& # x02003VO2الحد الأقصى (ml & # x000b7kg -1 & # x000b7min -1)41.6 & # x000b1 7.1 41.6 & # x000b1 7.1 41.7 & # x000b1 7.2
& # x02003 مستوى اللياقة البدنية ، ن (٪)
فقير جدا15 (18.8%) 10 (20.0%) 5 (16.1%)
مسكين16 (20.0%) 10 (20.0%) 6 (19.4%)
معرض18 (22.5%) 10 (20.0%) 8 (25.8%)
جيد18 (22.5%) 10 (20.0%) 8 (25.8%)
ممتاز13 (16.2%) 10 (20.0%) 4 (12.9%)

يستخدم اختبار فرق Chi-square في البيانات الفئوية واختبارات t المستقلة للبيانات المستمرة.

اختلافات كبيرة في

ارتباطات بيرسون بين VO2أشارت خصائص max ، و PA ، والمشارك إلى أن الجنس والطول والنشاط القوي كانت ارتباطات أحادية المتغير مهمة لـ VO المقاسة2كحد أقصى (الجدول 2).

الجدول 2

العلاقات بين VO2الحد الأقصى والمتغيرات المستقلة (ن = 50)

مجموعة الاشتقاق الفرعيةصوت2الأعلىالجنس أ عمروزنارتفاعمؤشر كتلة الجسمالمشينشاط معتدل
صوت2الحد الأقصى (ml & # x000b7kg -1 & # x000b7min -1)& # x02014
جنس تذكير أو تأنيث-0.556 *** & # x02014
العمر (سنة)0.2160.159& # x02014
الوزن (كجم)0.171-0.0800.328 * & # x02014
الارتفاع (م)0.281 * -0.312 * 0.1190.764 *** & # x02014
مؤشر كتلة الجسم (kg & # x000b7m -2)0.0110.763 *** 0.338 ** 0.796 *** 0.221& # x02014
المشي ب -0.196-0.247-0.300 * -0.150-0.085-0.147& # x02014
معتدل النشاط ب 0.123-0.603 ** 0.2860.2260.2520.1070.046& # x02014
نشاط قوي ب 0.505 *** -0.615 ** 0.0820.1300.311 * -0.0830.1900.292 *

تم النظر في نموذجين في اشتقاق VO2معادلة التقدير القصوى. تضمن النموذج الأول (النموذج الأول) الجنس والعمر والوزن والطول والمشي والنشاط المعتدل والنشاط القوي. في النموذج 2 ، تم تضمين مؤشر كتلة الجسم بدلاً من الوزن والطول. في كلا النموذجين ، أشارت الانحدارات المتعددة القياسية إلى أن الجنس والنشاط القوي فقط لهما ارتباطات مستقلة متعددة المتغيرات مع VO2الأعلى. لتأكيد هذه الارتباطات ، تكررت تحليلات الانحدار باستخدام الانحدار التدريجي الذي أدى إلى نفس النموذج النهائي (النموذج 3). كما هو متوقع ، ظل الجنس والنشاط النشط في النموذج. بالإضافة إلى مساهمة الجنس ، ساهم النشاط النشط بجزء كبير من التباين في قياس VO2يُشار إلى الحد الأقصى بتغيير كبير في R 2 (& # x00394R 2 = 0.147 ، p = 0.001). أوضح النموذج 3 43٪ من التباين في قياس VO2max وتم اختياره كنموذج نهائي لاشتقاق VO2معادلة الحد الأقصى على أساس البخل. باستخدام المعاملات غير القياسية الناتجة ، VO2يتم تقدير الحد الأقصى بالمعادلة التالية حيث يتم حساب الذكور = 1 والإناث = 2 ويتم حساب النشاط النشط على أنه MET-mins & # x000b7week -1: تقدير VO2max = 47.749 & # x02212 [6.493 & # x000d7 الجنس] + [0.140 & # x000d7 (نشاط قوي) -2].

في المجموعة الفرعية للاشتقاق ، كان هناك معامل ارتباط قوي للعينة المزدوجة (p & # x0003c 0.001) ولا يوجد فرق كبير بين VO المقاس والمقدر2ماكس (ع = 0.991) (الجدول 4). الخطأ القياسي في التقدير (SEE) ، كان ضمن نطاق SEE المبلغ عنه لغيرها من VO غير التدريبي2معادلات التقدير القصوى (الجدول 5) وضمن نطاق الخطأ (10 - 20٪) التي تمت ملاحظتها مع اختبار التمرين دون الحد الأقصى. مؤامرة بلاند-ألتمان (الشكل 1 أ) للاختلافات ومتوسطات VO المقدرة والفعلية2يشير الحد الأقصى إلى أن 64٪ من إجمالي العينة يقع ضمن 1 SD (5.45 مل & # x000b7kg -1 & # x000b7min -1) من VO الفعلي2الأعلى. انخفض إجمالي 100 ٪ ضمن 2 SD (10.90 مل & # x000b7kg -1 & # x000b7min -1). لم يكن هناك دليل على خطأ منهجي كمتوسط ​​للاختلافات بين VO المقاسة والمقدرة2كحد أقصى يساوي الصفر. ومع ذلك ، يبدو أن المعادلة تقلل من شأن (يُشار إليها بالقيم السلبية) VO2الحد الأقصى للأفراد المناسبين (المصنفين على أنهم جيدون وممتازون ومتفوقون) بمتوسط ​​- 9.2٪ (النطاق = - 31.7٪ إلى + 9.2٪) والإفراط في التقدير (يُشار إليه بالقيم الإيجابية) VO2الحد الأقصى للأفراد الأقل لياقة (المصنفين على أنهم فقراء للغاية وفقراء وعادلون) بنسبة + 9.7٪ (النطاق = -7.5٪ إلى + 19.8٪). كان هناك ما مجموعه شخصين (4٪) لديهم خطأ إجمالي (٪) أكبر من الخطأ المقبول المقدّر من اختبار التمرين دون الحد الأقصى بنسبة 20٪.

الفرق بين VO المقاسة بشكل موضوعي2ماكس والمقدر VO2الحد الأقصى مقابل متوسط ​​VO الفعلي الموضوعي2ماكس والمقدر VO2الأعلى. يمثل الأفراد ذوو اللياقة البدنية المنخفضة فئات اللياقة البدنية الفقيرة جدًا والفقيرة والعادلة. يمثل الأفراد ذوو اللياقة البدنية العالية فئات اللياقة البدنية الجيدة والممتازة والمتفوقة. المقدرة VO2max = 47.749 & # x02212 [6.493 & # x000d7 الجنس (ذكور = 1 إناث = 2)] + [0.140 & # x000d7 (نشاط قوي) -2]. انظر = 5.45 ml & # x000b7kg -1 & # x000b7min -1. متوسط ​​الفرق: 0.0 مل & # x000b7kg -1 & # x000b7min -1. خطأ فردي مقبول: & # x000b1 10 ml & # x000b7kg -1 & # x000b7min -1. أ) مجموعة الاشتقاق: n = 32 64٪ ضمن 1 SD n = 50 100٪ ضمن 2 SD. كان الفرق بين القياسات مرتبطًا بشكل كبير بمتوسط ​​القياسين (r = 0.478 ، p = 0.001). ب) مجموعة التحقق من الصحة: n = 20 67٪ ضمن 1 SD n = 49 97٪ ضمن 2 SD. كان الفرق بين القياسات مرتبطًا بشكل كبير بمتوسط ​​القياسين (r = 0.567 ، p = 0.001).

الجدول 4

إحصائيات الدقة والصلاحية لـ VO2معادلة التقدير القصوى

مجموعة (ن)تقاس VO2الأعلىالمقدرة VO2الأعلىرصيرىيرى٪
الاشتقاق (ن = 50)41.6 & # x000b1 7.141.6 & # x000b1 4.8-0.0120.6755.2912.7
التحقق من الصحة (ن = 30)41.7 & # x000b1 7.242.1 & # x000b1 4.3-0.4790.6065.8614.0

الجدول 5

ملخص حديث (1997-2009) VO القائم على النشاط البدني2معادلات التقدير القصوى

يذاكرحجم العينةالعمر (بالسنوات)صوت2الحد الأقصى (mL & # x000b7kg -1 & # x000b7min -1)المتغيرات المضمنةصص 2 انظر (mL & # x000b7kg -1 & # x000b7min -1)يرى (٪)
الدراسة الحالية8018-2541.6 & # x000b1 7.1الجنس ، نشاط قوي (IPAQ-S)0.650.425.4513.1
برادشو وآخرون. (2005)10018-6540.0 & # x000b1 9.5الجنس ، العمر ، مؤشر كتلة الجسم ، PFA ، PASS0.93NR3.458.6
دوكي وآخرون. (2009)7030.8 & # x000b1 7.730.8 & # x000b1 7.7الجنس ، مؤشر كتلة الجسم ، نشاط وقت الفراغ (Baecke & # x02019s)NR0.356.0819.7
جورج وآخرون. (1997)10018-2944.1 & # x000b1 6.6الجنس ، PFA ، PASS ، مؤشر كتلة الجسم0.85NR3.447.8
مالك وآخرون. (2004)إناث ن = 8038.5 & # x000b1 9.42594 & # x000b1431 (mL & # x000b7min -1)الجنس ، العمر ، الوزن ، الطول ، التدريب (ساعة / أسبوع) ، كثافة0.830.67259 (مل & # x000b7min -1)10.0
مالك وآخرون. (2005)عدد الذكور = 11240.2 & # x000b1 11.74207 & # x000b1636.8 (mL & # x000b7min -1)التدريب (Borg Scale) ، سنوات من التدريب0.820.65387 (مل & # x000b7min -1)9.2
ماثيوز وآخرون. (1999)79919-7937.2 & # x000b1 11.0الجنس ، العمر ، العمر 2 ، النجاح ، الوزن ، الارتفاعNR0.745.6415.2
الجنس ، العمر ، العمر 2 ، النجاح ، مؤشر كتلة الجسمNR0.735.7615.5
وير وآخرون. (2006)عدد الذكور ن = 2417ذكور 21-82ذكور 36.5 & # x000b1 8.1الجنس ، العمر ، التمرير ، محيط الخصر0.81NR4.8013.4
الجنس ، العمر ، النجاح ، مؤشر كتلة الجسم0.80NR4.9013.4
إناث ن = 384إناث 19-67إناث 31.9 & # x000b1 7.5الجنس ، العمر ، المرور ، نسبة الدهون في الجسم0.82NR4.7213.2

PFA = القدرة الوظيفية المتصورة

PASS = مقياس حالة النشاط البدني التابع لناسا

في المجموعة الفرعية للتحقق ، كان هناك مرة أخرى معامل ارتباط قوي للعينة المزدوجة r = 0.601 ، p & # x0003c 0.001 مع عدم وجود فرق كبير بين VO المقاس والمقدر2ماكس (ع = 0.636) (الجدول 4). وبالمثل ، كان الخطأ المعياري في التقدير (SEE و SEE ٪) ضمن نطاق SEE المبلغ عنه لغيرها من VO غير التدريبي2معادلات التقدير القصوى (الجدول 5) وضمن نطاق الخطأ (10-20٪) الذي لوحظ في اختبار التمرين دون الحد الأقصى. مؤامرة بلاند-ألتمان (الشكل 1 ب) للاختلافات ومتوسطات VO المقدرة والفعلية2يشير الحد الأقصى إلى أن 67 ٪ من إجمالي العينة يقع في حدود 1 SD من VO الفعلي2حد أقصى و 97٪ انخفض خلال 2SD. كان متوسط ​​التقدير في المجموعة الملائمة -11.2٪ (النطاق = - 30.4٪ إلى + 8.7٪) وكان التقدير الزائد في المجموعة غير الملائمة + 11.6٪ (النطاق = + 5.4٪ إلى + 20.5٪). ما مجموعه أربعة أفراد (13٪) لديهم خطأ إجمالي (٪) أكبر من الخطأ المقبول المقدر من اختبار التمرين دون الحد الأقصى بنسبة 20٪.


اختصارات و إقتصارات

بيان تضارب المصالح: راجع صفحة 28.

المحتوى هو مسؤولية المؤلفين فقط ولا يمثل بالضرورة وجهات النظر الرسمية للمعاهد الوطنية للصحة.

الدعم: تم تقديم الدعم الجزئي لهذا المشروع من قبل TKC Global (رقم المنحة GS04T11BFP0001 L. Kaminsky ، جامعة بول ستيت) ، والمركز الوطني لتطوير العلوم التحويلية ، المعاهد الوطنية للصحة ، من خلال المنحة UL1TR000050 (R. Arena ، جامعة. شيكاغو).


شاهد الفيديو: Multiple Linear Regression by Excel (كانون الثاني 2022).