انواع همبستگی

  • 2022-06-3

تست های همبستگی مسلما یکی از متداول ترین روش های اماری است و به عنوان مبنایی در بسیاری از برنامه ها مانند تجزیه و تحلیل داده های اکتشافی استفاده می شود, مدل سازی ساختاری, مهندسی داده, و غیره. در این زمینه , ما در حال حاضر همبستگی, یک جعبه ابزار برای تحقیق زبان (تحقیق تیم هسته 2019) و بخشی از مجموعه ایزیستات, با تمرکز بر تجزیه و تحلیل همبستگی. هدف این است که سبک وزن باشد و به راحتی قابل استفاده باشد و امکان محاسبه انواع مختلف همبستگی مانند:

  • همبستگی پیرسون: این متداول ترین روش همبستگی است. این مربوط به کوواریانس دو متغیر نرمال شده (یعنی تقسیم شده) توسط محصول انحرافات استاندارد است.
  • همبستگی رتبه اسپیرمن : اندازه گیری غیر پارامتری همبستگی, همبستگی اسپیرمن بین دو متغیر به همبستگی پیرسون بین نمرات رتبه از این دو متغیر برابر است; در حالی که همبستگی پیرسون ارزیابی روابط خطی, همبستگی اسپیرمن ارزیابی روابط یکنواخت (چه خطی یا نه). فواصل اطمینان (سی) برای همبستگی اسپیرمن با استفاده از محاسبه می شود فیلر, هارتلی, و پیرسون (1957) تصحیح (نگاه کنید به بیشارا و هیتنر 2017) .
  • همبستگی رتبه کندال: در حالت عادی همبستگی کندال به دلیل حساسیت خطای ناخالص کوچکتر و واریانس مجانبی کوچکتر نسبت به همبستگی اسپیرمن ارجحیت دارد. با این حال, تفسیر تاو کندال در مقایسه با رو اسپیرمن کمتر مستقیم است, به این معنا که تفاوت بین درصد جفت های هماهنگ و ناسازگار را در بین همه رویدادهای جفتی ممکن کمی می کند. فواصل اطمینان برای همبستگی های کندال با استفاده از محاسبه می شود فیلر, هارتلی, و پیرسون (1957) تصحیح (نگاه کنید به بیشارا و هیتنر 2017) . برای هر جفت مشاهدات (من ,ج) از دو متغیر (ایکس, بله) به شرح زیر تعریف می شود:

[] تاو = \فراک\مجموع_^<>امضا کردن (ایکس_ایکس_ج) \امضای بار (ی_ی_ج)\]

همبستگی میانی دو وزنی: معیاری از شباهت که به جای میانگین سنتی مبتنی بر میانگین است و بنابراین نسبت به نقاط پرت حساسیت کمتری دارد. این می تواند به عنوان یک جایگزین قوی برای سایر معیارهای شباهت مانند همبستگی پیرسون (لانگفلدر و هوروات 2012) استفاده شود .

همبستگی فاصله: همبستگی فاصله هر دو ارتباط خطی و غیر خطی بین دو متغیر تصادفی یا بردار تصادفی را اندازه گیری می کند (برای اطلاعات بیشتر, دیدن اس ارگکلی, ریزو, و باکیروف (2007) , اس ارگکلی و ریزو (2009) ). این در تضاد با همبستگی پیرسون است که فقط می تواند ارتباط خطی بین دو متغیر تصادفی را تشخیص دهد.

همبستگی درصد خم: معرفی شده توسط ویلکاکس (1994), این است که در یک وزن پایین از یک درصد مشخص از مشاهدات حاشیه ای انحراف از میانه بر اساس (به طور پیش فرض, 20 در صد).

همبستگی پی چوپان: معادل همبستگی رتبه اسپیرمن پس از حذف پرت ها (با استفاده از فاصله بوت استرپ شده ماهالانوبیس).

ضریب بلومکویست: ضریب بلومکویست (همچنین به عنوان بتا بلومکویست یا همبستگی میانی نامیده می شود.بلومکویست, 1950) یک همبستگی غیر پارامتری مبتنی بر میانه است که مزایایی نسبت به معیارهایی مانند تخمین های اسپیرمن یا کندال دارد (نگاه کنید به اشمید و شیمدت, 2006).

هافدینگ د: هافدینگ د امار یک معیار مبتنی بر درجه غیر پارامتری از ارتباط است که خروج کلی تر از استقلال را تشخیص می دهد (هوفدینگ 1948) از جمله انجمن های غیر خطی. هوفینگ د بی ن-0.5 و 1 متغیر است (اگر رتبه های گره خورده ای وجود نداشته باشد در غیر این صورت می تواند مقادیر کمتری داشته باشد) با مقادیر بزرگتر نشان دهنده رابطه قوی تر بین متغیرها است.

همبستگی گاما: شاخص گاما گودمن-کروسکال مشابه ضریب تاو کندال است. این نسبتا قوی است و به خوبی با داده هایی که روابط زیادی دارند برخورد می کند.

همبستگی رتبه گاوسی: براوردگر همبستگی رتبه گاوسی یک گزینه ساده و خوب برای همبستگی های رتبه قوی است (بود و همکاران., 2012). این بر اساس کوانتیل های گاوسی از صفات است.

همبستگی نقطه ای-دوسریال و دوسریال: ضریب همبستگی زمانی استفاده می شود که یک متغیر پیوسته و دیگری دوگانه (باینری) باشد. نقطه-دوسریال معادل همبستگی پیرسون است در حالی که باید از دوسریال زمانی استفاده شود که متغیر باینری دارای یک تداوم اساسی باشد. مثلا, سطح اضطراب را می توان در یک مقیاس مداوم اندازه گیری, اما می تواند به صورت دوگانگی به عنوان بالا/پایین طبقه بندی.

همبستگی برنده شده : همبستگی متغیرهایی که برنده شده اند یعنی با محدود کردن مقادیر شدید برای کاهش اثر پرت های احتمالا جعلی تغییر شکل داده اند.

همبستگی چندکری: همبستگی بین دو متغیر نهفته پیوسته توزیع شده به طور معمول از دو متغیر ترتیبی مشاهده شده.

همبستگی تتراکوریک : مورد خاص همبستگی چندکوریک زمانی قابل اجرا است که هر دو متغیر مشاهده شده دوقطبی باشند.

همبستگی نسبی: همبستگی بین دو متغیر پس از تنظیم برای اثر (خطی) یک یا چند متغیر. تست همبستگی پس از تقسیم مجموعه داده به طور مستقل انجام می شود. به عبارت دیگر تقسیم بندی را به عنوان یک گام مستقل تولید یک مجموعه داده متفاوت به جای تعلق به یک مدل در نظر می گیرد. به همین دلیل است که برخی از اختلافات برای مقادیر تی و پ (اما نه ضریب همبستگی) در مقایسه با سایر پیاده سازی ها مانند پپکور انتظار می رود . پسماندهای حاصل از پیشبینی خطی \(ایکس\) توسط \(ز\) (توجه داشته باشید که این را میتوان به چند متغیره \(ز\) گسترش داد ):

  • همبستگی چند سطحی: همبستگی های چند سطحی مورد خاصی از همبستگی های نسبی است که متغیر قابل تنظیم برای یک عامل است و به عنوان یک اثر تصادفی در یک مدل اثرات مختلط گنجانده شده است.

مقایسه

ما انواع مختلف همبستگی داده های تولید شده با نقاط قوت پیوند و انواع پیوند را متناسب خواهیم کرد.

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.