تجزیه و تحلیل همبستگی چند سطحی سازگار: یک الگوریتم جدید و مطالعه موردی

کیانگ ژانگ وزارت منابع آب و محیط زیست و آزمایشگاه کلیدی چرخه آب و امنیت آب در جنوب چین موسسه آموزش عالی گوانگدونگ ، دانشگاه Sun Yat-Sen ، Guangzhou ، مکاتبات چین zhangq68@mail. sysu. edu. cn مشاهده اطلاعات بیشتر نویسنده

Vijay P. Singh گروه مهندسی بیولوژیکی و کشاورزی و گروه مهندسی عمران Zachry ، دانشگاه A& M تگزاس ، ایستگاه کالج ، TX ، USAVIEW اطلاعات بیشتر نویسنده

استناد را بارگیری کنید
https://doi.org/10. 1080/02626667. 2016. 1170941
جایگاه

مقالات اصلی

تجزیه و تحلیل همبستگی چند سطحی سازگار: یک الگوریتم جدید و مطالعه موردی

خلاصه

تجزیه و تحلیل همبستگی چند سطحی سازگار ، نوعی روش داده محور ، ارائه شده است. تجزیه و تحلیل با تقسیم سری زمانی به بخش هایی انجام می شود به گونه ای که بخش های مجاور دارای مقادیر میانگین قابل توجهی متفاوت هستند. نشان داده شده است که روش پیشنهادی می تواند اطلاعات چند سطحی در مورد همبستگی بین دو متغیر ارائه دهد. ضریب یکپارچه با آزمایش اهمیت آن نیز برای خلاصه کردن همبستگی در هر سطح پیشنهاد شده است. با استفاده از روش تجزیه و تحلیل همبستگی چند سطحی سازگار ، همبستگی بین جریان و سطح آب برای یک مطالعه موردی مورد بررسی قرار می گیرد ، و نتایج نشان می دهد که همبستگی واقعی ممکن است بسیار پیچیده تر از تصویر ساخته شده تجربی باشد.

ویرایشگر D. Koutsoyiannis Associate ویراستار E. Volpi

1. معرفی

همبستگی بین دو متغیر در اکثر زمینه های تحقیقاتی مورد توجه بسیاری است. به عنوان استاندارد تحلیلی علم مدرن رفتار شده است (برکلی 1710). یکی از متداول ترین راه های توصیف همبستگی ، از ضریب همبستگی پیرسون ، R استفاده می کند ، که قدرت و جهت رابطه خطی بین دو متغیر را تعیین می کند (راجرز و نیواندر 1988). با توجه به دو متغیر x = x_i>و y = y_i>، جایی که i = 1 ،… ، n ، ضریب همبستگی پیرسون ، r ، به این صورت تعریف شده است:

و از 1 تا 1 متغیر است. در آنچه در زیر آمده است ، نماد "R" یا "ضریب همبستگی" نشانگر R پیرسون است. مقادیر −1 و 1 به ترتیب با همبستگی خطی کاملاً منفی و مثبت مطابقت دارند ، در حالی که r = 0 نشان دهنده هیچ ارتباطی نیست. با توجه به این تعریف ، به راحتی می توان دریافت که ضریب همبستگی پیرسون اندازه گیری جهانی از همبستگی بین دو متغیر را ارائه می دهد.

در توسعه تجزیه و تحلیل همبستگی ، برخی از نسخه های اصلاح شده ارائه شده است. یکی تجزیه و تحلیل همبستگی ، که همبستگی بین دو بخش از همان متغیر را با برخی از تاخیر بررسی می کند. دیگری تجزیه و تحلیل همبستگی محلی است.

همبستگی یک ویژگی بسیار مهم در تجزیه و تحلیل آماری ، به ویژه در مطالعات هیدرولوژیکی است. گزارش شده است که همبستگی قوی در داده های هیدرولوژیکی فراگیر است (Hurst 1951 ، Yang et al. 2010 ، Zhang et al. 2011b ، 2014). علاوه بر این ، تأثیر آن بر مدل سازی ، شبیه سازی و سایر تجزیه و تحلیل آماری در نظر گرفته شده است (یو و همکاران 2002 ، پرین و همکاران 2007 ، Machiwal و Jha 2008 ، Yang et al. 2010 ، Lacombe و همکاران 2012).

هر متغیر ، به ویژه در مشکلات زندگی واقعی ، به طور کلی از چندین مؤلفه تشکیل شده است (نیکولیچ و همکاران 2012) ، برخی با تغییرات کند و برخی با تغییرات سریع. به طور کلی ، اجزای آهسته نیز به عنوان روندها شناخته می شوند. روشهای زیادی برای استخراج روند پیشنهاد شده است. دو مورد از آنها معمولاً در تجزیه و تحلیل سری زمانی مورد استفاده قرار می گیرند ، یعنی روش متوسط در حال حرکت و تجزیه و تحلیل رگرسیون خطی (وو و همکاران 2007). علاوه بر این ، برخی از روشهای پیشرفته برای استخراج روند ، مانند تجزیه و تحلیل موجک ها (Combes et al. 1989 ، Meyer 1992) و تجزیه حالت تجربی (EMD) وجود دارد (Huang et al. 1998 ، Wu et al. 2007). روش متوسط متحرک به سادگی با میانگین محلی در پنجره در حال حرکت به عنوان روند رفتار می کند. اگرچه اصل روش متوسط در حال حرکت بسیار ساده است ، اما برای استخراج روندهای مربوطه به طور مؤثر و مؤثر کار می کند (آلوارز-رامیرز و همکاران 2005 ، ژانگ و همکاران 2011b). در مقابل ، محاسبه تحولات موجک و EMD بسیار پیچیده تر است. علاوه بر این ، انتخاب عملکرد موجک همیشه یک مشکل است. بنابراین ، ما روش متوسط متحرک را برای استخراج روند صاف به عنوان اجزای آهسته انتخاب کردیم و سپس همبستگی بین روندهای استخراج شده را مورد بررسی قرار دادیم.

معمولاً ، همبستگی جهانی بین دو متغیر توسط همبستگی بین اجزای با تغییرات آهسته حاکم است. برای بررسی همبستگی بین مؤلفه های سریع ، یعنی در مقیاس های کوچک مربوطه ، تجزیه و تحلیل همبستگی محلی باید با علاقه بیش از یک اندازه گیری جهانی توسعه یابد. یکی از روشهای متداول تجزیه و تحلیل همبستگی محلی این است که ابتدا متغیرها را به بخش ها تقسیم کنید و سپس تجزیه و تحلیل همبستگی محلی را در هر بخش انجام دهید. تقریباً تمام تجزیه و تحلیل همبستگی محلی موجود از این روش پیروی می کنند ، مانند ضریب همبستگی محلی پیشنهادی (FOMEL 2007) ، تجزیه و تحلیل همبستگی مقیاس (نیکولیچ و همکاران 2012) و تجزیه و تحلیل همبستگی عمومی (ژو و همکاران 2015). با این حال ، یک چالش واقعی در تجزیه و تحلیل محلی که از این طریق انجام می شود ، نحوه تقسیم یک متغیر است. برای هر یک از تجزیه و تحلیل همبستگی محلی فوق الذکر ، متغیر باید به بخش هایی با طول مساوی تقسیم شود ، که این مقدار یک پارامتر از پیش تعیین شده است. برای این منظور ، برخی از دانش برای تعیین این پارامتر طول لازم است.(در آنچه در زیر آمده است ، ما همچنین پارامتر طول را مقیاس می نامیم تا از یک اصطلاح دیگر ، یعنی سطح ، متمایز شود.) با این حال ، معمولاً پیش تعیین مقیاس برای تجزیه و تحلیل محلی ، به ویژه در مورد متغیرهای زندگی واقعی ، مانندبه عنوان سری هیدرولوژیکی یا سری هواشناسی. علاوه بر این ، حتی برای یک سری واحد ، پارتیشن های مختلف ممکن است رفتارهای متفاوتی را نشان دهند که شامل اثرات فرآیندها در مقیاس های مختلف است. به این معنا ، تجزیه و تحلیل محلی فعلی امکان پذیر نیست.

این سؤال پیش می آید: اگر ما نتوانیم به سادگی سریال را به طور مساوی تقسیم کنیم ، برای تجزیه و تحلیل محلی چه کاری باید انجام دهیم؟برای پاسخ به این سؤال ، لازم است که به طور تطبیقی تعیین کنیم که آیا تجزیه و تحلیل همبستگی محلی باید در نظر گرفته شود ، و در این صورت ، معیار مورد نیاز برای تقسیم سری مورد مطالعه است. همچنین ، برای جلوگیری از معرفی هرگونه اطلاعات اضافی ، چنین معیاری باید مستقیماً از تعریف تجزیه و تحلیل همبستگی موجود ناشی شود.

این مطالعه یک تجزیه و تحلیل همبستگی چند سطحی سازگار ، که هدف آن تعیین تطبیقی نحوه تقسیم متغیرها و سپس تعریف سطح برای تجزیه و تحلیل با توجه به اهمیت تقسیم بندی است. ضرایب همبستگی محلی و یکپارچه و اهمیت آنها نیز برای هر سطح ارائه شده است. با استفاده از تجزیه و تحلیل چند سطحی پیشنهادی ، یک مدل چند سطحی می تواند برای اندازه گیری همبستگی بین دو متغیر در هر سطح ساخته شود.

2 روش پیشنهادی

برای دو بردار ، و ، به عنوان عزیمت از میانگین مقادیر تعریف شده و ضریب همبستگی پیرسون می تواند ، به دنبال تعریف محصول داخلی ، به عنوان معیار تعیین کننده ضایعات بین بردارها رفتار شود (راجرز و نیواندر 1988). با این حال ، اغلب مشاهده می شود که پارتیشن های مختلف متغیرها دارای مقادیر متوسط متفاوت هستند. برای یک سری ثابت ، اگر یک متغیر را به چندین قسمت تقسیم کنیم و سپس میانگین محلی را تغییر دهیم تا این مقادیر متوسط محلی متفاوت باشد ، می توان ترکیبی از وسایل محلی تغییر یافته را به عنوان یک نوع اجزای آهسته درمان کرد. در مطالعات همبستگی گزارش شده است که چنین اجزای آهسته ، حتی اگر میزان شیفت ها بسیار اندک باشد ، می تواند بر همبستگی ها تأثیر بگذارد (Giraitis et al. 2001 ، Granger and Hyung 2004). حتی برای متغیری که با هم مرتبط نیست ، ممکن است یک همبستگی قوی به دلیل معرفی این اجزای آهسته ظاهر شود (Giraitis و همکاران 2001). بنابراین ، طبیعی است که حدس بزنید که متغیرهای دارای پارتیشن های مختلف دارای مقادیر متوسط متفاوت نیز بر تجزیه و تحلیل همبستگی تأثیر می گذارند.

برای بررسی این حدس ، ما دو آزمایش عددی طراحی کردیم. آزمایش اول در شکل 1 نشان داده شده است. ما مقادیر تصادفی یک متغیر (سری) را ایجاد می کنیم ، متغیر را به پارتیشن ها تقسیم می کنیم و سپس به صورت عمودی این پارتیشن ها را به دو روش مختلف تغییر می دهیم. از لحاظ تئوریکی ، یک سری کاملاً مثبت با خودش همبستگی دارد ، یعنی R = 1. این دو سری حاصل در شکل 1 نمایش داده می شوند ، با این حال ، منجر به R = 0. 27 می شود. برای پارتیشن هایی که با تفاوت های ناچیز در مقادیر میانگین ، مانند آن از 1500 تا 2000 در شکل 1 ، همبستگی هنوز کامل است. در مقابل ، در پارتیشن از 1 تا 400 ، که شامل دو بخش با مقادیر متوسط متفاوت در یک متغیر است ، ضریب محلی مربوطه فقط 0. 60 است.

استراتژی ترید...

ما را در سایت استراتژی ترید دنبال می کنید

برچسب : نویسنده : مرجان شیرمحمدی بازدید : 56 تاريخ : سه شنبه 15 فروردين 1402 ساعت: 19:44

تجزیه و تحلیل همبستگی چند سطحی سازگار: یک الگوریتم جدید و مطالعه موردی

آخرین مطالب

امکانات وب