مقایسه عملکرد اندازه گیری مرکزیت در مجموعه داده های بازار سهام

  • 2022-09-21

بازار سهام یک بخش اساسی در منطقه مالی است. درک و ارزیابی کوههای داده های جمع آوری شده هم در زمینه های مربوطه به یک چالش تبدیل شده است. تکنیک های تجسم داده ها می توانند یک روش عملی و جذاب را برای نشان دادن داده های پردازش شده به روشی معنی دار ارائه دهند ، با اندازه گیری مرکزیت که متغیرهای قابل توجهی را در یک شبکه نشان می دهد ، از طریق بررسی جنبه های تعریف دقیق متریک. در اینجا ، در این مطالعه ، ما رویکردی را انجام دادیم که ترکیبی از پردازش داده ها ، تجسم نمودار و روش های تجزیه و تحلیل شبکه های اجتماعی ، برای توسعه بینش عمیق تر از داده های پیچیده سهام ، با هدف نهایی ترسیم نتیجه گیری صحیح با مدل های نمودار نهایی. ما به عملکرد روشهای معیارهای مرکزیت مانند بین بودن ، نزدیکی ، eigenveector ، PageRank و اندازه گیری درجه وزنی پرداختیم و مقایسه ای بین نتایج آزمایشات و 300 سهام برتر واقعی در بازار سهام استرالیا انجام دادیم. نتایج نتایج مداوم را نشان داد. اگرچه ، در آزمایشات ما ، نتایج 300 سهام برتر از این رتبه بندی های اندازه گیری مرکزیت با 300 سهم برتر که توسط ASX (بورس اوراق بهادار استرالیا) کاملاً مطابقت ندارد ، که در آن درجه وزنی و معیارهای PageRank بهتر از سایر موارد انجام شده است. سه اندازه گیری مانند بین بودن ، نزدیکی و eigenveector. دلایل بالقوه ممکن است شامل این باشد که ما عامل سرمایه گذاری در بازار سهام در روش شناسی را در نظر نگرفتیم. این مطالعه فقط نرخ تغییر قیمت سهام را در بین هر دو سهم در نظر می گیرد و در این مرحله یک الگوی استاتیک مربوطه را ارائه می دهد. تحقیقات بیشتر شامل بررسی چرخه ها و تقارن در بورس سهام در روزهای معاملات انتخابی خواهد بود ، و این ممکن است به ذینفعان در درک بینش عمیق آن سهام کمک کند.

1. مقدمه

امروز ، اهمیت نوآوری در بخش تجارت در دستیابی به موفقیت رقابتی به طور فزاینده ای برای مهمترین شرکت ها مشخص شده است [1] ، و داده های مالی گسترده در زمینه های مربوطه می تواند اطلاعات اساسی را برای تجزیه و تحلیل تجارت صحیح فراهم کند ، اما ادبیات مالی علاقه چندانی را نشان نمی دهددر فرآیندهای تصمیم گیری سرمایه گذار یا کیفیت قضاوت [2]. در بخش مالی ، داده ها از ارزش بسیار زیادی برخوردار هستند ، همچنین به طور کلی به عنوان پیچیده و ناهمگن مشخص می شوند. پس از گردآوری داده ها ، مجموعه داده های اصلی را می توان برای اهداف مختلف و ذینفعان تجزیه و تحلیل کرد. در حال حاضر ، برخی از موضوعات مشترک معاصر مانند روابط نامشخص بین ورودی های مختلف داده وجود دارد. تجزیه و تحلیل داده های پیچیده نیاز به مهارت حرفه ای ؛سر و صدای داده ها به طور بالقوه بر دقت تأثیر می گذارد. تصمیم گیری اشتباه ممکن است باعث از بین رفتن فرصت های درآمد شود. تجزیه و تحلیل داده های مالی غیرقانونی منجر به سود کم می شود. شرکت ها ممکن است نتوانند انتظارات سهامدار را برآورده کنند. برای فعالیت های سازمانها ، تجزیه و تحلیل داده ها برای تصمیم گیری نهایی ضروری است [3،4]. روشهای تجزیه و تحلیل داده های موجود معمولاً دارای جوانب مثبت و منفی هستند و تجزیه و تحلیل داده های مؤثر و کارآمد هنوز هم یک چالش است که از چندین زمینه صنعت عبور می کند ، که شامل بخش مالی نیز می شود. از این رو ، تقاضا برای درک و درک مقدار زیادی از داده های جمع آوری شده به سرعت در حال رشد است. با این حال ، استفاده از داده های پیچیده برای ارائه اطلاعات لازم به ذینفعان هنوز هم در بخش مالی همچنان یک چالش است. علاوه بر این ، روش تجزیه و تحلیل روابط بین ورودی های مختلف و یافتن اهمیت هرگونه ورود به اطلاعات فردی ، یک عامل مهم در این امر است که ذینفعان را قادر به درک بینش عمیق در مورد سرمایه گذاری های خود می کند. یکی از اهداف نهایی تجزیه و تحلیل داده های مالی ، نتیجه گیری صحیح از داده های خام به منظور به دست آوردن یک مزیت رقابتی است.

بازار سهام یک بخش اساسی در منطقه مالی است ، چگونگی درک و درک کوههای داده های جمع آوری شده سهام در زمینه های مربوطه به یک چالش تبدیل شده است. به عنوان مثال ، تجزیه و تحلیل اساسی در بورس سهام شامل درک حرکات قیمت سهام و روابط بین سهام گسترده است. به عنوان مثال ، با نگاهی به چرخه و تقارن در بورس سهام بر اساس شمارش روزهای معاملاتی ، برای یافتن اینکه آیا بازار خرس فعلی در حال تکرار تاپ های ساخته شده در یک دوره دیگر خرس است. از این رو ، با کمک نتایج نهایی تجزیه و تحلیل داده ها ، ذینفعان ممکن است سرمایه گذاری ها را بر این اساس و منطقی تنظیم کنند. علاوه بر این ، در این مقاله ، ما فقط ارتباطات بین سهام را مورد تجزیه و تحلیل قرار می دهیم ، و این ممکن است به ذینفعان کمک کند تا سرمایه گذاری های خود را بر اساس روندهای سهام مرتبط دیگر تراز کنند. پیش بینی قیمت در مطالعه ما در صحنه دخیل نیست. داده های خام در این بخش معمولاً گسترده و پیچیده است ، همیشه تغییر می کند و اتصالات بین سهام نیز پیچیده است ، که ممکن است منجر به پیچیدگی تجزیه و تحلیل داده ها شود. مسلماً این است که تصمیم گیری و تصمیمات منطقی به تخصص و تلاش های اضافی در زمینه های مربوطه نیاز دارد. این اغلب به یک بار تجزیه و تحلیل داده ها در بین این حوزه ها تبدیل می شود [5]. بسیاری از تکنیک ها در مورد تجزیه و تحلیل داده ها در بورس اوراق بهادار استفاده شده است و به چندین موضوع پرداخته است.

این مطالعه در ابتدا با تقاضای واقعی ذینفعان تشویق شد و یک پروژه مشترک با تجزیه و تحلیل داده های مالی از دانشکده تجارت در دانشگاه غربی سیدنی ایجاد کرد. یک مشکل کلی که آنها در این بخش پیدا کردند این است که تجزیه و تحلیل سهام خاص برای سرمایه گذاری های آینده به دلیل پیچیدگی شبکه سهام دشوار است. سپس دوباره ، برای به دست آوردن بهتر از همه سهام ، باید مرکز/سهام قابل توجه تعیین شود ، و در تأثیر سهام اساسی فاکتورسازی می شود. از این پس ، این مطالعه در دستور کار قرار گرفت. رویکرد پیشنهادی ما شامل پردازش داده ها ، تجسم نمودار و تجزیه و تحلیل شبکه های اجتماعی است ، و IT مجموعه داده های سهام را بر اساس نرخ تغییر قیمت معاملات در بین سهام ، که تاکنون در بازار سهام استرالیا آزمایش نشده است ، به بهترین دانش ما مدل می کند. واداین رویکرد مفاهیم اندازه گیری مرکزیت را برای اندازه گیری اهمیت سهام اتخاذ می کند و قابلیت استفاده از آن روش ها را برای یافتن معیارهای محوریت مناسب داده های بازار سهام مقایسه می کند. این مطالعه موردی براساس داده های خام جمع آوری شده از بازار سهام استرالیا برای بیش از 20 سال است.

این رویکرد اندازه گیری مرکزیت نمودار و روشهای تجسم تعاملی را ترکیب می کند و آنها را برای داده های واقعی سهام اعمال می کند.

این روش با تمام سهام انتخاب شده به عنوان یک سیستم شبکه غیر از ورودی های فردی رفتار می کند. این قدرت رابطه را به تجزیه و تحلیل می رساند ، و در مقایسه با روش های موجود در تجزیه و تحلیل بازار سهام مانند نمودارهای سنتی و Treemap ، اتصالات بین سهام را می توان به وضوح به عنوان یک تصویر بزرگ از طریق طرح بندی نمودار نهایی شناسایی کرد. ویژگی های اساسی مانند بزرگنمایی و خارج نیز ارائه می شود ، اگرچه کیفیت طرح نمودار در این مقاله گنجانده نشده است.

ما آزمایشاتی را در مورد مجموعه داده های سهام پاک انجام دادیم تا نشان دهیم که رویکرد ما امکان پذیر و سودمند است و علاوه بر این ، مقایسه عملکرد روشهای مختلف مرکزیت در آن مجموعه داده ها.

پنج اندازه گیری مرکزیت انجام شد و عملکرد آنها بر اساس همان مجموعه داده در آزمایشات مقایسه شد.

در زیر مجموعه های زیر ، ما به طور خلاصه کارهای مرتبط در مورد تجسم نمودار و معیارهای مرکزیت نمودار را در بخش 2 مرور می کنیم. بخش 3 روش شناسی را که در طول کار استفاده می کنیم معرفی می کند. نتایج تجربی در بخش 4 گزارش شده است. بخش 5 بحثی را ارائه می دهد. نتیجه گیری و آثار آینده در بخش 6 مشخص شده است.

2. آثار مرتبط

2. 1تجسم نمودار

در بورس سهام ، حجم گسترده ای از داده های خام هر ثانیه استخراج می شود و گفت: داده ها باید در یک زمان معقول به فرم های آسان قابل درک پردازش شوند تا شواهدی را برای اهداف تصمیم گیری در اختیار ذینفعان قرار دهند. برای انجام این کار بسیاری از روش های پردازش داده ها برای این بخش اعمال شده است. در مرحله آخر تجزیه و تحلیل داده های مالی ، داده های نهایی فیلتر شده/پاکسازی/قالب بندی شده اند ، بنابراین اندازه آن ممکن است در مقایسه با داده های خام جمع آوری شده بسیار کوچکتر باشد ، اما مجموعه داده نهایی هنوز هم به طور معمول بزرگ است. به عنوان مثال ، در آزمایشات ما ، حدود 6. 4 میلیون ورودی داده را جمع آوری کردیم و مدل نمودار تکمیل شده که شامل کل بازار سهام است دارای 1379 سهام و 11. 535 لبه در بین آنها است ، اما داده ها هنوز هم برای تجزیه و تحلیل بسیار زیاد است ، به خصوص در مورد غیر متخصصان. تکنیک های تجسم داده ها می توانند توانایی های تفسیر داده ها را برای بیان داده های خام ارائه دهند و روشی عملی و استفاده شده برای ارائه داده ها به روشی معنی دار فراهم کنند. ابزارهای تجسم چندگانه برای بهره برداری بصری بینش داده ها در بسیاری از حوزه های کاربردی ، از جمله بازار سهام [6،7،8] اتخاذ شده است. در حال حاضر ، تجزیه و تحلیل داده های سهام هنوز هم معمولاً به روش های سنتی مانند صفحه گسترده ، نمودارها ، Treemaps و مختصات موازی و غیره انجام می شود ، با این روش ها تا حدی قابلیت خوانایی داده های سهام نهایی را بهبود می بخشد.

نمودار سنتی بازار سهام یک ابزار تجسم استاندارد است. این نمودارهای نماینده را ارائه می دهد و به طور معمول دارای ویژگی هایی مانند بزرگنمایی ، سطح جزئیات و انتخاب و غیره است. یک نمودار تصویری کامل از پویایی بازار سهام را ارائه می دهد. شکل نمودار در تصمیم گیری برای اهداف تجزیه و تحلیل بازار سهام فنی در نظر گرفته شده است [9]. Treemap با پول هوشمند به تصویب رسیده است-یکی از محبوب ترین ابزارهای تجسم در بورس-که توسط مجله Wall-Street برای نشان دادن عملکرد بازار استفاده می شود [10] ، ارائه دیدگاه های عملکرد بازار سهام و نشان دادن تغییر قیمت سهام و سرمایه گذاری500+ شرکت. از کاشی های مستطیل شکل رنگی برای نشان دادن سهام استفاده می کند ، اندازه نشان دهنده سرمایه بازار است ، کد رنگ نشان می دهد که قیمت در حال کاهش/افزایش است ، در حالی که سایه نشانگر میزان تغییر است. Treemap برای ارائه مجموعه داده های سلسله مراتبی بزرگ که در آن ویژگی اندازه گره اهمیت دارد ، مناسب است. با این حال ، Treemap را نمی توان در شبکه های غیرمتمرکز استفاده کرد [11] ، و بررسی شبکه های پیچیده از طریق نمای غیرقانونی Treemap دشوار است [12]. مختصات موازی برای تجسم و تجزیه و تحلیل داده های با ابعاد بالا استفاده می شود. آنها برای ارائه داده های بعدی N معتبر هستند و امکان کشف مجموعه داده ها با مقادیر زیادی را فراهم می کنند. اگرچه ، در عمل ، الگوریتم های موازی هماهنگی موازی ممکن است به دلیل حساسیت آن به درهم و برهمی بینایی منجر به مشکل در درک داده های پیچیده شود [13].

علاوه بر این، گراف پیوند گره یکی دیگر از تکنیک های رایج تجسم است. داده‌هایی با ساختار رابطه‌ای برای مدل‌سازی و تجسم در گراف‌های پیوند گره برای تحلیل بهتر مناسب هستند [14،15]. از این رو، ساختار رابطه‌ای داده‌های بازار سهام، استفاده از روش‌های گراف پیوند گره را مناسب می‌سازد. در اینجا، تمرکز بر نحوه اتصال عناصر به عنوان یک سیستم بوده است، نه فقط موارد منفرد [14]. بسیاری از الگوریتم‌ها و ابزارهای گراف پیوند گره به خوبی توسعه‌یافته برای تولید طرح‌بندی گراف به روشی بصری دلپذیر و مفید ساخته شده‌اند که به خوانندگان کمک می‌کند ساختار و الگوهای رابطه گراف‌های زیرین را درک کنند [16]. برای مثال، نرم‌افزار Visone طرح‌بندی‌های شعاعی و طیفی را تولید می‌کند و تجزیه و تحلیل و تجسم شبکه‌ها را با ابزار ساده تعامل گرافیکی تسهیل می‌کند [17]. Handcock و همکارانStatnet را ایجاد کرد که الگوریتمی به نام زنجیره مارکوف مرکزی مونت کارلو (MCMC) را اعمال می کند و بر مدل سازی آماری داده های شبکه تمرکز می کند [18]. روسی و احمد یک پلتفرم تجزیه و تحلیل گراف مبتنی بر وب ایجاد کردند که NR نام دارد و به کاربران اجازه می‌دهد تا داده‌ها را به صورت تعاملی در زمان واقعی تجزیه و تحلیل و تجسم کنند [19]. سایر بسته های نرم افزاری مشابه عبارتند از RSiena [20]، igraph [21]، UCINet [22]، Pajek [23]، NodeXL [24،25] و Gephi [26].

اکثر ابزارهای تجسم موجود ممکن است داده ها و روابط مربوطه را بین واحدهای داده زمانی که در حال نهایی کردن طرح بندی نمودار هستند از دست بدهند زیرا بر ایجاد نمودارها تا حد امکان انتزاعی و ساده تأکید دارند. علاوه بر این، روش‌های مرتبطی که در بخش مالی اتخاذ شده‌اند، قابلیت‌هایی را در ابتکار کشف رابطه «ناشناخته» مجموعه داده‌های مالی در مقیاس بزرگ، به‌ویژه، تا جایی که می‌دانیم، در بازار سهام استرالیا ارائه نمی‌دهند.

2. 2. معیارهای مرکزیت نمودار

SNA (تجزیه و تحلیل شبکه های اجتماعی) در سالهای اخیر پیشرفت های فوق العاده ای را تجربه کرده است و تحقیقات زیادی در ادبیات گزارش شده است [27،28]. شاخص های مرکزیت معیارهای مهم برای تجزیه و تحلیل شبکه هستند. آنها مدتهاست که در SNA به کار رفته اند تا درک متفاوتی از روابط اجتماعی در شبکه ارائه دهند و اهمیت نسبی راس یا لبه در یک شبکه را بیان کنند [29] و توضیحات مفصلی از ساختارهای اجتماعی ارائه می دهند [30]. به همین ترتیب ، اندازه گیری مرکزیت نمودار مانند مدرک درجه و PageRank و غیره می تواند اطلاعاتی را با اهمیت "رتبه بندی" در بورس ارائه دهد ، از این رو ، به ذینفعان ایده کلی در مورد سرمایه گذاری های آینده خود را با در نظر گرفتن سهام مرتبط ، نه تنها در سهام فردی ارائه می دهد.< SPAN> SNA (تجزیه و تحلیل شبکه های اجتماعی) در سالهای اخیر پیشرفت های فوق العاده ای را تجربه کرده است و تحقیقات زیادی در ادبیات گزارش شده است [27،28]. شاخص های مرکزیت معیارهای مهم برای تجزیه و تحلیل شبکه هستند. آنها مدتهاست که در SNA به کار رفته اند تا درک متفاوتی از روابط اجتماعی در شبکه ارائه دهند و اهمیت نسبی راس یا لبه در یک شبکه را بیان کنند [29] و توضیحات مفصلی از ساختارهای اجتماعی ارائه می دهند [30]. به همین ترتیب ، اندازه گیری مرکزیت نمودار مانند مدرک درجه و PageRank و غیره می تواند اطلاعاتی را با اهمیت "رتبه بندی" در بورس سهام ارائه دهد ، از این رو ، به ذینفعان ایده کلی در مورد سرمایه گذاری های آینده خود را با در نظر گرفتن سهام مرتبط ، نه تنها در سهام فردی ارائه می دهد. SNA (تجزیه و تحلیل شبکه های اجتماعی) در سالهای اخیر پیشرفت های فوق العاده ای را تجربه کرده است و تحقیقات زیادی در ادبیات گزارش شده است [27،28]. شاخص های مرکزیت معیارهای مهم برای تجزیه و تحلیل شبکه هستند. آنها مدتهاست که در SNA به کار رفته اند تا درک متفاوتی از روابط اجتماعی در شبکه ارائه دهند و اهمیت نسبی راس یا لبه در یک شبکه را بیان کنند [29] و توضیحات مفصلی از ساختارهای اجتماعی ارائه می دهند [30]. به همین ترتیب ، اندازه گیری مرکزیت نمودار مانند مدرک درجه و PageRank و غیره می تواند اطلاعاتی را با اهمیت "رتبه بندی" در بورس ارائه دهد ، از این رو ، به ذینفعان ایده کلی در مورد سرمایه گذاری های آینده خود را با در نظر گرفتن سهام مرتبط ، نه تنها در سهام فردی ارائه می دهد.

مطالعات مربوطه که از معیارهای مرکزیت استفاده می کنند ، قبلاً پردازش شده اند. وانگ و همکاران. شبکه ای را برای درک ساختار همبستگی و تکامل بازارهای جهانی سهام ساخته است. داده های خام بر روی شاخص های قیمت روزانه 57 بازار سهام در دوره 2005 تا 2014 جمع آوری شد ، بر قدرت ، مرکزیت بین بودن و محوریت نزدیکی به تصویب رسید ، و معیارهای مرکزیت بین بودن و نزدیکی انجام شد [31]. Kazemilari و همکاران. تجزیه و تحلیل داده های قیمت بسته شدن روزانه 70 سهام شرکت های انرژی تجدید پذیر در دوره از 13 اکتبر 2010 تا 4 مارس 2015. سه اقدامات متمرکز از جمله درجه ، نزدیکی و مرکزیت بین المللی برای تجزیه و تحلیل خصوصیات توپولوژیکی حداقل درختان پوششی اتخاذ شد. این نتایج سهام گسترده ای را در شبکه نشان می دهد که از نظر سرمایه های بازار نقش مهمی در توسعه انرژی تجدید پذیر ایفا کرده است. علاوه بر این ، درجه ، نزدیکی و مرکزیت بین المللی نتایج مشابهی را ارائه می دهند [32]. از مرکزیت نزدیک برای اندازه گیری سقوط بازار شبکه مالی تانسور در تایلند استفاده شد و ادعا می شد که الگوریتم مرکزیت نزدیکترین ابزار برای تشخیص تصادف بازار است [33]. جونیور و همکاران. استحکام گره استفاده شده (مجموع تمام مقادیر اختصاص داده شده به هر لبه ای که یک گره دارد) به عنوان یک اندازه گیری از مرکزیت گره برای رتبه بندی قوی ترین گره های تأثیرگذار شبکه های مرتبط ، از جمله 83 شاخص بازار سهام [34]. Dimitrios و Vasileios روابط سهام بین سالهای 2007 و 2012 را در بازار سهام یونان ، درجه ، نزدیکی ، بین بودن ، مرکزیت های ویژه و ضرایب خوشه بندی برای نتیجه گیری توپولوژی و در یافتن اصلی ترین سهام مورد تجزیه و تحلیل قرار دادند. نتایج نشان داد که بازار یونان یک بازار "کم عمق" است ، به این معنی که می تواند به راحتی توسط چند سرمایه گذار بزرگ یا آب و هوای اقتصادی تحت تأثیر قرار گیرد [35]. گائو و همکاران. از طریق تولید شبکه کارگردانی از بازار سهام چین ، روابط تأثیر بین سهام ذکر شده را مورد مطالعه قرار داد. آنها برای به دست آوردن گره های بحرانی در شبکه نفوذ ، در درجه ، PageRank ، Eigenveector ، Authority ، Hub و Detainness Metrics را به دست آوردند و دریافتند که در درجه یک ، PageRank ، Eigenveector و اقتدار در توصیف اهمیت شرکت های ذکر شده به خوبی عمل کرده اند ، در حالی که از بینو اندازه گیری HUB نتوانستند این کار را انجام دهند [36]. Djauhari و Gan یک درخت با حداقل بهینه بهینه را بر روی داده های روزانه قیمت های بسته شدن 98 سهام در کل سال 2012 ، توسعه دادند.

برای غلبه بر مشکل غیر مطلوب. در آزمایشات ، از مرکزیت درجه برای تجزیه و تحلیل توپولوژی شبکه و تعیین توزیع درجه استفاده شد [37]. TU روشی را بر اساس ادغام برای ساخت یک شبکه مالی پیشرفته در بازار سهام چین پیشنهاد کرد. در این مطالعه ، نمودارهای کارگردانی ، وزنی و غیر متقارن برای نشان دادن ساختار شبکه تولید شد و مرکزیت درجه ، PageRank ، بازدیدها ، ضریب خوشه بندی محلی ، K- پوسته و اجزای به شدت و ضعیف به کار برد. نتایج حاصل از نمودار مسطح ادغام (CIPG) ، شبکه آستانه ادغام (CITN) و نمودار همبستگی جزئی (PCPG) مقایسه شد [38].

پنج معیار مرکزیت نمودار برای تجزیه و تحلیل شبکه های بازار سهام در این تحقیق پیشنهاد شده و به کار رفته است. همه آنها با همان یکنواختی مشخص می شوند (آمار بالاتر منجر به محوریت بالاتر) ، تقارن (مرکزیت گره ها فقط به آمار آنها بستگی دارد و نه برچسب های آنها) ، و افزودنی (آمار به صورت اضافی قابل جدا شدن پردازش می شود) بدیهی است [39]. مرکزیت درجه برای نشان دادن تعداد اتصالات یک سهام در بورس سهام سازگار است. مرکزیت نزدیکی نشان دهنده میانگین طول سهام برای سایر سهام دیگر در شبکه است. مرکزیت بین سلسله تعداد ژئودزیک بین همه جفت سهام در شبکه که از سرمایه خاص عبور می کنند ، ارائه می دهد. و PageRank در شبکه های مرتبط اعمال می شود. برخی از معیارها مناسب تر از سایرین در تجزیه و تحلیل داده های بورس هستند ، اما با این وجود ، تأثیر سهام را نمی توان به اندازه کافی با هر عامل فردی اندازه گیری کرد.

3. روش شناسی

برای کشف رابطه بین داده ها در بخش مالی ، رویکرد جدیدی انجام شد و اهداف خاص مناطق مورد مطالعه درک این بود که آیا سهام قابل توجهی ممکن است بر دیگران تأثیر بگذارد. برای کشف روابط بالقوه "ناشناخته" بین داده های خام بازار سهام ؛برای کشف بیشتر صحت بازنمایی روابط تجسم شده. و برای بررسی کمی امکان سنجی رویکرد در عمل. به بهترین دانش ما ، تلاشهای معدودی که معیارهای مرکزیت و الگوریتم های پیوند گره را با هم ترکیب می کنند ، برای انجام تجزیه و تحلیل بصری مجموعه داده های بازار سهام انجام شده است. این رویکرد پیشنهادی ترکیب الگوریتم نیرو و پنج روش مرکز مرکزیت را برای درک سهام قابل توجه و نشان دادن نمای کلی از کل ساختار بازار سهام استرالیا ترکیب می کند. اگرچه ما بر عملکرد روشهای معیارهای مرکزیت در آزمایشات تأکید می کنیم ، الگوریتم های تجسم نمودار فقط برای نمایش طرح گنجانده شده اند ، برای جزئیات بیشتر در مورد پردازش داده ها و تکنیک های تجسم نمودار درگیر در این کار ، به [40،41] مراجعه کنید.

3. 1پردازش داده ها و مدل سازی نمودار

ما تمام داده های خام را در آزمایشات از ASX جمع آوری کردیم ، از جمله 5088 سهام در بازار سهام استرالیا ، که از 2 ژانویه 1997 تا 30 ژوئن 2017 بود. تقریباً 6. 4 میلیون مدخل داده جمع آوری شد. در مرحله پردازش داده ها ، نرخ تغییر قیمت سهام سهام بین هر دو روز معاملات محاسبه می شود ، و سپس نرخ تغییر قیمت بین هر دو سهام در طی دو روز ادامه می یابد ، از این رو ، با درک شباهت آن دو سهام "روند تغییر قیمت و یافتن اتصالات بالقوه بین این دو سهام. سرانجام ، 1379 سهم و 11،535 پیوند برای مرحله مدل سازی نمودار ایجاد شد. برای جزئیات بیشتر ، لطفاً به [40] مراجعه کنید.

در این تحقیق ، هر سهم به عنوان "گره" رفتار می شود. علاوه بر این ، می توان رابطه بین سهام و سهام متصل آن برقرار کرد و اتصال به عنوان "لبه" نشان داده می شود. از این رو ، داده های خام را می توان به مدل های نمودار بدون هدایت منتقل کرد. به عنوان مثال ، در شکل 1 ، سهام "NAB" به "CMI" وصل شده است ، و وزن لبه (استحکام اتصال) (نگاه کنید به [40،41]) در این مورد 3 است.

3. 2الگوریتم به کارگردانی نیرو

الگوریتم های نیرو به کارگردانی عناصر نمودار را به عنوان یک سیستم مکانیکی درمان می کنند ، با استفاده از انرژی هایی مانند نیروی بهار بر روی هر راس و لبه ، کار خود را بر روی گره ها ادامه دهید تا آنها را به سمت موقعیت های معقول منتقل کنید تا زمان خاتمه رسیدن ، به عنوان مثال ، انرژی به حداقل می رسد. آنها معمولاً چیدمان های نمودار زیبایی شناسی را ارائه می دهند [42،43]. الگوریتم طرح بندی FA (Forceatlas) [44] یک روش طرح بندی فضایی تحت گروه الگوریتم های نیرو است و به یک شکل ساده به شبکه های بزرگ دنیای واقعی می پردازد. FA2 (Forceatlas2) گزینه های بیشتری را ارائه می دهد و بهینه سازی های نوآورانه را ارائه می دهد. این عملکرد خوب برای شبکه ای با کمتر از 100000 گره به ارمغان می آورد. FA2 به طور تجربی در بهترین حالت خود با شبکه های خوشه ای به شدت مشاهده می شود ، در ارائه شبکه های اجتماعی عالی است و میزان گره ها را در دافع در نظر می گیرد به گونه ای که درهم و برهمی بینایی خاص کاهش می یابد [44].aنیروهای درگیر در FA2 نیروی جذب و نیروی دافع هستند. فرض کنید نیروی جاذبه کلاسیک f وجود دارد1بین دو گره متصل n2و n1بستگی به خطی به فاصله d دارد (n2، n

)، سپسrFA2 گره های ضعیف را به گره های بسیار متصل نزدیک می کند و نیروی دافع را به گونه ای تغییر می دهد که گره های ضعیف و گره های بسیار متصل کمتر دفع می کنند. نیروی دافعه f1بین دو گره متصل n2و nr، و ضریب k

  • نویسنده : پروین دخت یزدانیان
  • منبع : wilsocaderry.space
  • بدون دیدگاه

برچسب ها

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.