پیش بینی قیمت سهام مدتهاست که به دلیل اهمیت دقت پیش بینی و دشواری در پیش بینی ، موضوع تحقیق بوده است. به طور سنتی ، پیش بینی شامل مدل های خطی مانند AR و MR یا مدل های غیرخطی مانند ANN با استفاده از داده های عددی استاندارد مانند داده های مالی شرکت و داده های قیمت سهام است. محققان با توجه به دشواری در تأمین انواع کافی از داده ها ، اخیراً استفاده از شبکه های عصبی Convolutional (CNN) را فقط با تصاویر نمودار قیمت سهام آغاز کرده اند. با این حال ، ما می دانیم که کدام ویژگی های نمودارهای سهام بر صحت پیش بینی ها تأثیر می گذارد و تا چه اندازه. هدف از این مطالعه ، تجزیه و تحلیل اثرات ویژگی های نمودار سهام بر پیش بینی قیمت سهام از طریق CNN است. برای این منظور ، ما ویژگی های تصویر نمودارهای سهام را تعریف می کنیم و تفاوت های معنی داری در عملکرد پیش بینی برای هر ویژگی را مشخص می کنیم. نتایج نشان می دهد که دقت پیش بینی با استفاده از خطوط جامد ، رنگ و یک تصویر واحد بدون علائم محور بهبود می یابد. بر اساس این یافته ها ، ما پیامدهای پیش بینی را فقط با تصاویر ، که داده های بدون ساختار هستند ، بدون استفاده از مقادیر زیادی از داده های استاندارد ، توصیف می کنیم. سرانجام ، ما موضوعاتی را برای تحقیقات آینده شناسایی می کنیم.
استناد: Jin G ، Kwon O (2021) تأثیر ویژگی های تصویر نمودار بر پیش بینی قیمت سهام با یک شبکه عصبی حلقوی. PLOS ONE 16 (6): E0253121. https://doi.org/10. 1371/joual. pone. 0253121
ویراستار: Thippa Reddy Gadekallu ، انستیتوی فناوری Vellore: University VIT ، هند
دریافت: 17 سپتامبر 2020 ؛پذیرفته شده: 1 ژوئن 2021 ؛منتشر شده: 23 ژوئن 2021
کپی رایت: © 2021 جین ، کوون. این یک مقاله دسترسی آزاد است که تحت شرایط مجوز انتساب Creative Commons توزیع شده است ، که امکان استفاده ، توزیع و تولید مثل بدون محدودیت در هر رسانه را فراهم می کند ، مشروط بر اینکه نویسنده و منبع اصلی اعتبار داشته باشند.
در دسترس بودن داده ها: داده ها (مجموعه داده ها و متا داده ها) زیربنای نتایج ارائه شده در این مطالعه در دسترس هستند: [1] توضیحات متغیر و داده های تجربی پیوند https://figshare.com/articles/dataset/Variable_description_and_experimental_data/14074496 [2]پیوند مجموعه داده های شرکت: https://figshare.com/articles/dataset/dataset/14074502 [3] پیوند مجموعه داده های تصویر: https://figshare.com/articles/dataset/cnn-dataset/14074292 نویسندگان تأیید می کنند کهنویسندگان مطالعه حاضر هیچ امتیاز ویژه ای در دسترسی به این مجموعه داده ها نداشتند که سایر محققین علاقه مند از آن برخوردار نبودند.
بودجه: این کار توسط وزارت آموزش جمهوری کره و بنیاد ملی تحقیقات کره (NRF-2020S1A5B8103855) حمایت شده است.
علایق رقابتی: هیچ نویسنده ای علایق رقیب ندارد.
مقدمه
تجارت موفق سهام برای سرمایه گذاران بسیار مهم است. با در نظر گرفتن چند سهام در هنگام معامله، آنها باید با انتخاب سهام مناسب با توجه به زمان فروش اقدام به خرید یا فروش کنند. بر این اساس، پیش بینی قیمت سهام یک موضوع تحقیقاتی طولانی مدت است. از آنجایی که قیمت سهام توسط طیف گسترده ای از متغیرها تعیین می شود [1]، به نظر می رسد پیش بینی یک راه رفتن تصادفی است، به ویژه با استفاده از اطلاعات گذشته [2].
پیش بینی قیمت سهام به طور سنتی با استفاده از مدل های خطی مانند AR، ARMA، و ARIMA و تغییرات آن انجام می شود [3-5]. با این حال، فرض خطی بودن نوسانات قیمت سهام، ساده سازی بیش از حد عوامل مؤثر بر قیمت سهام است. سایر مفروضات این است که پویایی های پنهان در کار هستند و فقط روندهای کلی قابل مشاهده است [6،7]. مدل های غیرخطی مانند شبکه های عصبی مصنوعی (ANN) و شبکه های عصبی کانولوشنال (CNN) نیز می توانند برای پیش بینی قیمت سهام استفاده شوند [6،8]. همچنین ممکن است از شبکه های عصبی عمیق (DNN) که از الگوریتم های یادگیری عمیق برای پیش بینی قیمت سهام استفاده می کنند، استفاده شود. اگرچه شبکه های عصبی مکرر (RNN) و مانند آن نیز پیشنهاد می شوند [9]، به نظر می رسد که CNN ها برای پیش بینی قیمت سهام نسبتاً برتر هستند [10].
مطالعات موجود در مورد پیش بینی قیمت سهام عمدتا از داده های عددی استفاده می کند. در سالهای اخیر ، تلاش برای پیش بینی قیمت سهام از طریق تبعیض مبتنی بر تصویر با استفاده از نمودار قیمت سهام به عنوان داده های ورودی بدون استفاده از اطلاعات پروفایل یا داده های عددی آغاز شده است [2،11،12]. حتی کارشناسان پیش بینی سهام از خود نمودار سهام برای پیش بینی استفاده می کنند. دلیل این امر این است که نمودار حاوی اطلاعاتی است که می تواند پایه و اساس پیش بینی را تشکیل دهد. دانش استخراج شده بسیار مربوط به پیش بینی قیمت سهام است. در این مطالعه ، این احتمال را بررسی می کنیم که این دانش با استفاده از یک مدل یادگیری عمیق قابل استخراج باشد. برخی از مطالعات قبلی شامل پیش بینی قیمت سهام مبتنی بر یادگیری عمیق ، از نمودارهای اضافی به عنوان داده های آموزشی استفاده کرده اند. با این حال ، اکثر انواع نمودار قیمت سهام به گونه ای ثابت هستند که ویژگی های تصویر نمودار که می تواند بر پیش بینی قیمت سهام تأثیر بگذارد ، به راحتی درک نمی شوند [2،12]. در الگوریتم های یادگیری عمیق مانند CNN ، از آنجا که ویژگی های تصویر بر عملکرد پیش بینی تأثیر می گذارد ، شکل نمودار ممکن است یک متغیر مهم باشد [11،13]. با این حال ، تنها چند مطالعه بررسی می کنند که چگونه ویژگی های نمودارهای قیمت سهام بر عملکرد الگوریتم های یادگیری عمیق (به ویژه CNN) برای پیش بینی قیمت سهام تأثیر می گذارد.
هدف از این مطالعه ، تجزیه و تحلیل اثرات ویژگی های نمودار قیمت سهام بر عملکرد پیش بینی قیمت سهام CNN ها است [14]. مطالعه حاضر با اجرای یک تکنیک دقیق پردازش دقیق: انتخاب ویژگی های بهینه تصویر ، بر بهبود کیفیت داده های تصویر قیمت سهام متمرکز شده است. برای این منظور ، انواع مختلفی از تصاویر از داده های قیمت واقعی سهام ایجاد شده و تفاوت های معنی داری در عملکرد پیش بینی CNN برای هر مشخصه مشخص شد. پارامترهای CNN موجود در این مطالعه عبارتند از: ترکیبی ، تعداد فیلترها و توابع فعال سازی ، زیرا این موارد می توانند به شدت بر عملکرد استنتاج تأثیر بگذارند. نتایج این مطالعه نشان می دهد که قیمت سهام را می توان با تصاویر فقط با استفاده از CNN ها پیش بینی کرد.
یافته های این مقاله آزمایشی به شرح زیر است. اول ، حتی اگر اطلاعات عددی تهیه نشده باشد ، می توان با استفاده از فقط داده های تصویر ، پیش بینی قیمت سهام را با سطح بالایی از دقت انجام داد. دوم ، هنگام پیش بینی استفاده از داده های تصویر ، مرحله پیش پردازش انتخاب شکل بهینه تصویر که می تواند دقت را افزایش دهد کاملاً ضروری است. آزمایشات ما مشخص می کند که کدام عوامل بر دقت پیش بینی تأثیر می گذارد و کدام ویژگی های نمودارها برای افزایش این دقت مفید است. ما امیدواریم که نتایج ما ممکن است برای پزشکان عمیق یادگیری برای انتخاب بیش از حد بهینه در حداقل زمان به منظور پیش بینی قیمت سهام مفید باشد [15].
II. زمینه
2. 1 پیش بینی قیمت سهام
همانطور که قبلاً نیز گفته شد ، پیش بینی قیمت سهام به طور سنتی با استفاده از مدلهای خطی مانند AR ، ARMA و Arima و تغییرات آن انجام شده است [3-5]. در این مدل ها از قیمت سهام مانند یک مدل سری زمانی به عنوان یک متغیر مستقل برای پیش بینی استفاده می شود. برای مدل های چند متغیره ، مشخصات شرکت (بازده ، فروش ، نسبت های مختلف مالی و غیره) [16] ، حجم معاملات سهام [17] ، روند قیمت سهام در یک دوره زمانی خاص ، و تعداد دفعات نام یک شرکت خاص بودذکر شده در موتورهای جستجو [18] پیشنهاد شده است (جدول 1 را ببینید).
اخیراً تلاش هایی برای پیش بینی قیمت سهام با استفاده از مدل های غیرخطی صورت گرفته است. الگوریتم های طبقه بندی مختلفی مانند ANN، Bayes ساده، ماشین های بردار پشتیبان (SVM) و جنگل های تصمیم تصادفی استفاده شده اند. طبقه بندی کننده های غیرخطی برای پیش بینی قیمت سهام عملکرد بهتری نسبت به مدل های خطی موجود نشان می دهند [3-5،10]. در میان گزینه های مختلف، شبکه های عصبی مصنوعی (ANN) عملکرد پیش بینی خوبی ارائه کرده اند و به ابزارهای پیش بینی مالی پرکاربرد تبدیل شده اند [25-27]. به عنوان مثال، مقایسه بین طبقه بندی کننده های ANN و SVM نشان داد که ANNها در پیش بینی در بورس استانبول بهتر از SVM عمل می کنند [25]. به منظور بهبود عملکرد پیش بینی شبکه های عصبی مصنوعی، ویژگی های خاصی باید آسان تر استخراج شوند. بنابراین، روش های مهندسی ویژگی مانند تجزیه و تحلیل اجزای اصلی (PCA) در حال حاضر برای بهبود عملکرد شبکه های عصبی مصنوعی استفاده می شود [28]. با این حال، ANN ها همیشه عملکرد خوبی ندارند. در مطالعه دیگری، از ده شاخص فنی برای طبقه بندی حرکات بالا و پایین سهام با استفاده از طبقه بندی کننده های ANN، SVM، جنگل های تصادفی و بیز ساده استفاده شد. نویسندگان دریافتند که مدل جنگل تصادفی از بقیه بهتر عمل می کند [29]. بنابراین، یک روش ترکیبی پیشنهاد شده است که چندین تکنیک پیش بینی مانند یافتن وزن اولیه شبکه عصبی مصنوعی با استفاده از یک الگوریتم ژنتیک و یک الگوریتم بازپخت شبیه سازی شده و سپس یادگیری شبکه با استفاده از یک الگوریتم انتشار برگشتی را ترکیب می کند. این رویکرد ترکیبی نتایج بهتری نسبت به روش استاندارد ANN داشت [20].
اخیراً ، تحقیقات برای پیش بینی قیمت سهام با استفاده از الگوریتم های یادگیری عمیق انجام شده است. به عنوان مثال ، DNN ها و داده های عددی [30،31] و حافظه کوتاه مدت طولانی (LSTM) یا طبقه بندی کننده های RNN با داده های بدون ساختار استفاده شده اند [32،33]. به طور کلی ، پیش بینی قیمت سهام مبتنی بر یادگیری عمیق پیش بینی قیمت سهام معمولی به این معناست که معماری های عمیق شبکه عصبی قادر به گرفتن پویایی پنهان و پیش بینی های دقیق تر هستند [6]. استنتاج همچنین با تعداد زیادی از ویژگی های ورودی و یک تکنیک حلقوی منحصر به فرد برای یادگیری عمیق امکان پذیر است [7]. با این حال ، هنگام استفاده از یک مدل غیرخطی مانند مواردی که شامل الگوریتم های یادگیری عمیق است ، نگرانی در مورد بیش از حد وجود دارد. در میان الگوریتم های یادگیری عمیق برای پیش بینی قیمت سهام ، DNN ها و RNN ها علاوه بر CNN ها پیشنهاد شده اند [9] ، اما به نظر می رسد CNN ها از نظر عملکرد نسبتاً برتر هستند [10]. با این حال ، این روش این ضرر را دارد که باید مقدار زیادی از داده ها تهیه شود ، که به هزینه و زمان قابل توجهی نیاز دارد. در دسترس بودن داده ها و هزینه های تهیه داده ها نیز در صورت عدم اشتراک گذاری اطلاعات شرکت ها مهم هستند. با وجود این مشکلات ، داده های ورودی و روش های پردازش درگیر در CNN نقش مهمی در شناسایی کیفیت ویژگی های استخراج شده و پیش بینی قیمت سهام دارند. به عنوان مثال ، هنگام انجام پیش بینی قیمت سهام با CNN با استفاده از داده های 10 روزه از 100 شرکت ذکر شده در Borsa Stanbul ، عملکرد پیش بینی با ترکیب ویژگی های مشابه ، تولید شاخص های فنی و شناسایی ویژگی های دارای زمان بهبود یافته است [34].
در حالی که بیشتر مطالعات موجود در مورد پیش بینی قیمت سهام همانطور که در بالا توضیح داده شد بر اساس داده های ساختاری بود ، تحقیقات Big Data اخیراً با استفاده از داده های غیررسمی مانند متن و تصاویر به پیش بینی قیمت سهام رسیده است. به ویژه ، اطلاعات مربوط به رسانه های اجتماعی در مورد فعالیت های شرکت ها اطلاعات متنی بدون ساختار است. رسانه های اجتماعی اطلاعاتی را ارائه می دهند که می توانند از طریق تجزیه و تحلیل احساسات به عنوان مطلوب یا نامطلوب برای شرکت ها تعیین شوند [35]. با این حال ، توضیح افزایش و سقوط قیمت سهام با استفاده از فقط داده ها بر اساس تجزیه و تحلیل احساسات دشوار است. به همین دلیل ، محققان Big Data این داده ها را با متغیرهای دیگر ترکیب می کنند تا پیش بینی کنند ، اما حتی در این شرایط ، مشکل در دسترس بودن داده ها دوباره ظاهر می شوند.
2. 2 پیش بینی قیمت سهام بر اساس یادگیری عمیق مبتنی بر تصویر
در سال های اخیر، تلاش ها برای پیش بینی قیمت سهام از طریق تبعیض مبتنی بر تصویر، با استفاده از نمودار قیمت سهام به عنوان داده ورودی بدون استفاده از اطلاعات نمایه یا داده های عددی مربوط به قیمت سهام آغاز شده است [2،11،12]. این به دلیل این فرض است که پیش بینی های آتی قیمت سهام را می توان با یادگیری روندهای گذشته با دقت بیشتری انجام داد و با این فرض که الگویی مشابه با گذشته به طور مکرر رخ می دهد [12]. هنگامی که الگوریتم های یادگیری عمیق مانند CNN برای پیش بینی قیمت سهام استفاده می شوند، فقط قیمت سهام را پیش بینی می کنند، نه از یک تصویر به عنوان مجموعه داده استفاده می کنند [6،8]. این واقعیت که کارشناسان تحلیل پیش بینی سهام نیز بر اساس ویژگی های تصویر نشان داده شده در نمودارهای سهام پیش بینی می کنند، نشان می دهد که تصویر نمودار حاوی اطلاعاتی است که می تواند به پیش بینی کمک کند. ویژگی های تصویر می توانند سرنخ هایی را ارائه دهند. دانش این تصاویر را می توان با استفاده از مدل های یادگیری عمیق مانند CNN استخراج کرد.
III. مواد و روش ها
این مطالعه اثرات ویژگی های تصاویر از نمودارهای سهام مختلف را بر دقت پیش بینی قیمت سهام، با تمرکز به ویژه بر نقش فیلتر و حذف، پارامترهای اصلی CNN، به عنوان متغیرهای واسطه بین ویژگی های تصویر و عملکرد پیش بینی، بررسی می کند. عکس. 1). برای تأیید این نقش، فرضیه های زیر را پیشنهاد می کنیم:
[فرضیه 1] ویژگی های تصویری نمودارهای سهام بر دقت پیش بینی قیمت سهام توسط CNN ها تأثیر می گذارد.
[فرضیه 2] پارامتر فیلتر نقش واسطه ای بین متغیرهای ترکیب تصویر و دقت پیش بینی ایفا می کند.
[فرضیه 3] پارامتر حذف نقش واسطه ای بین متغیرهای ترکیب تصویر و دقت پیش بینی ایفا می کند.
3. 1 ویژگی های تصویر
در جدول 2 مشخصات تصویر نمودار قیمت سهام در این مطالعه در نظر گرفته شده است. انواع مختلفی از نمودارها مورد هدف قرار گرفتند: توطئه ها ، بارپلت ها و هیستوگرام ، که رایج ترین نمودارهای قیمت سهام هستند. دوم ، ما تعیین کردیم که آیا جهت نمودار (افقی یا عمودی) نیز بر عملکرد تبعیض و پیش بینی تأثیر می گذارد. سوم ، یک عنوان محور نمایش داده شده همچنین می تواند بر تبعیض و عملکرد پیش بینی تأثیر بگذارد. توضیحات یا علائم مقیاس در محور X- یا Y اطلاعات مفیدی را برای درک نمودار برای تحلیلگران انسانی ارائه می دهد ، اما در مورد CNN ها ، اگر اطلاعات متن تفسیر نشده باشد و فقط به عنوان بخشی از تصویر مشاهده شود ، ممکن است در نظر گرفته شودسر و صدا. بنابراین ما آن را در تجزیه و تحلیل گنجانده ایم. چهارم ، ما اجراها را بین دو تاریخ پیش بینی مختلف مقایسه می کنیم: پیش بینی برای روز بعد از دوره نشان داده شده در نمودار قیمت سهام یا 5 روز بعد پیش بینی شده (یعنی یک هفته بعد ، به استثنای آخر هفته). در ادبیات ، مطالعاتی وجود دارد که پیش بینی ها را بعد از 1 روز بررسی می کند و مطالعاتی که بعد از 5 روز این کار را انجام می دهند [2،12]. پنجم ، چه داده های موجود در نمودار به شکل یک نوار نمایش داده می شود یا یک خط دارای معنای مشابهی با حضور یا عدم وجود رنگ در سطح است (به تصویر زیر مراجعه کنید). اگر به عنوان یک نوار نمایش داده شود ، ضخامت و شکل نوار در یادگیری منعکس می شود و اگر به عنوان یک خط بیان شود و نه به عنوان یک نوار ، با تکنیک باریک در پردازش تصویر مطابقت دارد ، به این معنی که فقط جهت و طولاطلاعات ارائه شده استششم ، خواه میله ها و خطوط جامد یا نقطه ای باشند می توانند بر عملکرد تأثیر بگذارند.
سرانجام ، وجود یا عدم وجود رنگ در سطح نمودار نیز می تواند بر تبعیض و عملکرد تأثیر بگذارد. اگر رنگ روی سطح وجود داشته باشد ، ممکن است به عنوان یک منطقه شناخته شود و اگر اینگونه نباشد ، ممکن است به عنوان یک طرح کلی شناخته شود. در پردازش تصویر ، یک فرآیند اسکلت سازی وجود دارد [36]. ترکیب الگوریتم اسکلت شده با CNN به عنوان الگوریتم تشخیص ، تأثیر زاویه و محیط تیراندازی را بر اثر تشخیص کاهش می دهد و دقت تشخیص ژست را در محیط های پیچیده بهبود می بخشد [37]. در زمینه نمودارهای قیمت سهام ، یک رنگ در طرف اطلاعاتی را نشان می دهد که سهم قیمت سهام را در تصویر کلی نشان می دهد و هیچ رنگی به معنای آن به عنوان یک خط دیده می شود ، به این معنی که میزان تغییر در قیمت سهام استتاکید کرد.
همچنین ، بسته به منطقه مشکل که باید شناسایی شود ، وجود یا عدم وجود رنگ ممکن است برای تبعیض سودمند باشد. حتی رنگ سیاه ، سفید و خاکستری نیز ممکن است سودمند باشد ، به خصوص در زمینه هایی مانند تشخیص تصویربرداری پزشکی [38] یا جستجوی امنیتی [39]. در بعضی موارد ، پیش پردازش یا خاکستری شدن ، در یک تصویر رنگی به منظور حذف ویژگی های غیر ضروری که در تفسیر دخالت می کند ، انجام می شود. بنابراین ، هر دو تصاویر سیاه و سفید و رنگی بر عملکرد تبعیض و پیش بینی تأثیر می گذارند. این امر به ویژه هنگامی صادق است که معنای خاص به یک رنگ دشوار باشد.
3. 2 ویژگی های CNN
CNN ها شبکه های عصبی به جلو هستند که تأثیر منحصر به فردی در پردازش تصویر گرافیکی دارند. یک لایه حلقوی و یک لایه استخر در ساختار شبکه گنجانده شده است. CNN ها به ویژه در بسیاری از مطالعات اخیر به عنوان شبکه های یادگیری عمیق مورد استفاده قرار می گیرند. CNN های نماینده شامل LENET-5 ، VGG و ALEXNET هستند. در یک شبکه عصبی کاملاً متصل ، تمام نورون ها در لایه های مجاور به هم وصل می شوند و تعداد خروجی ها می توانند به طور خودسرانه تعیین شوند. با این حال ، مشکل شبکه های عصبی کاملاً متصل این است که شکل داده ها نشان داده نمی شوند. به عنوان مثال ، داده های ورودی به شکل یک تصویر از ارتفاع ، طول و کانال شکل سه بعدی (H ، W ، C) تشکیل شده است. با این حال ، داده های ورودی ، که یک شبکه عصبی کاملاً متصل است ، باید از داده های سه بعدی به داده های 1D فشرده شوند. به عنوان مثال ، با یک مجموعه داده MNIST ، تصویر داده باید در قالب 784 (28*28) با داده های سه بعدی متشکل از 1 کانال ، 28 پیکسل بلند و 28 پیکسل ، یا (28،28،1) وارد شود.
از آنجا که اطلاعات تصویر به یک بعد فشرده می شود ، برخی از اطلاعات مکانی در طی این فرآیند از بین می روند. از طرف دیگر ، از آنجا که داده های سه بعدی CNN و مقدار خروجی نیز سه بعدی هستند ، آنها برای طبقه بندی تصاویر مناسب تر هستند ، زیرا فرم می تواند حفظ شود و نوع داده نیازی به تغییر ندارد. بنابراین ، در این مقاله ، ما یک الگوریتم CNN را برای پیش بینی قیمت سهام با استفاده از داده های گرافیکی انتخاب کردیم (شکل 2 را ببینید).
علاوه بر ویژگی های تصویر در نظر گرفته شده پس از شکل گیری تصویر ، شکل ترک و فیلتر نیز می تواند بر عملکرد CNN تأثیر بگذارد. در حقیقت ، هزاران ویژگی شبکه وجود دارد که بر CNN ها تأثیر می گذارد. بنابراین ، در این مطالعه ، فقط تعداد ترک تحصیل و فیلترها در نظر گرفته شد (جدول 3 را ببینید).
IVآزمایش
4. 1 داده
برای ایجاد نمودار قیمت سهام ، ما برای اولین بار قیمت های بسته شدن روزانه را برای 5 سال از سال 2015 تا 2019 برای همه 789 شرکت ذکر شده در فهرست KOSPI از Dataguide جمع آوری کردیم. توجه داشته باشید که شرکت ها در این دوره بسته شدند و روزهای غیر تجاری برای سایر شرکت ها حذف شدند. در مرحله بعد ، یک تصویر نمودار برای هر شرکت با قیمت بسته شدن برای هر دوره 30 روز با توجه به پارامترهایی مانند عمودی/افقی ، خط/نوار و رنگی/بی رنگ برای سه نوع نمودار ایجاد شد: بارپلوت ، طرح ، وهیستوگرامدر کل ، 30 نوع تصویر نمودار با ایجاد تغییرات مختلف در ویژگی های نمودار ایجاد شده است. نمونه هایی از تصاویر نمودار تولید شده در شکل 3 نشان داده شده است.
در کل ، 45407 تصویر برای هر نمودار ایجاد شده است و 1،424،065 تصویر برای تهیه مجموعه داده تصویر جمع آوری شده است. نمودارها با جمع آوری داده ها برای هر شرکت هر 30 روز در طول دوره 5 ساله ایجاد می شوند. برچسب ها به طور خودکار برای هر تصویر تولید می شدند و هر تصویر 5 روز بعد با قیمت بسته شدن سهام مقایسه می شد. شکل 4 نمونه ای را ارائه می دهد.
تغییر در قیمت بسته شدن در تاریخ پیش بینی نشان می دهد که قیمت آن بر اساس آخرین روز 30 روز پس از ایجاد تصویر ، چقدر قیمت یا کاهش یافته است (بعد از 1 روز یا 5 روز)واداگر نرخ بازده نام تصویر بیشتر از 0 باشد ، 1 به طور خودکار به انتهای برچسب قبلاً ایجاد شده اضافه می شد. در غیر این صورت ، 0 به طور خودکار اضافه شد. اگر نتیجه بیشتر از 0 باشد ، ارزش به مجموعه داده افزایش قیمت سهام اضافه می شد. اگر کمتر از یا برابر با 0 باشد ، مقدار به مجموعه داده های نزولی قیمت سهام اضافه می شد. داده های آموزش و تأیید به طور تصادفی با نسبت 9: 1 ترتیب داده شد.
4. 2 مدل CNN
در این مقاله ، ساختار مدل CNN با استفاده از KERA ها ساخته شد. KERAS یک ANA ANA ANAD ANN است که پیش بینی قیمت سهام را با ساده ترین کد ممکن امکان پذیر می کند [40]. Keras همچنین می تواند محاسبات را از CPU به شتاب GPU بدون تغییر کد تغییر دهد.
در مرحله یادگیری، یک CNN برای آموزش و آزمایش داده های فوق ساخته شد. CNN ساخته شده (نگاه کنید به شکل 5) شامل یک لایه ورودی (28x28)، 3 لایه پیچشی، 3 لایه تجمع حداکثر، 2 لایه حذف (0. 25، 0. 50)، لایه های کاملا متصل (128)، و یک لایه خروجی است. با کاهش اندازه فیلتر، می توان ویژگی های تصویری با جزئیات بیشتری را ثبت کرد. در این مطالعه، این پارامتر به اندازه فیلتر 3x3 بهینه شد. از آنجایی که لایه های کانولوشن و تلفیقی از واحدهای پایه تشکیل شده اند، تعداد لایه های کانولوشن و اندازه و تعداد هر فیلتر لایه کانولوشن می تواند بر عملکرد CNN تأثیر بگذارد.
یک ساختار شبکه عصبی همانطور که در معادله (3) نشان داده شده است برای عملیات کانولوشن در ساختار CNN تشکیل شد (W وزن، x ورودی، و b بایاس است). در مرحله میانی شبکه از تابع ReLU مانند معادله (4) استفاده شد و در مرحله آخر خروجی با استفاده از softmax به دست آمد.
4. 3 روش شناسی ارزیابی
سپس، اعتبارسنجی متقاطع 10 برابری برای تعیین عملکرد استنتاج برای هر تصویر با مجموعه داده تصویر ایمن شده برای آزمایش و مدل CNN پیکربندی شده انجام شد. در این مرحله، معیارهای ارزیابی برای مقایسه نتایج روش ما با روش های دیگر مورد نیاز است. دقت یک معیار رایج است که برای این منظور استفاده می شود [2،11،12]. در این مقاله از دقت استفاده شده است زیرا در داده های مورد استفاده در این مطالعه مشکل عدم تعادل وجود ندارد. بنابراین، استفاده از اندازه گیری F [7] غیر ضروری است.
4. 4 محیط آزمایشی
برای ایجاد محیط آزمایشی از روش ایپن [41] پیروی کردیم. ما این مدل را با استفاده از زبان برنامه نویسی پایتون (Python 3. 7 در یک محیط سیستم 64 بیتی ویندوز) توسعه دادیم. علاوه بر این، ابزارهای توسعه شامل PyCharm و Anaconda3 بود. Keras برای ساخت ساختار مدل شبکه و چارچوب TensorFlow در پایین استفاده شد. پارامترهای مربوطه در جدول 4 آورده شده است.
ما از RMSE به عنوان معیاری برای عملکرد از دست دادن و تابع فعال سازی استفاده کردیم. اندازه عکس 28*28 بود. علاوه بر این، به جای استفاده از یک CNN استاندارد مانند VGG و AlexNet، اعتبار نتایج خود را روی مجموعه داده های معیار آزمایش کردیم.
ما از کتابخانه های زیر برای عملکردهای مختلف استفاده کردیم:
- Keras [40] ، یک کتابخانه محبوب منبع باز که محققان و مهندسان نرم افزار را قادر می سازد بسیاری از مدلهای یادگیری عمیق را در مدت زمان کوتاهی تعریف و آموزش دهند. از آن برای ایجاد و آموزش شبکه های عصبی استفاده می شود. این یک رابط کاربری ساده برای کتابخانه های موجود مانند Tensorflow [42] فراهم می کند ، که امکان استفاده از GPU ها را برای آموزش و پیش بینی سریعتر فراهم می کند. با استفاده از KERA ها ، می توانیم به آزمایش سریع دست یابیم ، که برای دستیابی به بازخورد روشنگری و بهبود دقت مدل های یادگیری عمیق برای پیش بینی قیمت سهام مهم است. توجه داشته باشید که در Keras نسخه 2. 0 ، معیارهایی مانند فراخوان ، دقت و اندازه F برای ترویج استفاده از دقت به عنوان معیار اصلی CNN هایی که در مجموعه داده های متعادل آموزش دیده اند ، حذف شده اند [40].
- Tensorflow [42] ، پس زمینه برای Keras. این امر پردازش عملیات سطح پایین مانند محصولات تانسور و پیچش را تسهیل می کند. توسط Google تهیه و نگهداری می شود.
- Scikit-Lea [43] برای انجام جستجوی شبکه مدل برای یافتن بهترین پارامترها با استفاده از اعتبار سنجی 10 برابر.
- Matplotlib [44] برای ترسیم نمودارها برای سری زمانی واقعی و همچنین روندهای پیش بینی شده.
- پاندا [45] برای خواندن مقادیر از پرونده های CSV به عنوان dataframes.
- Numpy [46] برای انجام عملیات ماتریس مانند تلنگر و تغییر شکل و ایجاد ماتریس تصادفی. اگرچه الگوریتم های بهینه سازی مختلفی مانند آدم ، آدادلتا و RMSProp وجود دارد ، اما بهینه سازی آدام در مطالعه ما به دنبال پروتکل در یک مطالعه قبلی انتخاب شد [2]. از الگوریتم بهینه سازی ADAM می توان به جای روش کلاسیک SGD برای به روزرسانی وزن شبکه به طور تکراری بر اساس داده های آموزش استفاده کرد [47].
بهینه سازی هایپرپارامتر همچنین بر عملکرد CNN ها تأثیر می گذارد [48،49]. بنابراین یک آزمایش اولیه برای انتخاب هایپرپارامترها برای CNN هایی که بر پیش بینی قیمت سهام تأثیر می گذارند انجام شد. مطابق با مطالعات قبلی [48،50،51] ، در میان لایه های احتمالی احتمالی ، لایه های جمع آوری ، ترک تحصیل و فیلترها ، ما روی تعداد فیلترها و ترکیبی متمرکز شدیم و عملکرد فعال سازی برای هر لایه را به عنوان بیش از حد برای بهبود پیش بینی بررسی کردیم. وادبرای تعیین اینکه آیا شکل ترک و فیلترها بر صحت استنتاج های CNN تأثیر می گذارد ، متغیر ترک تحصیل روی (0. 25. 0. 5) و (0. 5. 0. 5) تنظیم شده است ، و تعداد هسته های همبستگی 3 لایه روی 1،2 تنظیم شده است.، 4) ، (2،4،8) ، (3،6،12) ، (4،8،16) ، (5،10،20) ، (6،12،24) ، (7،14،28) ، (8،16،32) ، (9،18،36) ، (10،20،40) ، (11،22،44) ، (12،24،48) ، (13،26،52)(14،28،56) ، (15،30،60) ، و (16،32،64). با تعیین تعداد فیلترها در این قالب ، ما 960 مورد نمونه در هر تصویر به دست آوردیم. توابع فعال سازی مورد بررسی در پیش آزمون برای بهینه سازی عملکرد فعال سازی در CNN عبارتند از RELU ، ELU ، SELU ، SOFTSIGN ، SOFTPLUS ، RRELU و GELU. در نتیجه آزمایش با ترکیبات مختلف ، دنباله زیر را بدست آوردیم: [ELU ، ELU ، ELU ، SELU]. سپس ما برای ارزیابی عملکرد از اعتبار سنجی 10 برابر استفاده کردیم. الگوریتم 1 توالی تجربی فوق را خلاصه می کند.
الگوریتم 1: روش مدل پیشنهادی
1: رویه سهامدار ()
2: آماده سازی داده های فاز:
3: شرکت = خوانده شده (شرکت لیست ، StockPrice)
4: TrainingDataset = DataSet. Split (تاریخ = 2015 - 2019)
5: testdataset = dataset. split (تاریخ = 2015 - 2019)
6: داده های برچسب زدن فاز:
7: sloperef [1.. N] = محاسبات lopereferences (farfutureValue = 5 ، nearfutureValue = 1)
8: توزیع کلاس (بالا ، پایین) برای مقادیر جداسازی را محاسبه کنید
9: firstseppoint ، secondseppoint = مقادیر جدایی را پیدا کنید (sloperef [1.. N])
10: برای (همه مجموعه داده ها):
11: slopecurrent = calculateEachImagesLope (farfutureValue = 5 ، nearfutureValue = 1)
12: if(slopeCurrent>Secondseppoint):
15: برچسب = 0 ("پایین")
16: برچسب ها و تصاویر را ادغام کنید
17: نمودار نمودار:
18: برای (همه Chartnum):
19: برای (همه شرکت):
20: برای (تمام دوره):
21: ChartProperty = getChartProperty (ChartNum)
22: نمودار = GenerateChart (ChartProperty ، ImageFile)
23: putimage (برچسب ، نمودار)
24: برچسب پیش بینی فاز:
25: مدل = CNN (EPOCHS = 200 ، LeaingRate = 0. 001 ، فعال سازی = ("ترکیب عملکرد فعال سازی" ، "SoftMax")
V. نتایج
5. 1 تفاوت در دقت پیش بینی با توجه به ویژگی های تصویر
در این مطالعه ، داده های قیمت سهام از اول ژانویه 2015 تا 31 دسامبر 2019 در CNN استفاده شد و یادگیری و پیش بینی با تعیین قیمت بسته شدن به عنوان 1 یا 0 بعد از 1 یا 5 روز انجام شد. جدول 5 نتایج حاصل از تجزیه و تحلیل ANOVA را نشان می دهد که تفاوت بین عوامل را با توجه به صحت پیش بینی قیمت سهام مقایسه می کند. نتایج تجزیه و تحلیل تفاوت معنی داری در دقت پیش بینی برای X1 ، X2 ، X4 ، X6 ، X7 ، X8 و X9 نشان داد. با قرار دادن نتایج برای صحت کلی و تجزیه و تحلیل ANOVA ، می بینیم که وقتی از نمودار قیمت سهام به عنوان یک مجموعه داده آموزشی استفاده می شود ، می توان با ترسیم یک خط محکم ، رنگ آمیزی منطقه پایین و استفاده از یک تصویر ، دقت پیش بینی افزایش یافت. بدون علائم محور. بنابراین ، فرضیه 1 تا حدی پشتیبانی شد.
جدول 5. نتایج تجزیه و تحلیل ANOVA از تفاوت در دقت بین پیش بینی قیمت سهام با استفاده از ویژگی های تصویر.
5. 2 نقش واسطه ای فیلتر
برای آزمایش فرضیه 2 ، که بیان می کند ویژگی های فیلتر نقش واسطه ای بین ویژگی های تصویر و دقت پیش بینی قیمت سهام دارند ، تأیید چو با طبقه بندی متغیر فیلتر به دو گروه انجام شد: بزرگ (فیلتر بالا) و کوچک (فیلتر کم). مقدار F (10. 940) از نظر آماری در 5. 223 معنی دار بود. بنابراین ، فرضیه 2 پشتیبانی شد. طبق جدول 6 ، که نتایج تأیید CHOW را نشان می دهد ، متغیرهای X1 و X5 تأثیر مثبتی بر صحت در جمعیت فیلتر کم داشتند ، اما تأثیر منفی در جمعیت فیلتر بالا. علاوه بر این ، متغیر X7 در جمعیت فیلتر کم تأثیر منفی گذاشت ، اما تأثیر مثبتی بر جمعیت فیلتر بالا داشت. هر دو X4 و X6 دقت مثبت را تحت تأثیر قرار داده اند ، اما نتایج نشان می دهد که فیلتر بالا اثر بیشتری نسبت به فیلتر کم دارد. همچنین ، X2 دقت منفی را تحت تأثیر قرار داد ، اما فیلتر بالا اثر بیشتری نسبت به فیلتر کم داشت. X1 و X2 هیچ تاثیری در شرایط کم فیلتر نداشتند ، اما در شرایط فیلتر بالا تأثیر منفی داشتند. متغیر X9 بر دقت تأثیر نمی گذارد ، به این معنی که اندازه فیلتر تنظیم نشده است.
5. 3 اثر واسطه ترک تحصیل
برای تأیید فرضیه 3 ، که بیان می کند که ترک تحصیل به عنوان واسطه بین ویژگی های تصویر و دقت پیش بینی قیمت سهام عمل می کند ، متغیر ترک تحصیل به دو گروه تقسیم شد: (0. 25 ، 0. 5) و (0. 5 ، 0. 5) و تأیید Chow انجام شد. نتایج نشان می دهد که F (10. 940) = 2. 3627 از نظر آماری معنی دار بود. بنابراین ، فرضیه 3 پشتیبانی شد (جدول 7 را ببینید). طبق جدول 7 ، متغیرهای X2 ، X3 و X6 بر Dropout1 یا Dropout2 تأثیر نمی گذارد. مشخص شد که X1 ، X4 ، X7 تأثیر بیشتری در Dropout1 دارد ، X8 فقط در Dropout1 تأثیر معنی داری داشت و X5 و X9 فقط در Dropout2 تأثیر معنی داری داشتند.
5. 4 مقایسه عملکرد
با استفاده از نتایج آزمایش فرضیه در این مطالعه ، ما عملکرد پیش بینی روش خود را با سایر مطالعات مشابه از نظر تصویر نمودار ، فیلتر و ویژگی های ترکیبی بهینه شده برای پیش بینی قیمت سهام مبتنی بر CNN مقایسه کردیم. همانطور که در جدول 8 نشان داده شده است ، دقت روش پیشنهادی در این مطالعه 64. 3 ٪ بود که به طور قابل توجهی بالاتر از مطالعات قبلی بود (52. 1 ٪ -57. 5 ٪).
viبحث
6. 1 پیامدهای
از آنجا که راه هایی برای درک و تجزیه و تحلیل تصاویر از طریق یادگیری عمیق ایجاد می شود ، تحقیقات برای پیش بینی فراز و نشیب قیمت سهام با استفاده از فقط تصویر نمودار قیمت سهام انجام می شود ، نه استفاده از مقدار زیادی از اطلاعات عددی [3-5،10، 30-33] که برای جمع آوری و پردازش زمان و تلاش زیادی می کند [2،11،12]. در این مطالعه ، ویژگی های خاص تصاویر را که تأثیر معنی داری در دقت پیش بینی الگوریتم های یادگیری عمیق دارند ، شناسایی می کنیم.
بیشترین سهم این مطالعه ، تمرکز آن بر روی الگوریتم CNN برای بررسی تأثیر ویژگی های تصاویر نمودار قیمت سهام بر عملکرد پیش بینی است. در حقیقت ، انجام الگوریتم CNN با استفاده از مجموعه داده های تصویر یا مجموعه داده های چند حالته به طور فعال در حوزه های مختلف مانند پزشکی انجام شده است [14]. علاوه بر این ، عملکرد پیش بینی با انتخاب یک روش پیش پردازش مناسب با توجه به دامنه بهبود یافته است [52،53]. با این حال ، تنها چند مطالعه به یک روش پیش پردازش اشاره کرده اند که ویژگی های بهینه تصویر را از قبل برای پیش بینی قیمت سهام انتخاب می کند [54].
در این مطالعه ، ما با استفاده از مقدار نسبتاً زیادی از داده های تصویر با الگوریتم های اساسی برای CNN ها آزمایش کردیم (نمودارهای آموزش: 1،281،173 ، نمودارهای آزمایش: 142،352). نتایج چندین متغیر مهم را نشان داد: نوع نمودار ، استفاده از خطوط نقطه دار یا جامد ، نشانه های منطقه و حضور یا عدم وجود اطلاعات محور. بر اساس نتایج این تجزیه و تحلیل ، ما قصد داریم یک روش بهینه برای تعیین شکل نمودار برای تهیه CNN ها به منظور پیش بینی قیمت سهام تهیه کنیم.
علاوه بر این ، استفاده از CNN با تصاویر نمودار انتخاب شده و مشخص کردن فیلترهای بهینه و ترک تحصیل منجر به دقت پیش بینی بهتر نسبت به سایر مطالعات مشابه شد. این اولین مطالعه ای است که نشان می دهد پیش بینی قیمت سهام به سادگی با مشاهده ویژگی های تصویر یک نمودار امکان پذیر است ، نه با تکیه بر اطلاعات عددی.
در گذشته ، علاوه بر توسعه الگوریتم ها برای بهبود پیش بینی قیمت سهام ، تلاش شده است تا انتخاب ویژگی را بر این فرض بهبود بخشد که کیفیت توصیف داده های ورودی نقش مهمی در عملکرد پیش بینی دارد [20]. این مطالعه از این پیشنهاد پشتیبانی می کند که با توجه به ویژگی های تصویر به بهبود عملکرد پیش بینی کمک می کند.
6. 2 محدودیت ها
اولاً، این مطالعه الگوهای نوسانات قیمت سهام را در نظر نگرفت. در آینده، الگوهای نوسانات قیمت سهام به منظور تعیین دقیق ویژگی های تصویر یا شبکه CNN در بهبود دقت پیش بینی در کدام گروه ها به طور معناداری گروه بندی خواهند شد. دوم، این مطالعه تنها بر روی انصراف و فیلتر در میان ویژگی های شبکه احتمالی CNN متمرکز شد. با این حال، نقاط مختلف دیگری مانند بهینه سازی الگوریتم، تابع فعال سازی و تعداد لایه ها برای مقایسه وجود دارد. برای تمرکز بر ویژگی های تصویر در این مطالعه، برخی از داده ها را از قبل با استفاده از Adam به عنوان الگوریتم بهینه سازی، ReLU به عنوان تابع فعال سازی، و شامل 5 لایه (3 لایه پنهان) از قبل بهینه سازی کردیم. تحقیقات آینده نقش این پارامترهای دیگر را در عملکرد پیش بینی روشن خواهد کرد. سوم، این مطالعه فقط CNN ها را در میان الگوریتم های یادگیری عمیق ممکن در نظر گرفت. اگرچه CNN ها متداول ترین الگوریتم های تشخیص مبتنی بر تصویر هستند و از این رو انتخاب ما برای این مطالعه اول معقول بود، لازم است که سایر الگوریتم های تشخیص تصویر مانند RNN و LSTM را در تحقیقات آینده گسترش و مطالعه کنیم. در آخر، فقط از الگوریتم CNN در آزمایش ما استفاده شد، اما در کارهای آینده، از الگوریتم هایی مانند BI-GRU و LSTM نیز در بین RNN ها استفاده خواهیم کرد. با این حال، اهمیت اصلی این مقاله اثبات آن است که تفاوت در عملکرد الگوریتم های یادگیری عمیق با توجه به ویژگی های تصویر وجود دارد. ما امیدواریم که نتایج تور الهام بخش تحقیقات بیشتر باشد.
6. 3 نتیجه گیری
تصاویر نمودار قیمت سهام منبع اطلاعاتی مهمی برای پیش بینی قیمت سهام هستند. در گذشته، محققان چاره ای جز استفاده از الگوریتم های طبقه بندی سنتی که بر داده های عددی یا متنی تکیه دارند، نداشتند، زیرا هیچ روش پیش پردازش مناسبی برای استفاده از داده های تصویر وجود نداشت. توسعه اخیر الگوریتم های یادگیری عمیق مانند CNN ها، تمایز با استفاده از تصاویر و پیش بینی تنها با استفاده از نمودارهای قیمت سهام را ممکن کرده است. این مطالعه نشان می دهد که تناسب بهینه بین ویژگی های تصویر و ویژگی های الگوریتم وجود دارد. نتیجه (فرضیه 1) نشان می دهد که ما باید ویژگی های تصویر را برای پیش بینی بهتر قیمت سهام بهینه کنیم. ما یک رابطه علی بین ویژگی های تصویر و عملکرد متمایز را به منظور بهبود قابلیت اطمینان و عملکرد پیش بینی مبتنی بر تصویر شناسایی می کنیم. علاوه بر این، نتایج آزمون فرضیه های 2 و 3 نشان می دهد که هنگام انتخاب ویژگی های نمودار سهام، پارامتر فیلتر و انصراف نیز باید با توجه به ویژگی های تصویر تغییر کند.
روش ما از نظر دقت پیش بینی بهتر از روش های قبلی است. از طریق این مطالعه، داده های تصویری ممکن است به طور گسترده به عنوان یک منبع مهم برای هوش تجاری مورد استفاده قرار گیرند. نتایج همچنین نشان می دهد که ممکن است نیازی به تهیه داده های ترکیبی (ترکیب تصاویر و داده های عددی) برای پیش بینی قیمت نباشد. پیش بینی قیمت سهام می تواند حتی در قالب های مختلف سیستم های اطلاعاتی (برنامه های تلفن همراه، SNS مبتنی بر ویدیو، پایگاه های داده تصویر، و غیره) آسان باشد هر جا که فقط تصاویر نمودار در دسترس باشد. اگرچه به نظر می رسد پیش بینی بازار سهام یک حرکت تصادفی است، یک کارشناس قیمت سهام به نمودار قیمت سهام یک شرکت نگاه می کند و پیش بینی می کند که آیا قیمت سهام یک شرکت بر اساس دانش و تجربه خود افزایش یا کاهش می یابد. ما معتقدیم که نتایج آزمون عملکرد در این مقاله می تواند به عنوان نشان دهنده این امکان ارزیابی شود که CNN می تواند دانش کسب کند و تا حدی از دانش ضمنی کارشناسان پیش بینی قیمت سهام با استفاده از نمودارها تقلید کند. این مقاله فرض می کند افرادی که قیمت سهام را تنها با استفاده از نمودارها بدون داده های عددی قیمت سهام پیش بینی می کنند، دانش پیش بینی مبتنی بر تصویر دارند. در این مطالعه، نویسندگان سعی کردند توانایی پیش بینی خود را از طریق یادگیری عمیق تقویت کنند. اگر بتوانید اهمیت این مطالعه را از این طریق درک کنید، خوشحال می شود.
استراتژی ترید...
ما را در سایت استراتژی ترید دنبال می کنید
برچسب :
نویسنده : مرجان شیرمحمدی
بازدید : 54
تاريخ : سه
شنبه
15 فروردين
1402 ساعت: 16:39