آمار مقدماتی برای استراتژی های معاملاتی (بخش دوم): توزیع احتمال

در این سری از مقالات قصد داریم که خوانندگان مان را ترغیب کنیم تا شروع به استفاده از آمار و تحلیل داده در هنگام معامله کنند. در مقاله اول، ما در مورد آماره های خلاصه کننده داده ها مانند میانگین، انحراف معیار، نوسان و باندهای بولینگر صحبت کردیم.

در این مقاله، ما به دنبال درک “توزیع داده ها” هستیم. همچنین به این سوال اساسی پاسخ خواهیم داد که “چرا علم آمار برای ساخت استراتژی ضروری است؟”

در این مقاله، ما از R استفاده خواهیم کرد زیرا دارای توابع آماری داخلی برای تحلیل آسان می باشد. شما می توانید R-studio را روی سیستم خودتان دانلود و نصب کنید.

ما همچنان بر روی دیتاست استفاده شده در مقاله قبلی کار می کنیم: داده های روزانه سهام MARUTI SUZUKI از تاریخ ۱ ژانویه ۲۰۱۳ تا ۳۱ دسامبر ۲۰۱۳٫

هیستوگرام (Histogram)

اگر ما قیمت های پایانی را به صورت هیستوگرام و یا توزیع فراوانی رسم کنیم، نمودار زیر، چیزی است که مشاهده خواهیم کرد. اساسا این نمودار، تعداد دفعاتی که قیمت، در بازه های مختلفی (۱۲۰۰-۱۳۰۰ , ۱۳۰۰-۱۴۰۰ , …) بوده است را ترسیم کرده:

R codes

 

 

 

این نمودار به شما چه می گوید؟

این نمودار به ما می گوید که قیمت های پایانی سهام  Maruti در سال ۲۰۱۳ بین ۱۲۰۰ و ۱۸۰۰ قرار داشته، که تقریبا ۵۰% مواقع بین ۱۴۰۰ و ۱۶۰۰ بوده. شکل توزیع نیز تقریبا نرمال یا زنگوله ای شکل و با میانگین ۱۵۰۰ است.

توزیع نرمال

هرگاه توزیع داده های شما دارای مشخصات خاصی باشد، مثلا تقارن در اطراف میانگین و شکل زنگوله مانند، می گوییم داده های شما دارای توزیع نرمال است.

به بیان آماری، اگر X دارای توزیع نرمال با میانگین  μ و انحراف معیار σ باشد، می نویسیم:

که در آن μ و σ پارامترهای توزیع هستند.

چرا دانستن تابع توزیع داده های شما مفید است؟

اگر بدانید که نمونه داده های شما مثلا دارای توزیع نرمال است، می توانید با “سطح اطمینان” مشخصی، در مورد جامعه خود، “پیش بینی” داشته باشید.

برای مثال، X نشان دهنده نمرات کسب شده در آزمون ورودی برای نمونه ای از دانشجویان می باشد که از ۱۰۰ درنظر گرفته می شود. داده ها دارای توزیع نرمالی هستند. وقتی داده ها را رسم کنیم، شکل زیر حاصل می شود:

R codes

اگر شما تعداد مشاهدات تان را در دیتاست از ۱۰۰ به ۱۰۰۰ افزایش دهید، نمودار زیر آن چیزی است که مشاهده خواهید کرد:

شکل نمودار بیشتر شبیه به زنگوله می شود!

اکنون که ما می دانیم، X دارای توزیع نرمال با میانگین ۵۰ و انحراف معیار ۱۰ است، می توانیم نمرات همه دانشجویان جامعه و یا دانشجویان آینده (از همان جامعه) را با یک سطح اطمینان مشخص پیش بینی کنیم. با اطمینان تقریبا ۹۹٫۷% می توانیم بگوییم که دانشجویان نمراتی کمتر از ۲۰ و یا بیشتر از ۸۰ نمی گیرند. با اطمینان ۹۵% می توانیم بگوییم که دانشجویان نمراتی بین ۳۰ و ۷۰ کسب خواهند کرد.

منبع تصویر: http://en.wikipedia.org/wiki/Normal_distribution

به بیان آماری، تابع توزیع، احتمال اینکه انتظار داشته باشیم مقدار یک مشاهده، بین دو نقطه قرار گیرد را به ما نشان می دهد. در نتیجه با استفاده از توابع توزیعی، که توابع چگالی احتمال نیز نامیده می شوند، می توانیم با “سطح اطمینان” مشخصی “پیش بینی” انجام دهیم.

آیا قیمت های پایانی دارای توزیع نرمال هستند؟

یک آزمون ساده به نام نمودارهای Normal Quantile-Quantile به ما کمک می کند که بفهمیم آیا یک مجموعه مشاهدات تقریبا دارای توزیع نرمال هستند یا خیر. نمودار نرمال qq منجر به یک خط تقریبا مستقیم می شود. برای قیمت های پایانی،  qqline تقریبا یک خط راست است:

این یک برازش کامل روی داده ها نیست و تا حدودی می توانیم بگوییم که قیمت ها دارای توزیع نرمال هستند.

R codes

بازده لگاریتمی در مقابل بازده ساده

اکنون که با توابع توزیع آشنا شدیم، بیایید نگاهی به بازده های لگاریتمی که در مدلسازی مالی محاسبه و مورد استفاده هستند بیندازیم. بازده های لگاریتمی یا بازده های مرکب پیوسته، معمولا در مقابل بازده های ساده برای محاسبات مالی استفاده می شوند. یکی از دلایل اصلی برای این کار، آسانی محاسبات ضربی مقادیر لگاریتمی است. می دانیم که:

برای پیدا کردن بازدهی های تجمعی در یک بازه زمانی مشخص، به راحتی می توان بازده های لگاریتمی روزانه را با هم جمع کرد.

دلیل دیگر برای انتخاب بازده های لگاریتمی نسبت به بازده های ساده آنست که وقتی فرض می کنیم قیمت ها از یک توزیع لاگ نرمال تبعیت می کنند، آنگاه بازده های لگاریتمی از توزیع نرمال تبعیت خواهند کرد. این فرض در هنگام کار با آمار کلاسیک،که مبتنی بر شرط نرمال بودن است، مفید می باشد.

با رسم بازده ها برای قیمت های پایانی دیتاست، نمودار زیر مشاهده می شود. این نمودار نشان می دهد که بازده های لگاریتمی داده های ما، با مسامحه، منطبق بر شروط نرمال بودن هستند.

برای جمع بندی، باید اشاره کرد که آمار در هر قدم تحلیل تکنیکال مورد استفاده است و هسته مرکزی تحلیل های کمّی می باشد. این تحلیل ها، سازنده بخش مرکزی هر پروسه ساخت استراتژی هستند.

گام بعدی

در مقاله سوم از این سری، تلاش خواهیم کرد رابطه بین یک سهم و شاخص بازار را درک کنیم. مفاهیمی که یاد خواهیم گرفت شامل “رگرسیون”، “همبستگی ” و “هم جمعی” خواهند بود.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *