مقاله تخمین مدل و استنتاج آماری

37 بازدید

تخمین مدل و استنتاج آماری

مقدمه:
تخمین مدل و استنتاج آماری از بنیادی ترین محورهای تحلیل داده در علوم اقتصادی، اجتماعی و مهندسی به شمار می رود. هر مجموعه داده، بازتابی از یک ساختار پنهان است که در قالب یک فرآیند تصادفی شکل گرفته و آنچه در دسترس قرار می گیرد تنها یک مصداق محدود از آن فرآیند است. تحلیل گر با تکیه بر همین مصداق محدود، به دنبال بازسازی ویژگی های ساختاری فرآیند زیرساختی است؛ فرآیندی که قواعد تولید داده را تعیین می کند. در این مسیر، تخمین پارامترهای مدل و سپس استنتاج درباره رفتار کلی سیستم، به هم پیوسته و تفکیک ناپذیرند.

در تحلیل آماری، مفهوم جامعه و نمونه تنها به داده های مقطعی محدود نمی شود. در داده های سری زمانی نیز می توان هر دنباله مشاهده شده را نمونه ای از یک فرآیند تصادفی دانست. همان گونه که در داده های مقطعی، ویژگی های جامعه از روی نمونه برآورد می شود، در سری های زمانی نیز رفتار فرآیند تصادفی از طریق مشاهده یک مسیر تحقق یافته آن مورد بررسی قرار می گیرد. این نگاه، پایه اصلی تخمین مدل است: مدلی که نه صرفاً برای توصیف داده های موجود، بلکه برای بازنمایی سازوکار تولید داده در طول زمان ساخته می شود.

پیش از هر تلاش برای تخمین، باید به ویژگی های بنیادی سری زمانی توجه کرد. یکی از مهم ترین این ویژگی ها، ایستایی یا ساکن بودن سری است. ایستایی به معنای آن است که خصوصیات آماری اصلی داده، وابسته به زمان نباشند. اگر میانگین، واریانس و ساختار همبستگی یک سری در طول زمان تغییر نکند، می توان گفت رفتار آن در مقاطع مختلف، از یک الگوی پایدار پیروی می کند. این پایداری، شرط اساسی برای اعتبار بسیاری از مدل های آماری است؛ زیرا تخمین پارامترها زمانی معنا دارد که همان پارامترها در طول زمان ثابت باقی بمانند.

در چارچوب نظری، یک سری زمانی ایستا دارای میانگین ثابت، واریانس ثابت و کوواریانس وابسته تنها به فاصله زمانی بین مشاهدات است، نه به زمان مطلق وقوع آنها. به بیان دیگر، تفاوتی نمی کند که همبستگی بین Yt و Yt-k در چه مقطعی محاسبه شود؛ اگر سری ایستا باشد، این مقدار همواره یکسان خواهد بود. چنین تعریفی تضمین می کند که رفتار آماری سری، در گذشته و آینده مشابه است و می توان از داده های تاریخی برای استنتاج درباره دوره های بعدی استفاده کرد.

برای تشخیص ایستایی، ابزارهای متعددی به کار می رود که یکی از ساده ترین آنها تابع خودهمبستگی است. تابع خودهمبستگی نشان می دهد که مقدار سری در یک زمان، تا چه حد با مقادیر آن در وقفه های زمانی مختلف مرتبط است. اگر این همبستگی ها به سرعت کاهش یابند و در اطراف صفر نوسان کنند، نشانه ای از رفتار ایستا است. در مقابل، باقی ماندن ضرایب خودهمبستگی در مقادیر بالا حتی در وقفه های زیاد، معمولاً به غیرایستایی اشاره دارد.

از آنجا که در عمل تنها یک تحقق از فرآیند تصادفی در اختیار است، خودهمبستگی به صورت نمونه ای محاسبه می شود. این ضرایب نمونه ای خود دارای نوسان تصادفی هستند و برای تفسیر آنها باید به توزیع احتمالی شان توجه کرد. نتایج کلاسیکی مانند قضیه بارتلت نشان می دهد که برای سری های کاملاً تصادفی، ضرایب خودهمبستگی نمونه تقریباً دارای توزیع نرمال با میانگین صفر و واریانسی وابسته به حجم نمونه هستند. بر این اساس می توان حدود اطمینان ساخت و بررسی کرد که آیا ضرایب مشاهده شده به طور معناداری با صفر تفاوت دارند یا نه.

علاوه بر روش های مبتنی بر نمودار و خودهمبستگی، آزمون های رسمی تری نیز برای بررسی ایستایی به کار می روند که مهم ترین آنها آزمون ریشه واحد است. ایده اصلی این آزمون بر پایه مدل های خودرگرسیونی شکل گرفته است. در ساده ترین حالت، اگر مقدار یک متغیر در زمان t برابر با مقدار آن در زمان t-1 به اضافه یک جزء تصادفی باشد، رفتار متغیر به شدت به گذشته وابسته می شود. در چنین حالتی، شوک های تصادفی اثر دائمی دارند و از بین نمی روند؛ ویژگی ای که مشخصه سری های غیرایستا است.

وجود ریشه واحد در مدل، به این معناست که ضریب متغیر وقفه دار برابر یک است. این وضعیت، مرز بین پایداری و ناپایداری را نشان می دهد. اگر این ضریب کمتر از یک باشد، اثر شوک ها به تدریج مستهلک می شود و سری به میانگین بلندمدت خود بازمی گردد. اما اگر برابر یک باشد، شوک ها انباشته می شوند و مسیر سری را به طور دائمی تغییر می دهند. آزمون های ریشه واحد دقیقاً برای تشخیص این وضعیت طراحی شده اند و نقش کلیدی در تصمیم گیری درباره نوع مدلی دارند که باید تخمین زده شود.

پس از تعیین وضعیت ایستایی، نوبت به انتخاب ساختار مناسب مدل می رسد. مدل های سری زمانی مانند AR، MA و ARMA هر یک بر اساس فرض هایی درباره وابستگی زمانی داده ها ساخته می شوند. انتخاب مرتبه مناسب این مدل ها، وابسته به تحلیل رفتار خودهمبستگی و خودهمبستگی جزئی است. تخمین پارامترهای این مدل ها معمولاً با روش هایی مانند حداقل مربعات یا حداکثر درست نمایی انجام می شود که هر کدام مفروضات خاص خود را دارند.

تخمین تنها مرحله میانی است؛ زیرا پس از آن باید به استنتاج آماری پرداخت. استنتاج شامل آزمون فرضیه درباره پارامترها، ساخت فاصله های اطمینان و ارزیابی معناداری آماری روابط است. این مرحله تعیین می کند که کدام روابط واقعی و پایدارند و کدام یک حاصل نوسانات تصادفی نمونه اند. در تحلیل سری های زمانی، این استنتاج به دلیل وابستگی زمانی مشاهدات، حساس تر و پیچیده تر از داده های مقطعی است.

پیوند بین تخمین مدل و استنتاج آماری، جوهره تحلیل آماری را می سازد. تخمین بدون استنتاج، تنها ارائه چند عدد است و استنتاج بدون تخمین، فاقد پایه کمی. در داده های سری زمانی، این پیوند با مسئله ایستایی گره خورده است؛ زیرا تنها در صورت شناخت درست رفتار آماری سری، می توان مدلی معنادار ساخت و درباره پارامترهای آن قضاوت آماری انجام داد. هر گام از این فرایند، بر گام قبل تکیه دارد و کوچک ترین خطا در تشخیص ویژگی های اولیه داده، می تواند کل زنجیره تحلیل را دچار انحراف کند.

قیمت محصول
48,000 62,338 تومان
23% تخفیف
تعداد صفحات
22
فرمت فایل
WORD
تضمین بازگشت وجه در صورت عدم رضایت