تنوع ویژگی جایگزین آنتروپی توزیع

ویژگی جایگزین ویژگی است که برخی از واحدها دارند و بخشی دیگر از جمعیت فاقد آن هستند.

پراکندگی برابر است با حاصلضرب سهم ( آر) با عدد تکمیل کننده این کسر به یک ( q):

که در آن p نسبت واحدهایی است که دارای یک ویژگی هستند.

q نسبت واحدهایی است که ویژگی ندارند.

مقدار محدود واریانس ویژگی جایگزین 0.25 است وقتی آر = 0,5.

مثال 6.1. از 200 دانشجوی دانشکده - 60 نفر. - ناموفق

نسبت دانش‌آموزان کم‌موفق p=60/200=0.3 است

سهم دانش آموزان موفق برابر است با q = 1 – 0.3 = 0.7

واریانس سهم = 0.3 0.7 = 0.21 است

مثال 6.2. محاسبه بر روی داده های گروه بندی نشده داده هایی در مورد تجربه 10 کارگر وجود دارد - 1، 2، 3، 3، 4، 4، 5، 7، 9، 12. شاخص های تغییرات را محاسبه کنید.

بیایید یک کاربرگ برای محاسبه درست کنیم.

شماره کارگر	تجربه، سالها ( x i)		ایکس 2
		-4
		-3
		-2
		-2
		-1
		-1




جمع

تجربه متوسط است سال ها.

تنوع دهانه آر= 12-1 = 11 ساله.

سپس انحرافات از میانگین را محاسبه می کنیم , و

میانگین انحراف خطی سال ها.

پراکندگی

میانگین مربعات

روش دوم محاسبه واریانس = 35.4 - 5 2 = 10.4

از سال

ضریب تغییرات V= 3.22 / 5 = 0.645 یا 64.5٪

V d= 2.6 / 5 = 0.520 یا 52.0٪.

مثال 6.3. محاسبه با سری تغییرات بازه.

اطلاعاتی در مورد توزیع کارگران بر اساس حقوق وجود دارد

راه حل: بیایید یک کاربرگ برای محاسبه درست کنیم.

حقوق	f	وسط فاصله ( ایکس)	x i f i
به 10				-21
10–20				-11
20–30				-1
30–40
40 یا بیشتر
جمع

میانگین درامد هزار روبل

میانگین انحراف خطی هزار روبل

پراکندگی

انحراف معیار هزار روبل

ضریب تغییرات V= 12.45 / 26 = 0.479 یا 47.9٪

ضریب تغییرات خطی: V d= 10.36 / 26 = 0.398 یا 39.8٪.

انواع پراکندگی

واریانس کل s 2تغییرات ویژگی حاصل را اندازه گیری می کند ( y) در مجموع تحت تأثیر همه عوامل ( ایکس 1 , ایکس 2 , ایکس 3 ...) که باعث این تنوع شد.

واریانس بین گروهیتنوع سیستماتیک را مشخص می کند، یعنی. تفاوت در ارزش صفت مورد مطالعه که تحت تأثیر عامل صفت ( ایکس) زیربنای گروه بندی. طبق فرمول محاسبه می شود

کجا ` y منو n من- میانگین و اعداد گروهی به ترتیب برای گروه های فردی.

واریانس درون گروهی() منعکس کننده تغییرات تصادفی است، به عنوان مثال، بخشی از تغییراتی که تحت تأثیر عوامل نامشخص رخ می دهد و به عامل ویژگی زیربنای گروه بندی بستگی ندارد. به صورت زیر محاسبه می شود:

میانگین پراکندگی درون گروهی ():

قانون مربوط به سه نوع پراکندگی وجود دارد. واریانس کل برابر است با مجموع میانگین واریانس های درون گروهی و بین گروهی:

در تجزیه و تحلیل آماری از شاخصی استفاده می شود که سهم واریانس بین گروهی در کل واریانس است. به آن ضریب تعیین تجربی می گویند:

این ضریب نسبت (وزن مخصوص) کل تغییرات صفت مورد مطالعه را به دلیل تنوع صفت گروه بندی نشان می دهد.

جذر ضریب تعیین تجربی را نسبت همبستگی تجربی می نامند. ساعت):

این تأثیر ویژگی زیربنایی گروه بندی را بر تغییر ویژگی حاصل مشخص می کند. نسبت همبستگی تجربی از 0 تا 1 متغیر است ساعت= 0، سپس صفت گروه بندی بر روی نتیجه تأثیر نمی گذارد. اگر ساعت= 1، سپس ویژگی حاصل فقط بسته به ویژگی زیربنایی گروه بندی تغییر می کند و تأثیر سایر ویژگی های عامل برابر با صفر است. مقادیر میانی با توجه به نزدیکی آنها به مقادیر حدی ارزیابی می شوند.

مثال 6.4. داده هایی در مورد گروهی از کارگران وجود دارد.

قدرت رابطه بین ویژگی ها را ارزیابی کنید.

راه حل: میانگین های گروهی و واریانس های درون گروهی آورده شده است.

میانگین کلی را با استفاده از میانگین های گروه تعیین کنید

میانگین واریانس های درون گروهی

واریانس بین گروهی

واریانس کل س 2 =6,955 + 34,65 = 41,605

ضریب تعیین تجربی

34,65 / 41,605 = 0,833

رابطه همبستگی تجربی

چنین مقداری (نزدیک به 1) رابطه بسیار قوی بین تعداد ماشین‌های سرویس‌دهی شده و متوسط حقوق را مشخص می‌کند.

6. پراکندگی یک ویژگی جایگزین

یک مورد خاص از یک علامت اسنادی (غیر کمی) یک علامت جایگزین است. زمانی که واحدهای یک جمعیت یا دارای یک صفت مورد مطالعه هستند یا آن را ندارند. نمونه ای از این علائم عبارتند از: وجود محصولات معیوب، مدرک تحصیلی از معلمان دانشگاه، کار در تخصص دریافت شده، مازاد بر میانگین درآمد نقدی سرانه در سطح روسی آنها، وجود فرزندان در خانواده و غیره. .

اگر یک ویژگی جایگزین وجود داشته باشد، به واحد جمعیت مقدار "1" اختصاص داده می شود. در صورت عدم حضور - "0".

اوزان در محاسبات عبارتند از:

نسبت واحدهای دارای این ویژگی؛

نسبت واحدهایی که این ویژگی را ندارند

سپس مقدار متوسط ویژگی جایگزین است:

پراکندگی به شکل زیر خواهد بود:

واریانس ویژگی جایگزین از 0 تا 0.25 متغیر است. حداکثر مقدار 0.25 به 0.5 می رسد

مثال 4.11. در یک نظرسنجی انتخابی از 300 نفر از ساکنان کورسک، 60 نفر از آنها در مورد حفظ پس انداز پول شخصی در بانک های تجاری شهر صحبت مثبت کردند.

سطح میانگین، واریانس و انحراف معیار یک ویژگی را تعیین کنید

کاربرد عملی تنوع یک ویژگی جایگزین عمدتاً در ساخت فواصل اطمینان در طول نمونه‌برداری است.

7. بررسی شکل توزیع صفت. ویژگی های اصلی الگوهای توزیع

یک شرط ضروری برای موفقیت ساخت‌وسازها، محاسبات و نتیجه‌گیری‌های مبتنی بر سری‌های متغیر، همگنی مصالح تعمیم‌یافته در آنها است که بر اساس تحلیل نظری عمیق ایجاد شده است.

ترتیب تغییر فرکانس به وضوح بیان شده مطابق با تغییر در مقدار یک ویژگی، الگوی توزیع نامیده می شود.

آگاهی از نوع الگوی توزیع (و در نتیجه شکل منحنی) قبل از هر چیز ضروری است:

1. برای روشن کردن شرایط معمول برای به دست آوردن مواد آماری اولیه. بنابراین، ظهور یک منحنی چند راس یا به طور قابل توجهی نامتقارن نشان دهنده ترکیب ناهمگن جمعیت و نیاز به گروه بندی مجدد داده ها به منظور شناسایی گروه های همگن بیشتر است.

2. اطمینان از صحت اجرای محاسبات و پیش بینی های عملی. بنابراین، استفاده از فرمول G. Sturgess برای محاسبه تعداد بهینه گروه ها در یک سری بازه ای، قانون "سه سیگما"، ضریب تغییرات Vσ به عنوان شاخص همگنی جمعیت، روش حداقل مربعات در مدل سازی همبستگی پدیده‌ها، روش‌های تحلیل واریانس و غیره فقط در شرایط نرمال و توزیع‌های نزدیک به آن معتبر است.

الگوهای سری تغییرات، که در نوع توزیع فرکانس آنها بیان می شود، به وضوح در نمودارها - هیستوگرام و چند ضلعی توزیع فرکانس ظاهر می شود. بررسی آنها نشان می دهد که در هیستوگرام یک ناپیوستگی زیادی در توزیع وجود دارد و در چند ضلعی یک انتقال تدریجی از یک گروه به گروه دیگر وجود دارد. خط شکسته چند ضلعی تا حدی پرش هیستوگرام را صاف می کند و روش کلی تری برای تحلیل توزیع است.

با افزایش خطوط سری تغییرات بازه ای و کاهش متناظر در اندازه فواصل آن، تعداد اضلاع چند ضلعی توزیع افزایش می یابد و خط شکسته تمایل دارد تا به منحنی خاصی در حد تبدیل شود. چنین منحنی منحنی توزیع نامیده می شود. در آن، بیشترین انتشار داده ها از تأثیر عوامل تصادفی رخ می دهد. ماهیت تغییرات، منظم بودن توزیع فرکانس ها در یک مجموعه تک کیفی از پدیده ها را آشکار و به کلی ترین شکل نشان می دهد.

منحنی های توزیع می توانند انواع مختلفی داشته باشند. در عمل تحقیقات اجتماعی-اقتصادی، منحنی توزیع نرمال به طور گسترده ای استفاده می شود. این یک شکل متقارن زنگی شکل تک راس است که شاخه های راست و چپ آن به طور یکنواخت و متقارن کاهش می یابد و مجانبی به محور آبسیسا نزدیک می شود.

از ویژگی های بارز این منحنی، همزمانی میانگین حسابی، مد و میانه در آن است. اگر کل مساحت بین منحنی و محور x 100٪ در نظر گرفته شود، 68.3٪ فرکانس ها در محدوده، 95.4٪ در محدوده، و 99.7٪ در محدوده هستند ("قانون سه سیگما") .

اگرچه توزیع نرمال یا متقارن با ماهیت تعدادی از پدیده ها مطابقت دارد، اما مشخصه پدیده های اجتماعی نیست، زیرا منعکس کننده تفاوت های ناشی از تأثیرات خارجی است که نه در یک واحد در حال توسعه، بلکه فقط در یک مجموعه نوسانی از واحدها ذاتی است. پدیده های اجتماعی با توسعه و پویایی مشخص می شوند. بنابراین، سری ها و منحنی های توزیع فرکانس های پدیده های اجتماعی، به طور معمول، نامتقارن هستند، که در آن فرکانس ها به حداکثر افزایش می یابند و از آن به طور ناهموار کاهش می یابند. وجود عدم تقارن یا چولگی در مجموعه‌ای از دانه‌های همگن است که به عنوان یک نشانه غیرمستقیم نشان می‌دهد که فرآیند مورد مطالعه در حال گذراندن مرحله فعال توسعه است.

سری های نامتقارن و منحنی های مربوطه دارای اشکال مختلفی از توزیع هستند که توسط آمار ریاضی بررسی می شوند. چنین اشکالی عبارتند از توزیع پواسون، توزیع ماکسول، توزیع پیرسون و غیره. در اینجا عدم تقارن به طور کلی به عنوان یک نوع توزیع در نظر گرفته می شود. در عین حال، عدم تقارن سمت راست و سمت چپ (مورب) متمایز می شود.

اگر شاخه بلند منحنی در سمت راست بالا قرار داشته باشد، عدم تقارن را راست دست می نامند، اگر این شاخه در سمت چپ بالا قرار دارد - چپ دست. با عدم تقارن سمت راست با سمت چپ. بنابراین، تفاوت بین آنها، ضریب K. Pearson نامیده می شود و به عنوان ضریب عدم تقارن استفاده می شود:

. (20)

با عدم تقارن سمت راست، این ضریب مثبت و با سمت چپ منفی است. اگر = 0، سری تغییرات متقارن است. هر چه مقدار مطلق ضریب بیشتر باشد، درجه چولگی بیشتر است.

دقیق ترین شاخص چولگی توزیع، ضریب چولگی است که با فرمول محاسبه می شود

(21)

که در آن n تعداد واحدهای جمعیت است. همانطور که در مورد ضریب پیرسون، در > 0 یک عدم تقارن سمت راست وجود دارد، در< 0 левосторонняя. В симметричных распределениях = 0.

هر چه مقدار || بزرگتر باشد، توزیع نامتقارن تر است. مقیاس ارزیابی عدم تقارن زیر ایجاد شده است:

|| - عدم تقارن جزئی؛

0,25 < || - асимметрия заметная (умеренная);

|| > 0.5 - عدم تقارن قابل توجه.

از آنجایی که ضرایب و مقادیر نسبی بدون بعد هستند، اغلب برای تحلیل مقایسه ای عدم تقارن سری های توزیع مختلف استفاده می شوند.

ماهیت عدم تقارن گاهی نشان دهنده جهت توسعه است. هنگام مطالعه تنوع صفاتی که علاقه به افزایش آنها وجود دارد (تحقق هنجارها، خروجی محصولات و غیره)، عدم تقارن سمت راست نشان دهنده پیشروی توسعه است، که در جهت افزایش نشانگر و عدم تقارن سمت چپ نشان دهنده وجود تعداد زیادی از مناطق عقب مانده است.

هنگام مطالعه تنوع ویژگی هایی که علاقه به کاهش آنها وجود دارد (هزینه، شدت کار، مصرف مواد خام در واحد خروجی و غیره)، عدم تقارن سمت راست نشان دهنده کاستی در توسعه فرآیند تحت در مطالعه، عدم تقارن سمت چپ نشان دهنده پیشروی توسعه آن است، که دومی در جهت کاهش شاخص پیش می رود. در توزیع کارمندان بر اساس طول خدمت (نگاه کنید به مثال 4.9 \u003d 5.75)، عدم تقارن سمت راست مشاهده می شود، زیرا ضریب عدم تقارن مثبت است: (5.955-5.75): 2.47 \u003d 0.095. چنین عدم تقارن برای این سری پیشرونده است، نشان دهنده توسعه سری در جهت افزایش شاخص مورد مطالعه است.

شکل توزیع را می توان به طور آزمایشی مستقیماً با در نظر گرفتن داده های تجربی سری تعیین کرد، به خصوص اگر آنها با یک هیستوگرام و یک چند ضلعی به تصویر کشیده شوند. برای تأیید صحت تعریف تقریبی فرم توزیع، داده‌های تجربی سری برای نزدیکی آنها به توزیع نظری، که با ساخت منحنی توزیع مربوطه ایجاد شده است، بررسی می‌شوند. با این حال، در بسیاری از موارد، نه تئوری و نه بررسی مستقیم داده‌های تجربی پاسخی به سؤال در مورد شکل توزیع نمی‌دهند. سپس معمولاً مطالعه ای در مورد نزدیکی داده های تجربی به توزیع نرمال انجام می شود، زیرا توزیع هایی با عدم تقارن خفیف یا متوسط در اکثر موارد از نوع نرمال هستند.

برای قضاوت عینی در مورد میزان مطابقت توزیع تجربی با توزیع نرمال، آمار از تعدادی معیار به نام معیارهای توافق یا مطابقت استفاده می کند.

اینها شامل معیارهای پیرسون، رومانوفسکی، یاسترمسکی، کولموگروف بر اساس استفاده از مفاهیم مختلف نظری است.

به عنوان مثال، بیشترین استفاده از تست نیکویی تناسب پیرسون ("chi-square") توسط:

, (22)

فرکانس های تجربی (فرکانس ها) کجا هستند

فرکانس های نظری (فرکانس ها)

برای ارزیابی نزدیکی توزیع تجربی به توزیع نظری، احتمال دستیابی به این مقدار با این معیار تعیین می شود. اگر این احتمال از 0.05 تجاوز کند، انحراف فرکانس های واقعی از فرکانس های نظری تصادفی، ناچیز در نظر گرفته می شود. اگر، انحرافات قابل توجه در نظر گرفته می شوند و توزیع تجربی اساساً با توزیع نظری متفاوت است.

برای مشخص کردن درجه انحراف توزیع متقارن از نرمال، شاخص کشش محاسبه می شود. تقریباً می توان با استفاده از ضریب لیندبرگ تعیین کرد.

, (23)

نسبت (در درصد) تعداد گزینه هایی که در فاصله زمانی قرار دارند برابر با نصف انحراف معیار (در هر جهت از مقدار متوسط) در تعداد کل گزینه های این سری است.

38.29 - نسبت (در درصد) تعداد گزینه هایی که در فاصله ای برابر با نصف انحراف معیار (در هر جهت از مقدار متوسط) در تعداد کل گزینه ها برای یک سری توزیع نرمال قرار دارند.

کشیدگی می تواند مثبت، منفی یا صفر باشد.

برای منحنی های راس بالا، شاخص کشیدگی دارای علامت مثبت و برای منحنی های راس پایین دارای علامت منفی است. برای منحنی توزیع نرمال، مقدار آن صفر است.

برای توصیف دقیق تر درجه انحراف توزیع متقارن از نرمال، شاخص قله (شاخص کورتوز) (Ek) با استفاده از فرمول محاسبه می شود:

(24)

این ضریب مانند ضریب لیندبرگ می تواند مثبت، منفی یا صفر باشد. شاخص کشش مانند نشانگر عدم تقارن یک عدد انتزاعی است. مقدار محدود کننده کشش منفی مقدار Ek= -2 است. بزرگی کشیدگی مثبت یک قدر بی نهایت است.

تعریف شاخص های عدم تقارن و کشیدگی نه تنها ارزش توصیفی دارد، بلکه اغلب مقادیر آنها نشانه های خاصی برای تحقیقات بیشتر در مورد پدیده های مورد مطالعه ارائه می دهد. بنابراین، برای مثال، ظهور یک کشش منفی قابل توجه ممکن است نشان دهنده ناهمگنی کیفی جمعیت مورد مطالعه باشد.

فن‌آوری‌های کامپیوتری مدرن، فرصت‌های گسترده‌ای را برای انجام عملیات محاسباتی دست و پا گیر برای تجزیه و تحلیل سری‌های متغیر باز می‌کنند. اگر مطالب از نظر تئوری درک شود و یک فرضیه معقول در مورد شکل توزیع ارائه شود (به هر حال، رایانه ها نیز قادر به بررسی هستند)، دستگاه های محاسباتی می توانند به سرعت شاخص ها و معیارهای تعمیم دهنده مختلف را محاسبه کنند، نمودارها را بسازند و غیره. این امر بیشتر امکان پذیر است، زیرا شاخص های تغییرات نسبتاً ساده و به خوبی رسمیت یافته اند.

فهرست ادبیات استفاده شده

1. Vinogradova N.M.، Evdokimova V.T.، Khitarova E.M. و همکاران نظریه عمومی آمار: کتاب درسی / ویرایش. آی.جی. Venetsky / - M.: آمار، 1968 - 380s

2. گوساروف ویکتور ماکسیموویچ. آمار: Proc. کتابچه راهنمای دانشجویان دانشگاه هایی که در تخصص های اقتصادی تحصیل می کنند / V.M. گوساروف، E.I. کوزنتسوا - ویرایش دوم، تجدید نظر شده. و اضافی - M.: UNITI-DANA، 2007.- 479s

3. گوساروف، ویکتور ماکسیموویچ. نظریه عمومی آمار: Proc. کتابچه راهنمای دانشجویان دانشگاه هایی که در تخصص های اقتصادی تحصیل می کنند / V.M. گوساروف، اس.م. توسعه - ویرایش دوم، تجدید نظر شده. و اضافی – M.: UNITI-DANA، 2008.- 207s

4. ایلیشف آناتولی میخایلوویچ. تئوری عمومی آمار: کتاب درسی برای دانشجویانی که در رشته های اقتصاد و مدیریت تحصیل می کنند / A.M. Ilyishev، - M.: UNITI-DANA، 2008. - 535s

5. Ryauzov N.N. نظریه عمومی آمار: کتاب درسی برای دانش آموزان. اقتصاد متخصص. دانشگاه ها - ویرایش چهارم. تجدید نظر شده است و اضافی - M.: امور مالی و آمار، 1984.- 343s

6. Salin V.N., Churilova E.Yu. درس تئوری آمار برای تربیت متخصص در مشخصات مالی و اقتصادی: کتاب درسی. - M.: امور مالی و آمار، 2006 - 480s

7. روش های آماری تحلیل عوامل افزایش کارایی تولید اجتماعی. آموزش. اد. Ryauzova N.N. Akinshina M.K. - M. VZFEI. دهه 88-1980

8. آمار: Proc. کمک هزینه / A.V. باگات، م.م. کونکینا، V.M. سیمچر و دیگران؛ اد. V.M. سیمچری. - M.: امور مالی و آمار، 2005.- 368s

9. آمار. کار آزمایشگاه کامپیوتری: راهنمای کار آزمایشگاهی شماره 1 "تحلیل پیشینی خودکار جامعه آماری در MS Excel." / G.P. کوژونیکوا، A.V. گولیکووا، A.M. کمانینا، ع.م. بوبروف اد. پروفسور G.P. Kozhevnikova - M.: کتاب درسی ووزوفسکی، 2005.-72s.

10. نظریه آمار: کتاب درسی / ویرایش. پروفسور R.A. Shmoylova - ویرایش 3، تجدید نظر شده. - M.: امور مالی و آمار، 1999.- 560s.

deniya - گزارش و نظارت ویژه سازماندهی شده. گزارشگری شکلی از مشاهده است که در آن شرکت ها، سازمان ها اطلاعات دائمی مشخص کننده فعالیت های خود را در اختیار مقامات آماری و بالاتر قرار می دهند. گزارش دهی بر اساس یک برنامه از پیش تعیین شده و با عبارات کاملاً تعریف شده ارائه می شود و حاوی مهمترین شاخص های لازم در فرآیند روزانه ...

هر ساله با توجه به معرفی فناوری های جدید، رویکرد علمی به تجارت با کمک آکادمی کشاورزی ایرکوتسک افزایش می یابد. 3. تجزیه و تحلیل اقتصادی و آماری هزینه تخم مرغ 3.1. مشاهده آماری مشاهده آماری مجموعه ای سیستماتیک، علمی سازمان یافته و به عنوان یک قاعده سیستماتیک از داده ها در مورد پدیده ها و فرآیندهای اجتماعی است.

23. پراکندگی جایگزین ها. امضا کردن

واریانس ویژگی (اگر در جامعه آماری این ویژگی به گونه ای تغییر کند که فقط دو گزینه متقابل وجود داشته باشد، آنگاه چنین متغیری جایگزین نامیده می شود) را می توان با فرمول محاسبه کرد:

با جایگزینی در این فرمول پراکندگی q = 1- p، به دست می آوریم:

فاکتور رشد K i به عنوان نسبت یک سطح معین به سطح قبلی یا پایه تعریف می شود که نرخ نسبی تغییر در سری را نشان می دهد. اگر نرخ رشد به صورت درصد بیان شود به آن نرخ رشد می گویند.

فاکتور رشد پایه

نرخ رشد زنجیره ای

24.بررسی روند اصلی توسعه

یکی از مهمترین وظایف آمار، تعیین روند کلی در توسعه یک پدیده در سری پویایی است. عوامل مختلفی بر پیشرفت یک پدیده در طول زمان تأثیر می گذارد. بنابراین، هنگام تجزیه و تحلیل پویایی، ما در مورد روند اصلی صحبت می کنیم که در طول مرحله توسعه مورد مطالعه کاملاً پایدار (پایدار) است. روند اصلی توسعه (TREND)تغییر آرام و پایدار در سطح پدیده در زمان، بدون نوسانات تصادفی نامیده می شود. برای این منظور، سری‌های زمانی با روش‌های بزرگ‌نمایی بازه‌ای، میانگین متحرک و تراز تحلیلی پردازش می‌شوند. ساده ترین روش برای مطالعه روند زیربنایی در سری های زمانی است بزرگ شدن فواصلاین روش مبتنی بر بزرگ شدن دوره های زمانی است که شامل سطوح سری های زمانی می شود (در عین حال تعداد بازه ها کاهش می یابد). شناسایی روند اصلی نیز می تواند انجام شود متحرک (متحرک) میانگین روش.ماهیت آن در این واقعیت نهفته است که سطح متوسط از تعداد معینی (معمولاً فرد (3، 5، 7 و غیره) از اولین سطوح متوالی، سپس از همان تعداد سطوح محاسبه می شود، اما با شروع از دوم در یک ردیف، بیشتر - شروع از وسط، و غیره. بنابراین، میانگین، همانطور که بود، "لغزش" در امتداد سری از دینامیک، حرکت برای یک دوره. عیب هموارسازی سریال «کوتاه شدن» سری هموار شده نسبت به واقعی است و به همین دلیل اطلاعات از دست می رود. به منظور ارائه یک مدل کمی بیانگر روند اصلی تغییر سطوح سری های زمانی در طول زمان، از تراز تحلیلی سری های زمانی استفاده شده است. محتوای اصلی روش تراز تحلیلیدر سری دینامیک این است که روند توسعه کلی به عنوان تابعی از زمان محاسبه می شود: که در آن سطوح سری پویا با توجه به معادله تحلیلی مربوطه در آن زمان محاسبه می شود.

^ تراز کردن یک سری از دینامیک در یک خط مستقیم:
. پارامترهای a 0 و 1 بر اساس روش حداقل مربعات با حل سیستم معادلات عادی زیر به دست می آیند:
، جایی که y سطوح واقعی (تجربی) سری هستند. تی– زمان (شماره سریال دوره یا نقطه زمانی). اگر بازه مرکزی (لحظه) به عنوان مبدأ زمان (t = 0) در نظر گرفته شود، محاسبه پارامترها بسیار ساده می شود. بنابراین، سیستم شکل می گیرد
. بنابراین، دریافت می کنیم:
;
.
25. هم ترازی تحلیلی از طریق نام مربع

روش حداقل مربعات برای ارزیابی کمی دقیق تر از پویایی پدیده مورد مطالعه استفاده می شود. ساده ترین و رایج ترین در عمل یک رابطه خطی است که با معادله شرح داده شده است:

Y x \u003d a + bX یا Y نظری. \u003d U میانگین + vX،

جایی که Y x - سطوح نظری (محاسبه شده) سری برای هر دوره.
الف - میانگین حسابی سطح ردیف که با فرمول محاسبه می شود:
a=Σy واقعیت. /n;
ج - پارامتر خط مستقیم، ضریب نشان دهنده تفاوت بین سطوح نظری سری برای دوره های مجاور با محاسبه بر اساس فرمول: c = Σ (واقعیت XY) / ΣX 2 تعیین می شود.
که در آن n تعداد سطوح سری پویا است.
X - نقاط موقت، اعداد طبیعی، از وسط (مرکز) ردیف به هر دو انتها چسبانده شده است.

اگر یک ردیف فرد وجود داشته باشد، سطح در موقعیت وسط به عنوان 0 در نظر گرفته می شود. برای مثال، با 9 سطح در ردیف: -4، -3، -2، -1، 0، +1، +2، +3 ، +4.

با تعداد زوج سطوح در سری، دو مقدار که موقعیت میانی را اشغال می کنند با -1 و +1 و بقیه با 2 بازه نشان داده می شوند. به عنوان مثال، با 6 سطح از سری: -5، -3، -1، +1، +3، +5.

محاسبات به ترتیب زیر انجام می شود:

آنها سطوح واقعی سری پویا (U f) را نشان می دهند (جدول را ببینید).
سطوح واقعی سری خلاصه شده و مجموع واقعیت Y بدست می آید.
نقاط زمانی مشروط (نظری) سری X را به گونه ای بیابید که مجموع آنها (ΣX) برابر 0 باشد.
نقاط زمانی نظری مجذور و جمع می شوند تا EX 2 بدست آید.
حاصل ضرب X و Y محاسبه و جمع می شود تا ΣXY بدست آید.
محاسبه پارامترهای خط مستقیم:
a = ΣY واقعیت / n c = Σ(X Y واقعیت) / ΣX 2
با جایگزینی متوالی مقادیر X در معادله Y x \u003d a + aY، سطوح هم تراز Y x پیدا می شود.

26.تحلیل نوسانات فصلی

هنگام مقایسه داده های سه ماهه و ماهانه برای بسیاری از پدیده های اجتماعی-اقتصادی، اغلب نوسانات دوره ای پیدا می شود که تحت تأثیر تغییر فصل ها ایجاد می شود. در آمار به نوسانات دوره ای که دوره معین و ثابتی برابر با بازه سالانه دارند می گویند نوسانات فصلییا امواج فصلی، سری زمانی را سری زمانی فصلی می نامند. در آمار، روش هایی برای مطالعه و اندازه گیری نوسانات فصلی وجود دارد. ساده ترین آنها ساختن شاخص های خاصی است که به آنها شاخص های فصلی (Is) می گویند. مجموع این شاخص ها نشان دهنده موج فصلی است. شاخص‌های فصلی - درصد نسبت سطوح واقعی (تجربی) درون گروهی به سطوح نظری (محاسبه‌شده) که به عنوان پایه مقایسه عمل می‌کنند. به منظور شناسایی یک موج فصلی پایدار، آنها از داده‌های چند سال (حداقل 3) که در ماه‌ها توزیع شده‌اند، محاسبه می‌شوند. برای هر ماه، میانگین سطح محاسبه می شود ( ، سپس میانگین سطح ماهانه برای کل سری y محاسبه می شود. پس از آن، شاخص موج فصلی تعیین می شود - شاخص فصلی به عنوان درصدی از میانگین های هر ماه به کل میانگین سطح ماهانه مجموعه، ٪ است. میانگین شاخص فصلی برای 12 ماه باید برابر با 100 درصد باشد، سپس مجموع شاخص ها باید 1200 باشد. هنگامی که سطح روند صعودی یا نزولی را نشان می دهد، انحراف از میانگین ثابت می تواند نوسانات فصلی را مخدوش کند. در این مورد، داده های واقعی با داده های تراز شده مقایسه می شوند، یعنی با هم ترازی تحلیلی به دست می آیند. فرمول:
.

27.I.درون یابی و برون یابی

هنگام مطالعه دینامیک طولانی مدت، گاهی اوقات لازم است سطوح ناشناخته را در یک سری از دینامیک ها تعیین کنید.

درون یابی یک محاسبه تقریبی از سطوح از دست رفته در یک دوره همگن است، زمانی که سطوح مجاور در هر دو طرف مشخص باشد.

برون یابی محاسبه سطح از دست رفته است، زمانی که سطح فقط از یک طرف شناخته شده است. اگر سطح به سمت آینده محاسبه شود، به آن برون یابی آینده نگر، به سمت گذشته - برون یابی گذشته نگر می گویند.

هم درون یابی و هم برون یابی باید در طول دوره یکسانی انجام شود. فرض بر این است که الگوی توسعه یافت شده در مجموعه حفظ شده است.

روش های محاسبه سطح مجهول به ماهیت تغییر در پدیده مورد مطالعه بستگی دارد. با یک تغییر صاف در سطح، سطح از دست رفته را می توان تعیین کرد: با نصف مجموع دو سطح مجاور، با میانگین افزایش مطلق، با میانگین نرخ رشد.

با حفظ افزایش مطلق post-x سطوح از دست رفته سری پویا محاسبه شده: = +

سطح اول

اگر نرخ رشد ثابت در نظر گرفته شود، سطح از دست رفته سری از فرمول محاسبه می شود:

در صورت وجود نوسانات شدید در سری های زمانی، بهتر است از میانگین افزایش مطلق یا میانگین نرخ رشد برای کل دوره مطالعه استفاده شود، همانطور که در فرمول ها مشخص شده است.

شاخص‌ها مقادیر نسبی مقایسه‌ای هستند که تغییر در شاخص‌های پیچیده اجتماعی-اقتصادی (شاخص‌های متشکل از عناصر غیرقابل جمع‌آوری) را در زمان، مکان در مقایسه با برنامه مشخص می‌کنند.

شاخص نتیجه مقایسه دو شاخص به یک نام است که هنگام محاسبه باید بین شمارنده نسبت شاخص (سطح مقایسه یا گزارشگری) و مخرج نسبت شاخص (سطح پایه که مقایسه با آن انجام می شود) تمایز قائل شد. ساخته شده). انتخاب پایه بستگی به هدف مطالعه دارد. اگر دینامیک مورد مطالعه قرار گیرد، اندازه شاخص در دوره قبل از دوره گزارش می تواند به عنوان مقدار پایه در نظر گرفته شود. اگر لازم باشد مقایسه سرزمینی انجام شود، می توان داده های قلمرو دیگری را به عنوان پایه در نظر گرفت. در صورت لزوم استفاده از شاخص ها به عنوان شاخص تحقق برنامه، می توان شاخص های برنامه ریزی شده را مبنای مقایسه قرار داد.

شاخص ها مهمترین شاخص های اقتصادی اقتصاد ملی و صنایع منفرد آن را تشکیل می دهند. شاخص‌های شاخص امکان تحلیل عملکرد شرکت‌ها و سازمان‌هایی را که محصولات متنوعی تولید می‌کنند و یا در فعالیت‌های مختلف فعالیت می‌کنند را ممکن می‌سازد. با کمک شاخص ها می توان نقش عوامل فردی را در شکل گیری مهمترین شاخص های اقتصادی ردیابی کرد و ذخایر اصلی تولید را شناسایی کرد. شاخص ها به طور گسترده در مقایسه شاخص های اقتصادی بین المللی در تعیین سطح زندگی، فعالیت های تجاری، سیاست قیمت گذاری و غیره استفاده می شوند.

دو رویکرد برای تفسیر احتمالات شاخص های شاخص وجود دارد: تعمیم (ترکیبی) و تحلیلی که به نوبه خود توسط وظایف مختلف تعیین می شود.

29. شاخص های کل

شاخص عمومیمنعکس کننده تغییر در همه عناصر یک پدیده پیچیده است. اگر شاخص ها همه عناصر را پوشش ندهند، به آنها گروه یا زیرشاخص می گویند. شاخص های کل و متوسط وجود دارد که محاسبه آنها یک تکنیک تحقیقی خاص به نام روش شاخص را تشکیل می دهد. هنگام ساخت شاخص های عمومی: 1. شما باید عناصری را انتخاب کنید که باید در یک شاخص ترکیب شوند. 2. هم متر یا وزن مناسب را انتخاب کنید، یعنی. ویژگی ثابت انتخاب وزن بستگی به این دارد که کدام ویژگی نمایه شود - کمی یا کیفی. شکل اصلی شاخص های عمومی، فرم تجمیع است. نمایه فرم مجموع با استفاده از روش جمع ساخته می شود. اگر داده‌های عنصر به عنصر در دوره گزارش و پایه داشته باشیم، از فرم تجمیع استفاده می‌شود . شاخص کالا:
; تولید حجم فیزیکی in-s
; ^ شاخص قیمت مصرف کننده معیار رایج تورم است. ارزش نمایه شده در آن قیمت کالا خواهد بود. هنگام ساخت شاخص قیمت، معمولاً تعداد کالاهای فروخته شده در دوره جاری (گزارش‌دهی) به عنوان وزن‌های شاخص در نظر گرفته می‌شود. شاخص قیمت کل با وزن گزارش اولین بار توسط Paasche پیشنهاد شد و نام او را دارد: فرمول شاخص قیمت کل Paasche
، جایی که
- هزینه واقعی تولید (گردش مالی) دوره گزارش.
- ارزش مشروط کالاهای فروخته شده در دوره گزارش به قیمت های پایه.

فرمول شاخص قیمت کل لاسپایر:

30. محاسبه را با هم مقایسه کنید. و harmon.ind.، ارتباط با واحد.

شکل اصلی شاخص های عمومی، فرم تجمیع است. نمایه فرم مجموع با استفاده از روش جمع ساخته می شود. اگر داده‌های عنصر به عنصر در دوره گزارش و پایه داشته باشیم، از فرم تجمیع استفاده می‌شود . بسیاری از شاخص‌های آماری که جنبه‌های مختلف پدیده‌های اجتماعی را مشخص می‌کنند، در ارتباط خاصی با یکدیگر (اغلب به شکل یک محصول) هستند. آمار این روابط را به صورت کمی مشخص می کند. بسیاری از شاخص های اقتصادی با هم مرتبط هستند و شکل می گیرند سیستم های شاخص. به شرح زیر تمرین تحلیل عاملی: اگر شاخص مؤثر = حاصل ضرب عوامل حجمی و کیفی باشد، آنگاه عامل کیفی در سطح دوره پایه ثابت است. اگر تأثیر یک شاخص کیفی تعیین شود، فاکتور حجم در سطح دوره گزارش ثابت می شود. اجازه دهید ساخت شاخص های مرتبط با هم را با استفاده از مثال شاخص های قیمت، حجم فیزیکی محصولات (اگر در مورد قیمت فروش صحبت می کنیم) یا حجم فیزیکی تجارت (اگر در مورد قیمت های خرده فروشی صحبت می کنیم) و شاخص بهای تمام شده در نظر بگیریم. تولید (تجارت به قیمت واقعی). شاخص‌های حجم فیزیکی و قیمت‌ها در رابطه با فاکتوریل هستند شاخص هزینه تولید(گردش کالا به قیمت واقعی):
، یا
. بنابراین، حاصل ضرب شاخص قیمت با شاخص حجم فیزیکی تولید، شاخص بهای تمام شده تولید (گردش در قیمت های واقعی) را به دست می دهد. سیستم ایندکس به شما امکان می دهد تا مقدار سومین مجهول را با دو مقدار شاخص شناخته شده پیدا کنید. شاخص حجم فیزیکی تولید: علاوه بر روش مجموع محاسبه شاخص‌های عمومی، روش دیگری نیز وجود دارد که عبارت است از محاسبه شاخص‌های عمومی به عنوان میانگین شاخص‌های فردی متناظر. برای شمردن چنین شاخص های میانگین وزنیزمانی متوسل می شوند که اطلاعات موجود اجازه محاسبه شاخص کل را نمی دهد. بنابراین، اگر مقادیر تک تک محصولات تولید شده در کنتورهای طبیعی ناشناخته باشد، اما شاخص های فردی مشخص باشد
و هزینه تولید دوره پایه ( پ 0 q 0 ، می توان شاخص میانگین حسابی حجم فیزیکی تولید را تعیین کرد. پایه ساخت اولیه شکل سنگدانه است. از داده های موجود، تنها مخرج این فرمول به دست می آید. برای یافتن شمارشگر، از فرمول شاخص حجم تولید فردی استفاده می شود که از آن نتیجه می شود q 1 = q 0 من q. با جایگزینی این عبارت به صورت شمارشگر، شاخص کل حجم فیزیکی را در فرم به دست می آوریم. شاخص میانگین حسابی حجم فیزیکی تولید ، که در آن اوزان هزینه انواع خاصی از محصولات در دوره پایه است ( q 0 پ 0 ):
.

اگر داده ها در قالب یک گروه بندی تحلیلی ارائه شوند، می توان پراکندگی کل، بین گروهی و درون گروهی را محاسبه کرد (جدول 11).

جدول 11

انواع واریانس ها و قانون اضافه کردن واریانس ها

نام پراکندگی	فرمول محاسبه
ساده (بدون وزن)	وزن دار

واریانس کل تغییرات یک صفت را در کل جمعیت تحت تأثیر همه عوامل اندازه گیری می کند
واریانس بین گروهی تغییرات سیستماتیکی را که تحت تأثیر یک صفت گروه بندی به وجود آمده است اندازه گیری می کند.
میانگین برای گروه -ام. - میانگین در کل جمعیت؛ - تعداد واحدهای جمعیت - تعداد واحدها در گروه -ام
واریانس درون گروهی (خصوصی)، به طور جداگانه برای هر گروه محاسبه می شود
مقادیر فردی صفت در گروه -ام؛ - میانگین -ام گروه؛ - تعداد واحدها در مجموع؛ - تعداد واحدها در گروه -ام
میانگین واریانس درون گروهی تغییرات تصادفی را که تحت تأثیر همه عوامل به جز صفت گروه‌بندی رخ می‌دهد، اندازه‌گیری می‌کند.
قانون جمع واریانس

بر اساس قانون اضافه کردن واریانس، موارد زیر محاسبه می شود:

1) ضریب تعیین تجربی نسبت تغییرات صفت حاصل را به دلیل تغییر ویژگی گروه بندی نشان می دهد:

2) نسبت همبستگی تجربی نزدیکی رابطه بین گروه بندی و ویژگی های حاصل را نشان می دهد:

نسبت همبستگی تجربی از 0 تا 1 متغیر است. اگر اتصال وجود نداشته باشد، اگر - اتصال کامل است.

مقادیر متوسط در مقیاس چادوک ارزیابی می شوند:

واریانس ویژگی

یک ویژگی جایگزین یک ویژگی کیفی است که می تواند تنها یک مقدار از دو را بگیرد. به عنوان مثال، جنسیت - مرد یا زن. وضعیت تاهل - متاهل یا نه. محصولات خوب یا معیوب هستند بخشی از جمعیت دارای ویژگی جایگزین است، و دیگری ندارد. نسبت واحدهای دارای ویژگی جایگزین (مطالعه شده) با - p نشان داده می شود، نه دارای - q. وجود یک ویژگی جایگزین در واحدهای جمعیت با 1 نشان داده می شود، عدم وجود - 0.

مفهوم تنوع

میانگین یک مشخصه تعمیم دهنده کلیت پدیده مورد مطالعه را به دست می دهد.

تنوع ویژگیتفاوت بین مقادیر فردی یک صفت در جامعه مورد مطالعه است.

مقدار متوسط یک ویژگی انتزاعی و تعمیم دهنده ویژگی جمعیت مورد مطالعه است، اما ساختار جامعه را نشان نمی دهد.

مقدار متوسط ایده ای از نحوه گروه بندی مقادیر فردی صفت مورد مطالعه در اطراف میانگین نمی دهد، خواه در نزدیکی آن متمرکز شده باشند یا به طور قابل توجهی از آن انحراف دارند.

اگر مقادیر فردی ویژگی نزدیک به میانگین حسابی باشد، در این حالت میانگین کل جمعیت را به خوبی نشان می دهد. و بالعکس.

نوسان مقادیر فردی مشخص می شود شاخص های تنوع

اصطلاح "تغییر" از لاتین variatio - تغییر، نوسان، تفاوت می آید. با این حال، همه تفاوت ها معمولاً به عنوان تنوع نامیده نمی شوند.

تحت تنوعدر آمار، آنها چنین تغییرات کمی را در ارزش صفت مورد مطالعه در یک جمعیت همگن درک می کنند که ناشی از تأثیر متقاطع عمل عوامل مختلف است. تنوع یک صفت در مقادیر مطلق و نسبی وجود دارد. مطلق - R، L، σ، σ 2.

شاخص های تنوع

1 مجموعه	2 مجموعه
n=5 80، 100، 120، 200، 300	n=8 145، 150، 155، 160، 160، 162، 168، 180

80 100 120 x 200 300

بنابراین، در این مورد، تعیین تنوع ویژگی ضروری است، یعنی. نسبت مقادیر فردی سری نسبت به یکدیگر.

شاخص های تنوع

1. دامنه تغییرات تفاوت بین حداکثر و حداقل مقادیر یک ویژگی است.

R = X max - X min

R 1 \u003d 300-80 \u003d 220 R 2 \u003d 180-145 \u003d 35

تمرین: برای یک جمعیت همگن، برای کنترل کیفیت محصول.

2. شاخص هایی که انحراف همه گزینه ها از میانگین حسابی را در نظر می گیرند.

الف) انحراف خطی متوسط

ب) انحراف معیار

میانگین انحراف خطینشان دهنده میانگین حسابی مقادیر مطلق انحراف گزینه های فردی از میانگین است.

برای گروه بندی نشده:

;

برای گروه بندی شده:

تمرین:تحلیل می کند:

1. ترکیب کارکنان

2. ریتم تولید

3. عرضه یکنواخت مواد

نقص:این شاخص محاسبات از نوع احتمالی را پیچیده می کند و استفاده از روش های آمار ریاضی را دشوار می کند.

انحراف معیار (استاندارد)- این

برای داده های گروه بندی نشده

برای داده های گروه بندی شده

برای توزیع های با انحراف متوسط

انحراف معیار، مانند میانگین انحراف خطی، یک شاخص مطلق است که با واحدهای مشابه میانگین حسابی بیان می شود.

اگر خود علائم برای این جمعیت ها یکسان نباشد، شاخص های میانگین مربع یا میانگین انحراف خطی برای دو جمعیت غیرقابل مقایسه است. این شاخص ها برای نشانه های مختلف یک جمعیت مقایسه نمی شوند. آن ها وقتی میانگین ها در هر دو جمعیت در واحدهای اندازه گیری یکسان بیان می شوند و یکسان هستند، مقایسه امکان پذیر است و منعکس کننده تفاوت در تنوع صفت خواهد بود.

انحراف معیار معیاری برای پایایی میانگین است. هرچه σ کوچکتر باشد، میانگین حسابی کل جمعیت ارائه شده را بهتر نشان می دهد.

3. پراکندگیبرای اندازه گیری تغییرپذیری یک ویژگی استفاده می شود. این شاخص به طور عینی تری اندازه گیری تغییرات را منعکس می کند

برای گروه بندی نشده

برای گروه بندی شده

ویژگی متمایز این شاخص این است که هنگام مربع کردن نسبت انحرافات کوچک کاهش می یابد و مقدار کل انحرافات افزایش می یابد.

این هم مطلق است

پراکندگی دارای تعدادی ویژگی است که برخی از آنها محاسبه را آسان تر می کند:

1. پراکندگی یک مقدار ثابت 0 است

2. اگر همه انواع مقادیر ویژگی (x) ↓ با یک عدد باشند، واریانس کاهش نمی یابد

3. اگر همه گزینه ها ↓ به تعداد یکسان (K بار)، واریانس ↓ توسط K 2 برابر

ایکس	f	ایکس"

x 100 بار

پراکندگی σ 0.909*10000=9090 است

در بالا، محاسبه شاخص های تغییرات برای صفات کمی در نظر گرفته شد، اما وظیفه ارزیابی تنوع را می توان مطرح کرد. ویژگی های کیفی. به عنوان مثال هنگام مطالعه کیفیت محصولات تولیدی می توان آن را به خوب و معیوب تقسیم کرد.

در این مورد، ما در مورد علائم جایگزین صحبت می کنیم.

واریانس ویژگی

علائم جایگزینبه آنهایی گفته می شود که برخی از واحدهای جمعیت دارای آن هستند، در حالی که برخی دیگر ندارند. به عنوان مثال، در دسترس بودن سابقه کار برای متقاضیان، مدرک تحصیلی برای معلمان دانشگاه و غیره. وجود یک ویژگی در واحدهای جمعیت به طور معمول با 1 نشان داده می شود و عدم وجود آن 0 است. x 1 = 1، x 2 = 0. نسبت واحدهایی که دارای یک ویژگی هستند (در کل جمعیت) با p و نسبت واحدهایی که آن را ندارند با q نشان داده می شود. آن ها p+q=1، q=1-p.

مقدار متوسط ویژگی جایگزین را محاسبه کنید

; ;

آن ها مقدار میانگین یک ویژگی جایگزین برابر است با نسبت واحدهایی که ویژگی های داده شده را دارند به سهم واحدهایی که ویژگی های داده شده را ندارند.

انحراف معیار B p = است

کیفیت بررسی می شود: 1000 محصول نهایی، 20 محصول معیوب.

درصد ازدواج را پیدا می کنیم: (20/1000) * 100٪ \u003d 0.02٪

پراکندگی دارای تعدادی ویژگی استبرای ساده کردن محاسبه

1. اگر مقداری از عدد ثابت A از تمام مقادیر گزینه کم شود، انحراف استاندارد از آن تغییر نخواهد کرد.