Варіація альтернативної ознаки. Ентропія розподілу

Альтернативний ознака - це ознака, яким володіє частина одиниць і не має інша частина одиниць сукупності.

Дисперсія дорівнює добутку частки ( р) на число, що доповнює цю частку до одиниці ( q):

де p – частка одиниць, які мають ознакою;

q – частка одиниць, які не мають ознаки.

Граничне значення дисперсії альтернативної ознаки дорівнює 0,25 при р = 0,5.

Приклад 6.1. З 200 студентів факультету – 60 чол. - Неуспішні.

Частка неуспішних студентів дорівнює p = 60/200 = 0,3

Частка успішних студентів дорівнює q = 1 - 0,3 = 0,7

Дисперсія частки дорівнює = 0,3 · 0,7 = 0,21

Приклад 6.2. Розрахунок за несгрупованими даними. Є дані про стаж 10 працівників – 1, 2, 3, 3, 4, 4, 5, 7, 9, 12. Розрахувати показники варіації.

Складемо робочу таблицю для розрахунку.

Номер працівник Стаж, років ( х i) x 2
-4
-3
-2
-2
-1
-1
Разом

Середній стаж дорівнює років.

Розмах варіації R= 12-1 = 11 років.

Далі розраховуємо відхилення від середньої , і

Середнє лінійне відхилення років.

Дисперсія

Середня із квадратів

Другий метод розрахунку дисперсії = 35,4 – 5 2 = 10,4

року

Коефіцієнт варіації V= 3,22/5 = 0,645 або 64,5%

V d= 2,6/5 = 0,520 або 52,0%.

Приклад 6.3. Розрахунок за інтервальним варіаційним рядом.

Є дані про розподіл робітників із зарплати

Рішення: Складемо робочу таблицю для розрахунку.

Зарплата f Середина інтервалу ( х) x i · f i
до 10 -21
10–20 -11
20–30 -1
30–40
40 і більше
Разом

Середня зарплата тис. руб.

Середнє лінійне відхилення тис. руб.

Дисперсія

Середнє квадратичне відхилення тис. руб.

Коефіцієнт варіації V= 12,45/26 = 0,479 або 47,9%

Лінійний коефіцієнт варіації: V d= 10,36/26 = 0,398 або 39,8%.

Види дисперсій

Загальна дисперсія s 2вимірює варіацію результативної ознаки ( y) у всій сукупності під впливом всіх факторів ( x 1 , x 2 , x 3 …) які зумовили цю варіацію.

Міжгрупова дисперсіяхарактеризує систематичну варіацію, тобто. відмінності у величині досліджуваної ознаки, що виникають під впливом ознаки-фактора ( x), покладеного в основу угруповання. Вона розраховується за формулою

,

де ` y iі n i- відповідно групові середні та чисельності за окремими групами.

Внутрішньогрупова дисперсія() відображає випадкову варіацію, тобто частина варіації, що відбувається під впливом неврахованих факторів і не залежить від ознаки-фактора, покладеного в основу угруповання. Вона обчислюється так:

Середня із внутрішньогрупових дисперсій ():

Існує закон, що пов'язує три види дисперсії. Загальна дисперсія дорівнює сумі середньої з внутрішньогрупової та міжгрупової дисперсії:

У статистичному аналізі широко використовується показник, що є частиною міжгрупової дисперсії в загальній дисперсії. Він має назву емпіричного коефіцієнта детермінації ():

.

Цей коефіцієнт показує частку (питому вагу) загальної варіації ознаки, що досліджується, обумовлену варіацією групувального ознаки.

Корінь квадратний з емпіричного коефіцієнта детермінації зветься емпіричного кореляційного відношення ( h):

.

Воно характеризує вплив ознаки, покладеної в основу угруповання, на варіацію результативної ознаки. Емпіричне кореляційне відношення змінюється від 0 до 1. Якщо h= 0, то групувальна ознака не впливає на результативний. Якщо h= 1, то результативна ознака змінюється тільки залежно від ознаки, покладеної в основу угруповання, а вплив інших факторних ознак дорівнює нулю. Проміжні значення оцінюються залежно від їхньої близькості до граничних значень.

Приклад 6.4. Є дані про групу робочих.

Оцінити силу зв'язку між ознаками.

Рішення: Дані групові середні та внутрішньогрупові дисперсії.

Визначимо середню загальну, використовуючи групові середні

Середня із внутрішньогрупових дисперсій

Міжгрупова дисперсія

Загальна дисперсія s 2 =6,955 + 34,65 = 41,605

Емпіричний коефіцієнт детермінації

34,65 / 41,605 = 0,833

Емпіричне кореляційне ставлення

Таке значення (близько до 1) характеризує дуже сильний зв'язок між числом верстатів, що обслуговуються, і середньою зарплатою.

6. Дисперсія альтернативної ознаки

Окремий випадок атрибутивної (некількісної) ознаки – ознака альтернативна. Коли одиниці сукупності або мають цю ознаку, що вивчається, або не мають його. Прикладом таких ознак є: бракована продукція, науковий ступінь у викладачів вузу, робота з отриманої спеціальності, перевищення середньодушових грошових доходів їх загальноросійського рівня, наявність дітей у сім'ї і т.д.

У разі альтернативної ознаки одиниці сукупності присвоюється значення «1». У разі відсутності - "0".

Терезами в розрахунках служать:

Частка одиниць, що мають дану ознаку;

Частка одиниць, які не мають даної ознаки

Тоді середня величина альтернативної ознаки дорівнює:

дисперсія набуде вигляду:

Дисперсія альтернативної ознаки змінюється від 0 до 0,25. Максимального значення 0,25 досягає 0,5

Приклад 4.11. При вибірковому опитуванні 300 жителів Курська 60 із них висловилися позитивно щодо зберігання особистих грошових заощаджень у комерційних банках міста

Визначити середній рівень, дисперсію та середнє квадратичне відхилення ознаки

Практичне застосування варіації альтернативної ознаки переважно полягає у побудові довірчих інтервалів під час проведення вибіркового спостереження.

7. Вивчення форми розподілу ознаки. Основні характеристики закономірностей розподілу

Неодмінним умовою успішності побудов, обчислень і висновків з урахуванням варіаційних рядів є однорідність узагальнюваних у яких сукупностей, встановлювана з урахуванням глибокого теоретичного аналізу.

Чітко виражений порядок зміни частот відповідно до зміни величини ознаки називають закономірністю розподілу.

Знання типу закономірності розподілу, (а отже, і форми кривої) необхідне насамперед:

1. Для з'ясування типовості умов одержання первинного статистичного матеріалу. Так, поява багатовершинної або суттєво асиметричної кривої говорить про різнотипний склад сукупності та необхідність перегрупування даних з метою виявлення більш однорідних груп.

2. Для забезпечення правильності виконання практичних розрахунків та прогнозів. Так, застосування формули Г. Стерджесса для розрахунку оптимальної кількості груп інтервального ряду, правила «трьох сигм», коефіцієнта варіації Vσ як індикатора однорідності сукупності, методу найменших квадратів при моделюванні кореляційного зв'язку явищ, методів дисперсійного аналізу та інших правомочно лише в умовах нормального і близьких щодо нього розподілів.

Закономірності варіаційних рядів, що виражають у типі розподілу їх частот, наочно виступають на графіках – гістограмі та полігоні розподілу частот. Їх розгляд показує, що в гістограмі спостерігається велика стрибкоподібність розподілу, а в полігоні виявляється поступовість переходу від однієї групи до іншої. Ламана лінія полігону частково згладжує стрибкоподібність гістограми, є узагальненим прийомом аналізу розподілу.

При збільшенні рядків інтервального варіаційного ряду та відповідному зменшенні величини його інтервалів кількість сторін полігону розподілу зростатиме і ламаною лінії буде властива тенденція перетворитися на межу на якусь криву. Така крива називається кривою розподілу. У ньому відбувається найбільше звільнення даних від впливу випадкових чинників. Вона виявляє і в максимально узагальненому вигляді показує характер варіації, закономірність розподілу частот всередині одноякісної сукупності явищ.

Криві розподіли можуть бути різних типів. У практиці соціально-економічних досліджень широко застосовується крива нормального розподілу. Вона є одновершинною симетричною дзвоноподібною фігурою, права і ліва гілки якої рівномірно і симетрично спадають, асимптотично наближаючись до осі абсцис.

Відмінною особливістю цієї кривої є збіг у ній середньої арифметичної, моди та медіани. Якщо всю площу між кривою та віссю абсцис прийняти за 100%, то в межах укладено 68,3% частот, у межах – 95,4%, у межах 99,7% («правило трьох сигм»).

Хоча нормальне, чи симетричне, розподіл відповідає природі низки явищ, проте громадських явищ воно нехарактерно, оскільки у ньому відбиваються відмінності, викликані зовнішніми впливами, властиві не що розвивається, лише коливається сукупності одиниць. Для соціальних явищ характерний розвиток, динамізм. Тому ряди та криві розподілу частот суспільних явищ, як правило, асиметричні, у них частоти зростають до максимуму та зменшуються від нього нерівномірно. Саме наявність асиметрії, чи скошеності, у лавах однорідних сукупностей служить непрямим вказівкою те що, що досліджуваний процес проходить активну стадію розвитку.

Асиметричні ряди та відповідні криві мають різні форми розподілів, досліджені математичною статистикою. Такими формами є розподіл Пуассона, розподіл Максвелла, розподіл Пірсона та ін Тут асиметричність розглядається в цілому як єдиний тип розподілу. При цьому розрізняють правосторонню та лівосторонню асиметрії (скошеність).

Якщо довга гілка кривої розташована правіше вершини, то асиметрія називається правосторонньою, якщо ця гілка розташована лівіше за вершину – лівосторонню. При правосторонній асиметрії при лівій. Тому різницю між ними, віднесену до , називають коефіцієнтом К. Пірсона і використовують як коефіцієнт асиметрії:

. (20)

При правосторонній асиметрії цей коефіцієнт позитивний, при лівосторонній – негативний. Якщо = 0, варіаційний ряд симетричний. Чим більша абсолютна величина коефіцієнта, тим більший ступінь скошеності.

Найбільш точним показником асиметрії розподілу є коефіцієнт асиметрії, що обчислюється за формулою

(21)

де n - Число одиниць сукупності. Як і у випадку коефіцієнта Пірсона, при > 0 має місце правостороння асиметрія, при< 0 левосторонняя. В симметричных распределениях = 0.

Чим більша величина ||, тим більше асиметричний розподіл. Встановлено наступну оцінну шкалу асиметричності:

|| - асиметрія незначна;

0,25 < || - асимметрия заметная (умеренная);

|| > 0,5 – асиметрія суттєва.

Оскільки коефіцієнти є відносними безрозмірними величинами, вони часто застосовуються для порівняльного аналізу асиметричності різних рядів розподілу.

Характер асиметрії іноді свідчить про напрям розвитку. При дослідженні варіації ознак, щодо яких є зацікавленість у їх збільшенні (виконання норм, випуск продукції тощо), правостороння асиметрія свідчить про прогресивність розвитку, у тому, що йде у бік збільшення показника, а лівостороння асиметрія свідчить про наявність великої кількості ділянок, що відстають.

При дослідженні варіації ознак, щодо яких є зацікавленість у їх зменшенні (собівартість, трудомісткість, витрата сировини на одиницю продукції тощо), правостороння асиметрія свідчить про недоліки у розвитку досліджуваного процесу, лівостороння – про прогресивність його розвитку, у тому, що останнє йде у бік зменшення показника. У розподілі працівників за стажем (див. приклад 4.9 = 5,75) спостерігається правостороння асиметрія, оскільки коефіцієнт асиметрії позитивний: (5,955-5,75):2,47 = 0,095. Така асиметрія для даного ряду є прогресивною, вона свідчить про розвиток ряду у бік збільшення досліджуваного показника.

Форму розподілу можна орієнтовно визначити безпосередньо розглядом емпіричних даних ряду, якщо вони зображені гістограмою і полігоном. Щоб переконатися у правильності орієнтовного визначення форми розподілу, емпіричні дані ряду досліджуються з їхньої близькість до теоретичного розподілу, встановлюваного з допомогою побудови відповідної кривою розподілу. Однак у багатьох випадках ні теорія, ні безпосередній розгляд емпіричних даних не дають відповіді на питання про форму розподілу. Тоді зазвичай ведеться дослідження на близькість емпіричних даних до нормального розподілу, оскільки розподіли з невеликою або помірною асиметричністю в більшості випадків за своїм типом належать до нормальних.

Для об'єктивного судження про рівень відповідності емпіричного розподілу нормальному у статистиці використовується ряд критеріїв, званих критеріями згоди чи відповідності.

До них відносяться критерії Пірсона, Романовського, Ястремського, Колмогорова, що ґрунтуються на використанні різних теоретичних уявлень.

Наприклад, найбільш використовуваний критерій згоди Пірсона («хі-квадрат») визначається за такою формулою:

, (22)

де – емпіричні частоти (частини)

Теоретичні частоти (частини)

Для оцінки близькості емпіричного розподілу до теоретичного визначається можливість досягнення цим критерієм даної величини. Якщо ця можливість перевищує 0,05, то відхилення фактичних частот від теоретичних вважаються випадковими, несуттєвими. Якщо ж , то відхилення вважаються суттєвими, а емпіричне розподіл – принципово відмінним від теоретичного.

Для характеристики ступеня відхилення симетричного розподілу нормального розраховується показник ексцесу. Він приблизно може бути визначений за допомогою коефіцієнта Ліндберга.


, (23)

де - частка (в%) кількості варіантів, що лежать в інтервалі рівному половині середнього квадратичного відхилення (в той та інший бік від величини середньої) у загальній кількості варіант даного ряду;

38,29 – частка (у %) кількості варіант, що лежать в інтервалі, що дорівнює половині середнього квадратичного відхилення (у той і інший бік від величини середньої) у загальній кількості варіант ряду нормального розподілу

Ексцес може бути позитивним, негативним та рівним нулю.

У високовершинних кривих показник ексцесу має позитивний знак, низьковершинних кривих – негативний знак. Для кривої нормального розподілу його величина дорівнює нулю.

Для більш точної характеристики ступеня відхилення симетричного розподілу від нормального розраховується показник гострості (показник ексцесу) (Ek) за формулою:

(24)

Він, як і коефіцієнт Ліндберга, може бути позитивним, негативним та рівним нулю. Показник ексцесу, як і показник асиметрії, - абстрактне число. Граничним значенням негативного ексцесу є значення Ek = -2; величина ж позитивного ексцесу є нескінченною величиною.

Визначення показників асиметрії та ексцесу має не тільки описове значення, часто їх величини дають певні вказівки для подальшого дослідження явищ, що вивчаються. Так, наприклад, поява значного негативного ексцесу може вказувати на якісну неоднорідність досліджуваної сукупності.

Сучасні комп'ютерні технології відкривають широкі можливості виконання громіздких обчислювальних операцій із аналізу варіаційних рядів. Якщо матеріал теоретично осмислений і висунута розумна гіпотеза про форму розподілу (останнє, до речі, ЕОМ теж може перевірити), обчислювальні пристрої можуть швидко обчислити різні узагальнюючі показники і критерії, побудувати графіки тощо. Це можливо, оскільки показники варіації порівняно нескладні і добре формалізовані.


Список використаної літератури

1. Виноградова Н.М., Євдокимова В.Т., Хітарова О.М. та ін. Загальна теорія статистики: Навчальний посібник / Под ред. І.Г. Венецького / - М.: Статистика, 1968г - 380с

2. Гусаров Віктор Максимович. Статистика: Навч. посібник для студентів вищих навчальних закладів за економічними спеціальностями / В.М. Гусаров, Є.І. Кузнєцова.- 2-ге вид., перераб. та дод. - М.: ЮНІТІ-ДАНА, 2007. - 479с

3. Гусаров, Віктор Максимович. Загальна теорія статистики: Навч. посібник для студентів вищих навчальних закладів за економічними спеціальностями / В.М. Гусаров, С.М. Проява.- 2-ге вид., перераб. та дод. - М.: ЮНІТІ-ДАНА, 2008. - 207с

4. Іллішев Анатолій Михайлович. Загальна теорія статистики: підручник для студентів вищих навчальних закладів, які навчаються за спеціальностями економіки та управління / О.М. Іллішев, - М.: ЮНІТІ-ДАНА, 2008. - 535с

5. Ряузов Н.М. Загальна теорія статистики: Підручник для студ. екон. спец. вузів – 4-те вид. перероб. та дод. - М.: Фінанси та статистика, 1984. - 343с

6. Салін В.М., Чурілова Е.Ю. Курс теорії статистики на підготовку фахівців фінансово-економічного профілю: Підручник. - М.: Фінанси та статистика, 2006-480с

7. Статистичні методи аналізу чинників підвищення ефективності громадського виробництва. Навчальний посібник. За ред. Ряузова Н.М. Акіншиної М.К.- М. ВЗФЕД. 1980-88с

8. Статистика: Навч. посібник/А.В. Багат, М.М. Конкіна, В.М. Сімчера та ін; За ред. В.М. Сімчери. - М.: Фінанси та статистика, 2005. - 368с

9. Статистика. Комп'ютерні лабораторні роботи: Методичні вказівки до лабораторної роботи №1 "Автоматизований апріорний аналіз статистичної сукупності в середовищі MS Excel". / Г.П. Кожевнікова, А.В. Голікова, А.М. Каманіна, А.М. Бобрів. За ред. проф. Г.П. Кожевнікової-М.: Вузовський підручник, 2005.-72с.

10. Теорія статистики: Підручник/За ред. проф. Р.А. Шмойлової – 3-тє вид., перераб. - М.: Фінанси та статистика, 1999. - 560с.


ня – звітність та спеціально організоване спостереження. Звітність – це така форма спостереження, коли підприємства, організації подають у статистичні і вищестоящі органи постійні відомості, що характеризують їх діяльність. Звітність надається за заздалегідь визначеною програмою у строго визначені терміни та містить найважливіші показники, необхідні у процесі щоденної...

З кожним роком збільшується за рахунок впровадження нових технологій наукового підходу до справи за допомогою Іркутської Сільськогосподарської Академії. 3. Економіко-статистичний аналіз собівартості яєць 3.1. Статистичне спостереження Статистичне спостереження є планомірним, науково організованим і, як правило, систематичним збиранням даних про явища і процеси суспільної...

23. Дисперсія альтернатив. Ознака

Дисперсія альтернативної ознаки (якщо в статистичній сукупності ознака змінюється так, що є тільки два варіанти, що взаємно виключають один одного, то така мінливість називається альтернативною) може бути обчислена за формулою:

Підставляючи до цієї формули дисперсії q =1- р, отримуємо:


p align="justify"> Коефіцієнт зростання K i визначається як відношення даного рівня до попереднього або базисного, показує відносну швидкість зміни ряду. Якщо коефіцієнт зростання виявляється у відсотках, його називають темпом зростання.

Коефіцієнт зростання базисний

Коефіцієнт зростання ланцюгової

24. Вивчення основної тенденції розвитку

Однією з найважливіших завдань статистики є визначення у лавах динаміки загальної тенденції розвитку явища. На розвиток явища у часі впливають різні чинники. Тому при аналізі динамі йдеться про основну тенденцію, досить стабільну (стійку) протягом вивченого етапу розвитку. Основною тенденцією розвитку (ТРЕНДОМ)називається плавна та стійка зміна рівня явища в часі, вільна від випадкових коливань. З цією метою ряди динаміки піддаються обробці методами укрупнення інтервалів, ковзної середньої та аналітичного вирівнювання. Найбільш простим методом вивчення основної тенденції у лавах динаміки є укрупнення інтервалів.Даний метод заснований на укрупненні періодів часу, до яких відносяться рівні динаміки (одночасно зменшується кількість інтервалів). Виявлення основної тенденції може здійснюватися також методом ковзної (рухомої) середньої.Сутність його полягає в тому, що обчислюється середній рівень з певного числа, зазвичай непарного (3, 5, 7 і т.д.), перших за рахунком рівнів ряду, потім - з того ж числа рівнів, але починаючи з другого за рахунком, далі – починаючи із середнього тощо. Отже, середня хіба що «ковзає» з низки динаміки, пересуваючись однією термін. Недоліком згладжування ряду є «вкорочування» згладженого ряду порівняно з фактичним, а отже, відбувається втрата інформації. Для того щоб дати кількісну модель, що виражає основну тенденцію зміни рівнів динамічного ряду в часі, використовується аналітичне вирівнювання ряду динаміки. Основним змістом методу аналітичного вирівнюванняу рядах динаміки і те, що загальна тенденція розвитку розраховується як функція часу: де рівні динамічного ряду, обчислені за відповідним аналітичним рівнянням на момент часу.

^ Вирівнювання ряду динаміки по прямій:
. Параметри а 0 а 1 згідно з методом найменших квадратів знаходяться рішенням наступної системи нормальних рівнянь:
, де у - фактичні (емпіричні) рівні низки; t– час (порядковий номер періоду чи моменту часу). Розрахунок параметрів спрощується, якщо за початок відліку часу (t = 0) прийняти центральний інтервал (момент). Т.ч., система набуває вигляду
. Таким чином, отримуємо:
;
.
25.Аналіт.вирівн. за способом наймен. Квадрата

Метод найменших квадратів застосовується для більш точної кількісної оцінки динаміки явища, що вивчається. Найбільш простий і часто зустрічається у практиці є лінійна залежність, що описується рівнянням:

У х = а + вХ, або У теоретич. = У середнє + вХ,

де У х - теоретичні (розрахункові) рівні низки за кожний період;
а - середньоарифметичний показник рівня ряду, що розраховується за формулою:
а = ΣУ факт. /n;
в - параметр прямий, коефіцієнт, що показує різницю між теоретичними рівнями низки за суміжні періоди, визначається шляхом розрахунку за формулою: в = Σ(ХУ факт)/ΣХ 2
де n-число рівнів динамічного ряду;
X - тимчасові точки, натуральні числа, що проставляються від середини (центру) ряду в обидва кінці.

За наявності непарного ряду рівень, що займає серединне положення, приймається за 0. Наприклад, за 9 рівнів ряду: -4, -3, -2, -1, 0, +1, +2, +3, +4.

При парному числі рівнів дві величини, що займають серединне становище, позначаються через -1 і +1, проте - через 2 інтервали. Наприклад, за 6 рівнів ряду: -5, -3, -1, +1, +3, +5.

Розрахунки проводять у наступній послідовності:


  1. Представляють фактичні рівні динамічного ряду (Ф) (див. табл.).

  2. Підсумовують фактичні рівні низки та отримують суму У факт.

  3. Знаходять умовні (теоретичні) часові точки ряду X, щоб їх сума (ΣХ) дорівнювала 0.

  4. Зводять теоретичні часові точки квадрат і підсумовують їх, отримуючи ЕX 2 .

  5. Розраховують твір Х на У та підсумовують, отримуючи ΣХУ.

  6. Розраховують параметри прямої:
    а = ΣУ факт / n = Σ(Х У факт) / ΣX 2

  7. Підставляючи послідовно рівняння У х = а + аУ значення X, знаходять вирівняні рівні У х.

26. Аналіз сезонних коливань

При порівнянні квартальних та місячних даних багатьох соціально-економічних явищ часто виявляються періодичні коливання, що виникають під впливом зміни пір року. У статистиці періодичні коливання, які мають певний та постійний період, що дорівнює річному проміжку, називаються сезонні коливанняабо сезонні хвилі, динамічний ряд називають сезонним рядом динаміки. У статистиці існують методи вивчення та виміру сезонних коливань. Найпростіший – побудова спеціальних показників, які називаються індексами сезонності (Is). Сукупність цих показників відбиває сезонну хвилю. Індекси сезонності - % відношення фактичних (емпіричних) внутрішньогрупових рівнів до теоретичних (розрахункових) рівнів, що виступають як база порівняння. Для того, щоб виявити стійку сезонну хвилю, їх обчислюють за даними за кілька років (не менше 3), розподіленими за місяцями. До кожного місяця розраховується середня величина рівня ( ), потім обчислюється середньомісячний рівень для всього ряду y. Після цього визначається показник сезонної хвилі – індекс сезонності Is як відсоткове ставлення середніх кожного місяця до загального середньомісячного рівня низки, %. Середній індекс сезонності для 12 місяців має дорівнювати 100%, тоді сума індексів повинна становити 1200. Коли рівень виявляє тенденцію до зростання або зниження, то відхилення від постійного середнього рівня можуть спотворити сезонні коливання. У цьому випадку фактичні дані зіставляють з вирівняними, тобто отримані аналітичним вирівнюванням. Формула:
.

27.І.інтерполяція та екстраполяція

Під час вивчення тривалої динаміки іноді виникає необхідність визначення невідомих рівнів усередині низки динаміки.

Інтерполяцією називається приблизний розрахунок рівнів усередині однорідного періоду, коли відомі прилеглі по обидва боки рівні.

Екстраполяцією називається розрахунок недостатнього рівня, коли відомий рівень лише з одного боку. Якщо розраховується рівень у бік майбутнього, це називається перспективною екстраполяцією, у бік минулого – ретроспективною екстраполяцією.

Як інтерполяція, і екстраполяція повинні проводитися під час дії однієї закономірності. Передбачається, що закономірність розвитку, знайдена всередині ряду, зберігається.

Прийоми розрахунку невідомого рівня залежить від характеру зміни досліджуваного явища. При плавному характері зміни рівня можна недостатній рівень визначити: напівсумою двох прилеглих рівнів, за абсолютним середнім приростом, за середнім темпом зростання.

За збереження пост-х абсолютних приростів відсутніх ур-ней динамич.ряда розрахував-ся: = +

Початковий рівень

Якщо передбачаються постійні темпи зростання відсутній ур-нь ряду обчислюється по ф-ле:

Якщо у ряді динаміки відзначаються різкі коливання, краще застосовувати середній абсолютний приріст чи середній темпи зростання протягом період дослідження, як зазначено у формулах.

Індексами називають порівняльні відносні величини, які характеризують зміну складних соціально-економічних показників (показники, що складаються з елементів, що не підсумовуються) у часі, у просторі, порівняно з планом.

Індекс - це результат порівняння двох однойменних показників, при обчисленні якого слід розрізняти чисельник індексного відношення (порівнюваний або звітний рівень) та знаменник індексного відношення (базовий рівень, з яким проводиться порівняння). Вибір основи залежить від мети дослідження. Якщо вивчається динаміка, то базисну величину то, можливо взятий розмір показника періоді, попередньому звітному. Якщо необхідно здійснити територіальне порівняння, то за базу можна прийняти дані іншої території. За базу порівняння можуть прийматися планові показники, якщо необхідно використовувати індекси як виконання плану.

Індекси формують найважливіші економічні показники національної економіки та її окремих галузей. Індексні показники дозволяють здійснити аналіз результатів діяльності підприємств та організацій, що випускають найрізноманітнішу продукцію або займаються різними видами діяльності. З допомогою індексів можна простежити роль окремих чинників для формування найважливіших економічних показників, виявити основні резерви виробництва. Індекси широко використовуються у зіставленні міжнародних економічних показників щодо рівня життя, ділової активності, цінової політики тощо.

Існує два підходи в інтерпретації можливостей індексних показників: узагальнюючий (синтетичний) та аналітичний, які у свою чергу визначаються різними завданнями.

29. Агрегатні індекси

Загальний індексвідбиває зміна всіх елементів складного явища. Якщо індекси охоплюють в повному обсязі елементи, їх називають груповими чи субиндексами. Розрізняють індекси агрегатні та середні, обчислення яких і становить спеціальний прийом дослідження, що називається індексним шляхом. При побудові загальних індексів: 1. необхідно вибрати елементи, які слід поєднати в одному індексі; 2. правильно вибрати співвимірник чи вагу, тобто. постійна ознака. Вибір ваги залежить від того, якою індексується ознака – кількісна чи якісна. Основною формою загальних індексів є агрегатна форма. Індекс агрегатної форми будується методом сум. Агрегатна форма застосовується, якщо ми маємо дані поелементні у звітному та базисному періоді . Індекс товарооб:
; ін-с фіз обсяг прод
; ^ Індекс споживчих цін є загальним вимірником інфляції. величиною, що Індексується, в ньому буде ціна товару. При побудові індексу цін як ваги індексу зазвичай беруть кількість товарів, проданих у поточному (звітному) періоді. Агрегатний індекс цін зі звітними вагами вперше запропонований Пааше та носить його ім'я: формула агрегатного індексу цін Пааше
, де
- фактична вартість продукції (товарообіг) звітного періоду;
- умовна вартість товарів, реалізованих у звітному періоді за базовими цінами.

формулу агрегатного індексу цін Ласпейреса:

30.Ср.арифм. і гармон.інд.,зв'язок з агрег.

Основною формою загальних індексів є агрегатна форма. Індекс агрегатної форми будується методом сум. Агрегатна форма застосовується, якщо ми маємо дані поелементні у звітному та базисному періоді . Багато статистичних показників, що характеризують різні сторони суспільних явищ, знаходяться між собою у певному зв'язку (часто у вигляді твору). Статистика характеризує ці взаємозв'язки кількісно. Багато економічних показників тісно пов'язані між собою та утворюють індексні системи. Прийнято наступне практика факторного аналізу: якщо результативний показник = добутку об'ємного та якісного факторів, то якісний фактор фіксується на рівні базисного періоду; якщо визначається вплив якісного показника, то об'ємний чинник фіксується лише на рівні звітного періоду. Розглянемо побудову взаємозалежних індексів з прикладу індексів цін, фізичного обсягу продукції (якщо йдеться про відпускні ціни) чи фізичного обсягу товарообігу (якщо йдеться про роздрібні ціни) та індексу вартості продукції (товарообігу у фактичних цінах). Індекси фізичного обсягу та цін є факторними щодо індексу вартості продукції(Товарообігу у фактичних цінах):
, або
. Таким чином, добуток індексу цін на індекс фізичного обсягу продукції дає індекс вартості продукції (товарообігу у фактичних цінах). Індексна система дозволяє за двома відомими значеннями індексів знайти значення третього невідомого. Індекс фізичного обсягу продукції: ;Крім агрегатного способу розрахунку загальних індексів існує й інший спосіб, який полягає у розрахунку загальних індексів як середніх із відповідних індивідуальних індексів. До обчислення таких середньозважених індексіввдаються тоді, коли інформація, що є в розпорядженні, не дозволяє розрахувати агрегатний індекс. Так, якщо невідомі кількості вироблених окремих продуктів у натуральних вимірниках, але відомі індивідуальні індекси
та вартість продукції базисного періоду ( p 0 q 0 ), можна визначити середній арифметичний індекс фізичного обсягу продукції. Вихідною базою побудови є агрегатна форма. З даних можна отримати лише знаменник цієї формули. Для знаходження чисельника використовується формула індивідуального індексу обсягу продукції, з якої випливає, що q 1 = q 0 i q. Підставляючи цей вираз у чисельник агрегатної форми, отримуємо загальний індекс фізичного обсягу у формі середнього арифметичного індексу фізичного обсягу продукції , де терезами служить вартість окремих видів продукції в базисному періоді ( q 0 p 0 ):
.

Якщо дані представлені у вигляді аналітичного угруповання, то можна обчислити загальну дисперсію, міжгрупову і внутрішньогрупову (табл. 11).

Таблиця 11

Види дисперсій та правило складання дисперсій

Найменування дисперсії

Формула розрахунку

проста (незважена)

зважена

Загальна дисперсія вимірює варіацію ознаки у всій сукупності під впливом всіх факторів

Міжгрупова дисперсія вимірює систематичну варіацію, що виникла під впливом групувальної ознаки

Середня по тій групі; - Середня по всій сукупності; - Число одиниць сукупності-число одиниць в-тій групі

Внутрішньогрупова (приватна) дисперсія розраховується окремо для кожної групи

Індивідуальні значення ознаки в тій групі; - Середня групи; - Число одиниць у сукупності; - число одиниць у тій групі

Середня внутрішньогрупова дисперсія вимірює випадкову варіацію, що виникає під впливом всіх факторів, крім групувальної ознаки

Правило складання дисперсій

На підставі правила складання дисперсій розраховують:

1) емпіричний коефіцієнт детермінації показує частку варіації результативної ознаки, обумовлену варіацією групувальної ознаки:

2) емпіричне кореляційне відношення показує тісноту зв'язку між групувальною та результативною ознаками:

Емпіричне кореляційне відношення варіює від 0 до 1. При зв'язку немає, при - повний зв'язок.

Проміжні значення оцінюються за шкалою Чеддока:

Дисперсія альтернативної ознаки

Альтернативний ознака - якісна ознака, яка може набувати лише одне значення з двох. Наприклад, стать - чоловіча або жіноча; сімейний стан - одружений чи ні; продукція - придатна чи бракована. Одна частина сукупності має альтернативну ознаку, інша немає. Частка одиниць, що володіють альтернативною (вивченою) ознакою, позначається - р, неволодіючих - q. Наявність альтернативної ознаки одиниць сукупності позначається 1, відсутність - 0.

Поняття варіації

Середня дає узагальнюючу характеристику всієї сукупності досліджуваного явища.

Варіацією ознакиназивається відмінність індивідуальних значень ознаки всередині досліджуваної сукупності.

Середня величина є абстрактною, узагальнюючою характеристикою ознаки сукупності, що вивчається, але вона не показує будову сукупності.

Середня величина не дає уявлення про те, як окремі значення ознаки, що вивчається, групуються навколо середньої, зосереджені вони поблизу або значно відхиляються від неї.

Якщо окремі значення ознаки близькі до середньої арифметичної, то цьому випадку середня добре представляє всю сукупність. І навпаки.

Коливання окремих значень характеризують показники варіації.

Термін «варіація» походить від латинського variatio – зміна, коливання, відмінність. Однак не всі відмінності прийнято називати варіацією.

Під варіацієюу статистиці розуміють такі кількісні зміни величини досліджуваної ознаки в межах однорідної сукупності, які обумовлені впливом дії різних факторів, що перехрещується. Розрізняють варіацію ознаки в абсолютних та відносних величинах. Абсолютна - R, L, σ, σ 2 .

Показники варіації

1 сукупність 2 сукупність
n=5 80, 100, 120, 200, 300 n=8 145, 150, 155, 160, 160, 162, 168, 180

80 100 120 x 200 300

Тож у разі виникає необхідність визначити варіацію ознаки, тобто. співвідношення окремих значень ряду щодо один одного.

Показники варіації

1. Розмах варіації являє собою різницю між максимальним і мінімальним значенням ознаки.

R = X max - X min

R 1 = 300-80 = 220 R 2 = 180-145 = 35

Практика: для однорідної сукупності, контролю якості продукції.

2. Показники, що враховують відхилення всіх варіантів від середньої арифметичної.

а) Середнє лінійне відхилення

б) Середнє квадратичне відхилення

Середнє лінійне відхиленняявляє собою середнє арифметичне абсолютних значень відхилень окремих варіантів від середньої.

для не згрупованих:

;

для згрупованих:

Практика:з його допомогою аналізується:

1. Склад працюючих

2. Ритмічність виробництва

3. Рівномірність постачання матеріалів

Недолік:цей показник ускладнює розрахунки ймовірного типу, ускладнює застосування методів математичної статистики

Середнє квадратичне відхилення (стандартне)– це

для не згрупованих даних

для згрупованих даних

Для помірно асиметричних розподілів

Середнє квадратичне відхилення, як і середнє лінійне відхилення - це абсолютний показник, що виражається в тих самих одиницях, що і середнє арифметичне.

Показники середнього квадратичного або середнього лінійного відхилень для двох сукупностей виявляються непорівнянними, якщо самі ознаки цих сукупностей неоднакові. Несопоставляются ці показники й у різних ознак однієї сукупності. Тобто. коли середні в обох сукупностях виражені в одних і тих самих одиницях виміру і однакові, зіставлення можливе і відобразить відмінності в варіації ознаки.

Середнє квадратичне відхилення є мірилом середньої надійності. Чим менше σ, тим краще середнє арифметичне відбиває собою всю сукупність, що представляється.

3. Дисперсіявикористовується для вимірювання коливання ознаки. Цей показник більш об'єктивно відображає міру варіації

для не згрупованих

для згрупованих

Відмінною особливістю даного показника є те, що при зведенні у квадрат питома вага малих відхилень падає, а великих збільшується у загальній сумі відхилень.

Це також абсолютний показник

Дисперсія має ряд властивостей, деякі з них дозволяють спростити її обчислення:

1. Дисперсія постійної величини дорівнює 0

2. Якщо всі варіанти значень ознаки (x) ↓ на те саме число, то дисперсія не зменшується

3. Якщо всі варіанти ↓ в одне і те ж число разів (K разів), то дисперсія ↓ в 2 рази

x f x "

x у 100 разів

Дисперсія σ дорівнює 0,909 * 10000 = 9090

Вище було розглянуто розрахунок показників варіації для кількісних ознак, але може ставитися завдання оцінки варіації якісних ознак. Наприклад, щодо якості виготовленої продукції можна розділити на придатну і браковану.

У такому разі йдеться про альтернативні ознаки.

Дисперсія альтернативної ознаки

Альтернативними ознакаминазиваються такі, якими одні одиниці сукупності мають, а інші ні. Наприклад, наявність виробничого стажу в абітурієнтів, науковий ступінь у викладачів ВНЗ тощо. Наявність ознаки одиниць сукупності умовно позначаємо через 1, а відсутність – 0. x 1 =1, x 2 =0. Частку одиниць, які мають ознакою (загалом) позначаємо через р, а частку одиниць, які мають – через q. Тобто. p+q=1, q=1-p.

Розрахуємо середнє значення альтернативної ознаки

; ;

Тобто. середнє значення альтернативної ознаки дорівнює частки одиниць, що мають дані ознаки, на частку одиниць, що не мають даних ознак.

Середнє квадратичне відхилення дорівнює Б p =

Перевіряється якість: 1000 готових виробів, 20 бракованих.

Знаходимо частку шлюбу: (20/1000) * 100% = 0,02%

Дисперсія має ряд властивостейякі дозволяють спростити розрахунок.

1. Якщо з усіх значень варіант відібрати якесь постійне число А, то середнє квадратичне відхилення від цього не зміниться.