대체 기능의 변형입니다. 분포 엔트로피

대체 기능은 일부 단위에는 있고 모집단의 다른 부분에는 없는 기능입니다.

분산은 주식의 곱과 같습니다( 아르 자형) 이 분수를 1로 보완하는 숫자로 ( ):

여기서 p는 기능이 있는 단위의 비율입니다.

q는 기능이 없는 단위의 비율입니다.

대체 기능 분산의 제한 값은 다음과 같은 경우 0.25입니다. 아르 자형 = 0,5.

예 6.1. 교수진 200 명 중-60 명. - 실패했습니다.

성취도가 낮은 학생의 비율은 p = 60 / 200 = 0.3입니다.

성공한 학생의 비율은 q = 1 – 0.3 = 0.7입니다.

몫의 분산은 = 0.3 0.7 = 0.21입니다.

예 6.2. 그룹화되지 않은 데이터에 대한 계산. 1, 2, 3, 3, 4, 4, 5, 7, 9, 12 근로자 10명의 경험에 대한 데이터가 있습니다. 변동 지표를 계산합니다.

계산을 위한 워크시트를 만들어 봅시다.

근로자 번호 경력, 년 ( x 나는) 엑스 2
-4
-3
-2
-2
-1
-1

평균적인 경험은 연령.

스팬 변동 아르 자형=12–1= 11세.

다음으로 평균과의 편차를 계산합니다. , 그리고

평균 선형 편차 연령.

분산

제곱의 평균

분산을 계산하는 두 번째 방법 = 35.4 - 5 2 = 10.4

올해의

변동 계수 V= 3.22 / 5 = 0.645 또는 64.5%

브이디= 2.6 / 5 = 0.520 또는 52.0%.

예제 6.3. 간격 변동 계열에 의한 계산.

급여에 따른 근로자 분포에 대한 데이터가 있습니다.

솔루션: 계산을 위한 워크시트를 만들어 봅시다.

샐러리 에프 간격의 중간( 엑스) x i f i
10까지 -21
10–20 -11
20–30 -1
30–40
40 이상

평균 연봉 천 루블.

평균 선형 편차 천 루블.

분산

표준 편차 천 루블.

변동 계수 V= 12.45 / 26 = 0.479 또는 47.9%

선형 변동 계수: 브이디= 10.36 / 26 = 0.398 또는 39.8%.

분산의 종류

총 분산 s 2결과 피쳐의 변동을 측정합니다( 와이) 모든 요인의 영향을 받는 총체적으로 ( 엑스 1 , 엑스 2 , 엑스 3 ...) 이 변형을 일으켰습니다.

그룹 간 분산체계적 변이, 즉 특성 요인의 영향으로 발생하는 연구 특성 값의 차이 ( 엑스) 그룹화의 기본이 됩니다. 공식에 따라 계산됩니다.

,

여기서 ` y 나는그리고 나는- 개별 그룹에 대한 그룹 평균 및 숫자.

그룹 내 분산()는 무작위 변동, 즉 설명되지 않은 요인의 영향으로 발생하는 변동의 일부를 반영하며 그룹화의 기본이 되는 속성 요인에 의존하지 않습니다. 다음과 같이 계산됩니다.

그룹 내 분산의 평균():

세 가지 유형의 분산과 관련된 법칙이 있습니다. 총 분산은 그룹 내 및 그룹 간 분산의 평균 합계와 같습니다.

통계 분석에서는 전체 분산에서 그룹 간 분산이 차지하는 비율을 나타내는 지표가 널리 사용됩니다. 이를 경험적 결정 계수()라고 합니다.

.

이 계수는 그룹화 형질의 변이로 인한 연구된 형질의 전체 변이의 비율(비중)을 나타냅니다.

경험적 결정 계수의 제곱근을 경험적 상관 비율( 시간):

.

그룹화의 기본 속성이 결과 속성의 변형에 미치는 영향을 특성화합니다. 경험적 상관 비율은 0에서 1까지 다양합니다. 시간= 0이면 그룹화 속성이 결과 속성에 영향을 주지 않습니다. 만약에 시간= 1이면 그룹화의 기본 기능에 따라서만 결과 기능이 변경되고 다른 요인 기능의 영향은 0과 같습니다. 중간 값은 한계 값에 대한 근접성에 따라 평가됩니다.

예제 6.4. 작업자 그룹에 대한 데이터가 있습니다.

기능 간의 관계 강도를 평가합니다.

솔루션: 그룹 평균 및 그룹 내 분산이 제공됩니다.

그룹 평균을 사용하여 전체 평균 결정

그룹 내 분산의 평균

그룹 간 분산

총 편차 에스 2 =6,955 + 34,65 = 41,605

경험적 결정 계수

34,65 / 41,605 = 0,833

경험적 상관 관계

이러한 값(1에 가까움)은 서비스되는 기계의 수와 평균 급여 사이의 매우 강한 관계를 나타냅니다.

6. 대체 기능의 분산

속성(비정량적) 기호의 특수한 경우는 대체 기호입니다. 모집단의 단위가 연구 중인 특정 특성을 가지고 있거나 가지고 있지 않을 때. 그러한 징후의 예는 다음과 같습니다. 결함이있는 제품의 존재, 대학 교사의 학위,받은 전문 분야의 작업, 전체 러시아 수준의 1 인당 평균 현금 소득 초과, 가족 내 자녀의 존재 등 .

대체 기능이 있는 경우 인구 단위에 값 "1"이 할당됩니다. 부재시 - "0".

계산의 가중치는 다음과 같습니다.

이 기능이 있는 단위의 비율

이 특성이 없는 단위의 비율

그러면 대체 기능의 평균값은 다음과 같습니다.

분산은 다음과 같은 형식을 취합니다.

대체 기능의 분산은 0에서 0.25까지 다양합니다. 0.25의 최대값은 0.5에 도달합니다.

예 4.11. 쿠르스크 주민 300명을 대상으로 한 선택적 설문 조사에서 60명이 도시의 상업 은행에서 개인 자금을 저축하는 것에 대해 긍정적으로 말했습니다.

기능의 평균 수준, 분산 및 표준 편차 결정

대체 기능의 변형을 실제로 적용하는 것은 주로 샘플링 중 신뢰 구간을 구성하는 데 있습니다.

7. 형질의 분포 형태 연구. 분포 패턴의 주요 특징

변형 시리즈를 기반으로 한 구성, 계산 및 결론의 성공을 위한 필수 조건은 깊은 이론적 분석을 기반으로 설정된 집계의 동질성입니다.

특징값의 변화에 ​​따른 주파수 변화의 순서를 명확하게 표현한 것을 분포 패턴이라고 합니다.

분포 패턴 유형(따라서 곡선의 모양)에 대한 지식이 무엇보다 먼저 필요합니다.

1. 기본 통계 자료를 얻기 위한 일반적인 조건을 명확히 합니다. 따라서 다중 꼭지점 또는 상당한 비대칭 곡선의 모양은 모집단의 이질적인 구성과 보다 동질적인 그룹을 식별하기 위해 데이터를 다시 그룹화해야 함을 나타냅니다.

2. 실제 계산 및 예측 구현의 정확성을 보장합니다. 따라서 간격 계열에서 최적의 그룹 수를 계산하기 위한 G. Sturgess 공식, "3 시그마" 규칙, 모집단 동질성의 지표인 변동 계수 Vσ, 현상, 분산 분석 방법 및 기타 방법은 정규 및 분포에 가까운 조건에서만 유효합니다.

빈도 분포 유형으로 표현되는 변동 계열의 패턴은 도수 분포의 히스토그램 및 다각형과 같은 그래프에 명확하게 나타납니다. 그들의 조사는 히스토그램에서 분포에 큰 불연속성이 있고 다각형에서 한 그룹에서 다른 그룹으로 점진적인 전환이 있음을 보여줍니다. 폴리곤의 파선은 부분적으로 히스토그램의 튀는 부분을 부드럽게 하고 보다 일반적인 분포 분석 방법입니다.

간격 변동 시리즈의 선이 증가하고 해당 간격의 크기가 감소함에 따라 분포 다각형의 면 수가 증가하고 파선이 한계에서 특정 곡선으로 바뀌는 경향이 있습니다. 이러한 곡선을 분포 곡선이라고 합니다. 그 안에서 무작위 요인의 영향으로부터 가장 큰 데이터 릴리스가 발생합니다. 그것은 가장 일반적인 형태로 변이의 본질, 단일 질적 현상 세트 내에서 주파수 분포의 규칙성을 드러내고 보여줍니다.

분포 곡선은 다른 유형일 수 있습니다. 사회경제적 연구에서는 정규 분포 곡선이 널리 사용됩니다. 단일 꼭지점 대칭 종형 도형으로 좌우 가지가 균일하고 대칭적으로 감소하여 가로축에 점근적으로 접근한다.

이 곡선의 특징은 산술 평균, 모드 및 중앙값이 일치한다는 것입니다. 곡선과 x축 사이의 전체 영역을 100%로 하면 주파수의 68.3%가 한계 내에 있고 95.4%가 한계 내에 있으며 99.7%가 한계 내에 있습니다("3 시그마 규칙"). .

정상적 또는 대칭적 분포는 여러 현상의 본질에 해당하지만 사회적 현상의 특징은 아닙니다. 이는 발전하는 것이 아니라 변동하는 단위 집합에만 내재된 외부 영향으로 인한 차이를 반영하기 때문입니다. 사회 현상은 발전과 역동성을 특징으로 합니다. 따라서 사회 현상 빈도 분포의 계열과 곡선은 원칙적으로 비대칭이며 빈도가 최대로 증가하고 고르지 않게 감소합니다. 연구 중인 프로세스가 활성 개발 단계를 거치고 있음을 간접적으로 나타내는 역할을 하는 것은 일련의 균질한 집합체에서 비대칭 또는 왜곡의 존재입니다.

비대칭 계열 및 해당 곡선은 수학적 통계에 의해 조사되는 다양한 형태의 분포를 갖습니다. 이러한 형태는 Poisson 분포, Maxwell 분포, Pearson 분포 등입니다. 여기서 비대칭은 일반적으로 단일 유형의 분포로 간주됩니다. 동시에 오른쪽과 왼쪽 비대칭(베벨)이 구별됩니다.

곡선의 긴 가지가 상단의 오른쪽에 있으면 비대칭이 오른 손잡이라고합니다. 이 가지가 상단의 왼쪽에 있으면 왼손잡이입니다. 왼쪽과 오른쪽 비대칭이 있습니다. 따라서 참조되는 이들 간의 차이를 K. Pearson 계수라고 하며 비대칭 계수로 사용됩니다.

. (20)

오른쪽 비대칭의 경우 이 계수는 양수이고 왼쪽 비대칭의 경우 음수입니다. = 0이면 변형 계열이 대칭입니다. 계수의 절대값이 클수록 왜곡도가 커집니다.

분포 왜도의 가장 정확한 지표는 다음 공식으로 계산되는 왜도 계수입니다.

(21)

여기서 n은 인구 단위의 수입니다. Pearson 계수의 경우와 마찬가지로 > 0에서 오른쪽 비대칭이 발생합니다.< 0 левосторонняя. В симметричных распределениях = 0.

|| 값이 클수록 분포가 더 비대칭적입니다. 다음과 같은 비대칭 평가 척도가 설정되었습니다.

|| - 경미한 비대칭;

0,25 < || - асимметрия заметная (умеренная);

|| > 0.5 - 상당한 비대칭.

계수 및 는 상대적인 무차원 양이므로 다양한 분포 계열의 비대칭성을 비교 분석하는 데 자주 사용됩니다.

비대칭의 특성은 때때로 개발 방향을 나타냅니다. 증가에 관심이 있는 특성의 변이(규범 충족, 제품 산출 등)를 연구할 때 오른쪽 비대칭은 발달의 진행성을 나타내며, 표시기 및 왼쪽 비대칭은 많은 수의 지체 영역이 있음을 나타냅니다.

감소에 관심이 있는 기능의 변화(비용, 노동 집약도, 출력 단위당 원자재 소비 등)를 연구할 때 오른쪽 비대칭은 아래에서 프로세스 개발의 단점을 나타냅니다. 연구에서 왼쪽 비대칭은 개발의 진행성을 나타내며 후자는 지표가 감소하는 방향으로 진행됩니다. 서비스 기간에 따른 직원 분포 (예시 4.9 \u003d 5.75 참조)에서 비대칭 계수가 양수이기 때문에 오른쪽 비대칭이 관찰됩니다 : (5.955-5.75) : 2.47 \u003d 0.095. 이 시리즈에 대한 이러한 비대칭은 점진적이며 연구 지표를 증가시키는 방향으로 시리즈의 발전을 나타냅니다.

분포의 모양은 특히 히스토그램과 다각형으로 표시되는 경우 시리즈의 경험적 데이터를 고려하여 잠정적으로 직접 결정할 수 있습니다. 분포 형태의 대략적인 정의의 정확성을 확인하기 위해 시리즈의 경험적 데이터가 해당 분포 곡선을 구성하여 설정된 이론적 분포에 대한 근접성을 검사합니다. 그러나 많은 경우 이론이나 경험적 자료에 대한 직접적인 검토는 분포의 형태에 대한 질문에 대한 답을 제공하지 못한다. 그런 다음 대부분의 경우 약간 또는 중간 정도의 비대칭을 가진 분포가 유형에서 정규 유형이기 때문에 경험적 데이터가 정규 분포에 근접하는지에 대한 연구가 일반적으로 수행됩니다.

경험적 분포와 정규 분포의 일치 정도에 대한 객관적인 판단을 위해 통계는 일치 기준 또는 일치 기준이라는 여러 기준을 사용합니다.

여기에는 다양한 이론적 개념의 사용을 기반으로 하는 Pearson, Romanovsky, Yastremsky, Kolmogorov의 기준이 포함됩니다.

예를 들어 가장 많이 사용되는 Pearson의 적합도 검정("카이제곱")은 다음과 같습니다.

, (22)

경험적 주파수(주파수)는 어디에 있습니까?

이론 주파수(주파수)

이론적 분포에 대한 경험적 분포의 근접성을 평가하기 위해 이 기준에 따라 이 값을 달성할 확률이 결정됩니다. 이 확률이 0.05를 초과하면 이론적 빈도와 실제 빈도의 편차는 무작위로 중요하지 않은 것으로 간주됩니다. 이면 편차가 중요한 것으로 간주되며 경험적 분포는 이론적 분포와 근본적으로 다릅니다.

정규 분포에서 대칭 분포의 편차 정도를 특성화하기 위해 첨도 지표가 계산됩니다. Lindberg 계수를 사용하여 대략적으로 결정할 수 있습니다.


, (23)

여기서 는 이 계열의 총 옵션 수에서 표준 편차의 절반(평균값에서 어느 방향으로든)에 해당하는 간격에 있는 옵션 수의 비율(%)입니다.

38.29 - 일련의 정규 분포에 대한 총 옵션 수에서 표준 편차의 절반(평균값에서 어느 방향으로든)과 같은 간격에 있는 옵션 수의 비율(%)

첨도는 양수, 음수 또는 0일 수 있습니다.

정점이 높은 곡선의 경우 첨도 지수에 양의 부호가 있고 정점이 낮은 곡선의 경우 음의 부호가 있습니다. 정규 분포 곡선의 경우 값은 0입니다.

정규 분포에서 대칭 분포의 편차 정도를 보다 정확하게 특성화하기 위해 정점 지수(첨도 지수)(Ek)는 다음 공식을 사용하여 계산됩니다.

(24)

Lindbergh 계수와 마찬가지로 양수, 음수 또는 0이 될 수 있습니다. 첨도 지표는 비대칭 지표와 마찬가지로 추상적 숫자입니다. 음의 첨도의 제한 값은 Ek= -2의 값입니다. 양의 첨도의 크기는 무한한 크기입니다.

비대칭 및 첨도 지표의 정의는 설명적 가치를 가질 뿐만 아니라 종종 해당 값이 연구 현상에 대한 추가 연구를 위한 특정 지표를 제공합니다. 예를 들어 유의미한 음의 첨도가 나타나면 연구 대상 모집단의 질적 이질성을 나타낼 수 있습니다.

최신 컴퓨터 기술은 변이 계열 분석을 위한 번거로운 계산 작업을 수행할 수 있는 광범위한 가능성을 열어줍니다. 재료가 이론적으로 이해되고 분포 형태에 대한 합리적인 가설이 제시되면 (후자는 컴퓨터도 확인할 수 있음) 컴퓨팅 장치는 다양한 일반화 지표 및 기준을 빠르게 계산하고 그래프를 작성할 수 있습니다. 변동 지표가 상대적으로 단순하고 잘 공식화되어 있기 때문에 이는 더욱 가능합니다.


사용 문헌 목록

1. Vinogradova N.M., Evdokimova V.T., Khitarova E.M. 외 일반통계이론: Textbook / Ed. I.G. Venetsky / - M .: 통계, 1968 - 380s

2. 구사로프 빅토르 막시모비치. 통계: Proc. 경제 전문 분야에서 공부하는 대학 학생들을위한 매뉴얼 / V.M. 구사 로프, E.I. Kuznetsova.- 2nd ed., 개정. 추가 - M.: UNITI-DANA, 2007.- 479s

3. 구사로프, 빅토르 막시모비치. 일반통계이론: Proc. 경제 전문 분야에서 공부하는 대학 학생들을위한 매뉴얼 / V.M. 구사 로프, S.M. 개발 - 2판, 개정판. 추가 – M.: UNITI-DANA, 2008.- 207s

4. Ilyishev Anatoly Mikhailovich. 통계학 일반론: 경제학과 경영학을 전공하는 대학생을 위한 교과서 / A.M. Ilyishev, - M.: UNITI-DANA, 2008. - 535s

5. Ryauzov N.N. 일반 통계 이론: 학생들을 위한 교과서. 경제 전문가. 대학 - 4판. 개정 추가 -M .: 재정 및 통계, 1984.- 343s

6. Salin V.N., Churilova E.Yu. 재무 및 경제 프로필 전문가 양성을 위한 통계 이론 과정: 교과서. - M .: 재무 및 통계, 2006 - 480s

7. 사회적 생산의 효율성을 높이는 요인을 분석하기 위한 통계적 방법. 지도 시간. 에드. Ryauzova N.N. Akinshina M.K.-M.VZFEI. 1980-88년대

8. 통계: Proc. 수당 / A.V. 바가트, M.M. Konkina, V.M. Simcher 및 기타; 에드. V.M. Simchery. - M .: 재정 및 통계, 2005.- 368s

9. 통계. 컴퓨터 실험실 작업: 실험실 작업 지침 1번 "MS Excel에서 통계 모집단의 선험적 분석을 자동화했습니다." / G.P. Kozhevnikova, A.V. Golikova, A.M. 카마니나, A.M. 보브로프. 에드. 교수 G.P. Kozhevnikova - M .: Vuzovsky 교과서, 2005.-72s.

10. 통계 이론: 교과서/Ed. 교수 R.A. Shmoylova - 3판, 개정판. -M .: 재정 및 통계, 1999.- 560s.


deniya - 보고 및 특별히 조직된 모니터링. 보고는 기업, 조직이 그들의 활동을 특징짓는 영구적인 정보를 통계 및 고위 당국에 제공하는 관찰의 한 형태입니다. 리포팅은 엄격하게 정의된 용어로 미리 정해진 프로그램에 따라 제공되며 일상적인 프로세스에서 필요한 가장 중요한 지표를 포함합니다...

매년 새로운 기술의 도입으로 인해 이르쿠츠크 농업 아카데미의 도움으로 비즈니스에 대한 과학적 접근이 증가하고 있습니다. 3. 계란 비용의 경제적 및 통계적 분석 3.1. 통계적 관찰 통계적 관찰은 체계적이고 과학적으로 조직되며 일반적으로 사회 현상 및 과정에 대한 체계적인 데이터 수집입니다 ...

23. 대안의 분산. 징후

기능 분산 (통계 모집단에서 상호 배타적인 옵션이 두 개만 있는 방식으로 속성이 변경되는 경우 이러한 가변성을 대안이라고 합니다.) 다음 공식으로 계산할 수 있습니다.

이 분산 공식으로 대체 q = 1- p, 우리는 다음을 얻습니다.


성장 인자 Ki는 이전 또는 기본 수준에 대한 주어진 수준의 비율로 정의되며 계열의 상대적 변화율을 나타냅니다. 성장률을 백분율로 표시하면 성장률이라고 합니다.

기본 성장 인자

사슬 성장률

24. 주요 개발 동향 연구

통계의 가장 중요한 작업 중 하나는 일련의 역학에서 현상 개발의 일반적인 추세를 결정하는 것입니다. 다양한 요인이 시간이 지남에 따라 현상의 발달에 영향을 미칩니다. 따라서 역학을 분석할 때 연구 개발 단계 전체에서 상당히 안정적인(지속 가능한) 주요 추세에 대해 이야기하고 있습니다. 주요 개발 동향(TREND)임의의 변동이없는 시간에 따른 현상 수준의 부드럽고 안정적인 변화라고합니다. 이를 위해 구간확대, 이동평균, 분석정렬 등의 방법으로 시계열을 처리한다. 시계열의 기본 추세를 연구하는 가장 간단한 방법은 다음과 같습니다. 간격의 확대.이 방법은 시계열의 수준을 포함하는 기간의 확대를 기반으로 합니다(동시에 간격 수가 감소함). 주요 추세 식별도 수행할 수 있습니다. 이동(이동) 평균 방법.그 본질은 평균 수준이 행의 첫 번째 수준의 특정 숫자, 일반적으로 홀수 (3, 5, 7 등)에서 계산된 다음 동일한 수준 수에서 계산된다는 사실에 있습니다. 연속으로 두 번째, 더 나아가 - 중간에서 시작하는 등 따라서 평균은 일련의 역학을 따라 "슬라이드"하여 한 기간 동안 이동합니다. 시리즈 스무딩의 단점은 실제 시리즈와 비교하여 스무딩된 시리즈의 "축소"이므로 정보 손실이 있습니다. 시간에 따라 시계열 수준이 변화하는 주요 추세를 나타내는 정량적 모델을 제공하기 위해 시계열의 분석적 정렬이 사용됩니다. 메인 콘텐츠 분석 정렬 방법일련의 역학에서 일반적인 개발 추세는 시간의 함수로 계산됩니다. 여기서 동적 시리즈의 수준은 당시 해당 분석 방정식에 따라 계산됩니다.

^ 일련의 역학을 직선으로 정렬:
. 최소 제곱법에 따른 매개변수 a 0 및 1은 다음과 같은 정규 방정식 시스템을 풀어서 구합니다.
, 여기서 y는 계열의 실제(경험적) 수준입니다. – 시간(기간 또는 특정 시점의 일련 번호). 중심 간격(모멘트)을 시간의 원점(t = 0)으로 간주하면 매개변수 계산이 크게 단순화됩니다. 따라서 시스템은 다음과 같은 형식을 취합니다.
. 따라서 우리는 다음을 얻습니다.
;
.
25. 분석 정렬 이름으로. 정사각형

최소제곱법 연구 중인 현상의 역학을 보다 정확하게 정량적으로 평가하는 데 사용됩니다. 실제로 가장 단순하고 가장 일반적인 것은 다음 방정식으로 설명되는 선형 관계입니다.

Y x \u003d a + bX 또는 이론적 Y. \u003d U 평균 + vX,

여기서 Y x - 각 기간에 대한 시리즈의 이론적(계산된) 수준
a - 행 수준의 산술 평균으로 다음 공식으로 계산됩니다.
a=Σy 사실. /N;
c - 직선의 매개변수, 인접한 기간에 대한 계열의 이론적 수준 간의 차이를 나타내는 계수는 다음 공식에 따라 계산하여 결정됩니다. c = Σ (XY 팩트) / ΣX 2
여기서 n은 동적 범위의 레벨 수입니다.
X - 임시 점, 자연수, 행의 중간(중앙)에서 양쪽 끝까지 부착됩니다.

홀수 행이 있는 경우 중간 위치의 레벨은 0으로 간주됩니다. 예를 들어 행에 레벨이 9개 있는 경우: -4, -3, -2, -1, 0, +1, +2, +3 , +4.

시리즈의 짝수 수준에서 중간 위치를 차지하는 두 값은 -1과 +1로 표시되고 나머지는 모두 2 간격으로 표시됩니다. 예를 들어 -5, -3, -1, +1, +3, +5의 6개 수준 시리즈가 있습니다.

계산은 다음 순서로 수행됩니다.


  1. 동적 계열(U f)의 실제 수준을 나타냅니다(표 참조).

  2. 시리즈의 실제 수준이 합산되고 합계 Y 팩트가 구해집니다.

  3. 합계(ΣX)가 0이 되도록 X 계열의 조건부(이론적) 시점을 찾습니다.

  4. 이론적 시점을 제곱하고 합산하여 EX 2를 제공합니다.

  5. X와 Y의 곱이 계산되고 합산되어 ΣXY가 됩니다.

  6. 직선의 매개변수를 계산합니다.
    a = ΣY 팩트 / ​​n c = Σ(X Y 팩트) / ΣX 2

  7. 방정식 Y x \u003d a + aY에 X 값을 순차적으로 대입하면 정렬 된 Y x 수준이 발견됩니다.

26.계절 변동 분석

많은 사회경제적 현상에 대한 분기별, 월별 데이터를 비교할 때 계절의 변화에 ​​따라 주기적인 변동이 자주 발견됩니다. 통계에서는 1년 간격과 같은 명확하고 일정한 기간을 갖는 주기적 변동을 호출합니다. 계절 변동또는 계절적 파동의 경우 시계열을 계절 시계열이라고 합니다. 통계에는 계절적 변동을 연구하고 측정하는 방법이 있습니다. 가장 간단한 방법은 계절성 지수(Is)라고 하는 특수 지표를 구성하는 것입니다. 이러한 지표의 전체는 계절적 파동을 반영합니다. 계절성 지수 - 비교 기준으로 작용하는 이론적(계산된) 수준에 대한 실제(경험적) 그룹 내 수준의 비율 %. 안정적인 계절적 파동을 식별하기 위해 몇 개월에 걸쳐 분포된 몇 년(최소 3년)의 데이터에서 계산됩니다. 매월 평균 수준이 계산됩니다( ) 전체 계열 y̅에 대해 평균 월간 수준이 계산됩니다. 그 후 계절적 파동의 지표가 결정됩니다. 계절성 지수 시리즈의 총 월 평균 수준에 대한 월 평균의 백분율, %입니다. 12개월의 평균 계절성 지수는 100%여야 하며, 지수의 합은 1200이어야 합니다. 수준이 상승 또는 하락 추세를 보일 때 일정한 평균에서 벗어나는 경우 계절적 변동이 왜곡될 수 있습니다. 이 경우 실제 데이터는 정렬된 데이터, 즉 분석적 정렬로 얻은 데이터와 비교됩니다. 공식:
.

27.I.보간 및 외삽

장기 역학을 연구할 때 때때로 일련의 역학 내에서 알려지지 않은 수준을 결정해야 합니다.

보간법은 양쪽에 인접한 레벨이 알려진 경우 동차 기간 내에서 누락된 레벨을 대략적으로 계산하는 것입니다.

외삽법은 수준이 한쪽에서만 알려진 경우 누락된 수준을 계산하는 것입니다. 수준이 미래를 향해 계산되는 경우 이를 전향적 외삽(prospective extrapolation), 과거를 향한 외삽(retrospective extrapolation)이라고 합니다.

내삽법과 외삽법은 모두 동일한 규칙성 기간 동안 수행되어야 합니다. 시리즈 내에서 발견되는 전개 패턴이 유지된다고 가정합니다.

알 수 없는 수준을 계산하는 방법은 연구 중인 현상의 변화 특성에 따라 다릅니다. 수준이 순조롭게 변경되면 누락된 수준을 결정할 수 있습니다. 인접한 두 수준의 합의 절반, 평균 절대 증가, 평균 성장률로 결정됩니다.

동적 계열의 누락된 수준의 x 이후 절대 증분을 유지하면서 계산: = +

첫 번째 수준

일정한 성장률을 가정하는 경우 계열의 누락 수준은 다음 공식에서 계산됩니다.

시계열에 급격한 변동이 있는 경우 공식에 표시된 대로 전체 연구 기간 동안 평균 절대 증가 또는 평균 증가율을 사용하는 것이 좋습니다.

지표는 계획과 비교하여 시간과 공간에서 복잡한 사회 경제적 지표(합산할 수 없는 요소로 구성된 지표)의 변화를 특징짓는 비교 상대 값입니다.

지수는 지수 비율의 분자(비교 또는 보고 수준)와 지수 비율의 분모(비교 기준 수준)를 구별해야 하는 것을 계산할 때 같은 이름의 두 지표를 비교한 결과입니다. 만들어진). 기본 선택은 연구 목적에 따라 다릅니다. 역학을 연구하는 경우 보고 기간 이전 기간의 지표 크기를 기본 값으로 사용할 수 있습니다. 영토 비교를 수행해야 하는 경우 다른 영토의 데이터를 기준으로 사용할 수 있습니다. 계획 이행 지표로 지표를 사용해야 하는 경우 계획 지표를 비교 기준으로 삼을 수 있습니다.

지수는 국가 경제와 개별 산업의 가장 중요한 경제 지표를 형성합니다. 지수 지표를 통해 다양한 제품을 생산하거나 다양한 활동을 하는 기업 및 조직의 성과를 분석할 수 있습니다. 지수의 도움으로 가장 중요한 경제 지표 형성에서 개별 요인의 역할을 추적하고 주요 생산 비축량을 식별할 수 있습니다. 지수는 생활 수준, 기업 활동, 가격 정책 등을 결정할 때 국제 경제 지표를 비교하는 데 널리 사용됩니다.

지수 지표의 가능성을 해석하는 데는 일반화(합성) 및 분석의 두 가지 접근 방식이 있으며, 이는 서로 다른 작업에 의해 결정됩니다.

29. 집계 지수

일반 목록복잡한 현상의 모든 요소의 변화를 반영합니다. 인덱스가 모든 요소를 ​​포함하지 않는 경우 그룹 또는 하위 인덱스라고 합니다. 집계 및 평균 지수가 있으며 그 계산은 지수 방법이라는 특수 연구 기술을 구성합니다. 일반 색인을 작성할 때: 1. 하나의 인덱스에 결합해야 하는 요소를 선택해야 합니다. 2. 올바른 공동 계량기 또는 중량을 선택합니다. 가중치의 선택은 어떤 기능이 인덱싱되는지(정량적 또는 정성적)에 따라 다릅니다. 일반 인덱스의 기본 형식은 집계 형식입니다. 집계 양식 색인은 sum 메소드를 사용하여 작성됩니다. 보고 및 기준 기간에 요소별 데이터가 있는 경우 집계 양식이 사용됩니다. . 상품 지수:
; in-s 물리적 볼륨 제품
; ^ 소비자 물가 지수 인플레이션의 일반적인 척도입니다. 색인 값은 상품 가격입니다. 물가 지수를 구성할 때 현재(보고) 기간에 판매된 상품 수는 일반적으로 지수의 가중치로 사용됩니다. 보고 가중치가 있는 총 가격 지수는 Paasche가 처음 제안했으며 그의 이름을 따왔습니다. Paasche 총 물가 지수 공식
, 어디
-보고 기간의 실제 생산 비용 (매출액)
- 기본 가격으로 보고 기간에 판매된 상품의 조건부 가치.

Laspeyres 총 물가 지수 공식:

30.산술을 비교하라. 및 harmon.ind., 장치와의 통신.

일반 인덱스의 기본 형식은 집계 형식입니다. 집계 양식 색인은 sum 메소드를 사용하여 작성됩니다. 보고 및 기준 기간에 요소별 데이터가 있는 경우 집계 양식이 사용됩니다. . 사회 현상의 다양한 측면을 특징짓는 많은 통계적 지표는 서로 특정 관계에 있습니다(종종 제품의 형태로). 통계는 이러한 관계를 정량적으로 특성화합니다. 많은 경제 지표가 밀접하게 관련되어 있으며 인덱스 시스템. 다음과 같은 요인 분석 실습: 유효 지표 = 용적 및 질적 요인의 곱인 경우 질적 요인은 기본 기간 수준에서 고정됩니다. 질적 지표의 영향이 결정되면 볼륨 팩터는 보고 기간 수준에서 고정됩니다. 가격 지수, 제품의 물리적 수량(판매 가격에 대해 이야기하는 경우) 또는 물리적 거래량(소매 가격에 대해 이야기하는 경우) 및 비용 지수의 예를 사용하여 상호 연관된 지수의 구성을 고려해 봅시다. 생산 (실제 가격으로 거래). 물량 및 가격 지표는 다음과 관련하여 계승적입니다. 생산 비용 지수(실제 가격의 상품 회전율):
, 또는
. 따라서 물리적 생산량 지수에 의한 가격 지수의 곱은 생산 비용 지수 (실제 가격의 회전율)를 제공합니다. 색인 시스템을 사용하면 두 개의 알려진 색인 값으로 세 번째 미지의 값을 찾을 수 있습니다. 물리적 생산량 지수: ;일반지표를 산정하는 집계방식 외에 해당 개별지표들의 평균으로 일반지표를 산출하는 방법이 있다. 그런 것을 세려면 가중 평균 지수이용 가능한 정보가 집계 지수 계산을 허용하지 않을 때 사용됩니다. 따라서 자연계에서 생산되는 개별 제품의 수량은 알 수 없지만 개별 지표는 알려져 있습니다.
기본 기간의 생산 비용 ( 0 0 ) 물리적 생산량의 산술 평균 지수를 결정할 수 있습니다. 초기 구성 기반은 집계 형식입니다. 사용 가능한 데이터에서 이 공식의 분모만 얻을 수 있습니다. 분자를 찾기 위해 개별 생산량 지수에 대한 공식이 사용되며, 그 공식은 다음과 같습니다. 1 = 0 . 이 표현을 집계 형식의 분자로 대체하면 물리적 볼륨의 총 지수를 형식으로 얻습니다. 물리적 생산량의 산술 평균 지수 , 여기서 가중치는 기본 기간( 0 0 ):
.

데이터가 분석적 그룹화 형식으로 표시되면 전체, 그룹 간 및 그룹 내 분산을 계산할 수 있습니다(표 11).

표 11

분산 유형 및 분산 추가 규칙

분산 이름

계산 공식

단순(무가중)

가중

총 분산은 모든 요인의 영향을 받는 전체 모집단의 특성 변화를 측정합니다.

그룹 간 분산은 그룹화 특성의 영향으로 발생한 체계적 분산을 측정합니다.

- 번째 그룹의 평균; - 전체 인구에 대한 평균; - 인구 단위 수 - -번째 그룹의 단위 수

그룹 내(사설) 분산, 각 그룹에 대해 별도로 계산

-번째 그룹에 있는 특성의 개별 값; - 평균 - 번째 그룹; - 집계 단위의 수 - -번째 그룹의 단위 수

그룹 내 분산 평균은 그룹화 특성을 제외한 모든 요인의 영향으로 발생하는 무작위 변동을 측정합니다.

분산 추가 규칙

분산 추가 규칙에 따라 다음이 계산됩니다.

1) 경험적 결정 계수는 그룹화 속성의 변동으로 인한 결과 속성의 변동 비율을 나타냅니다.

2) 경험적 상관 비율은 그룹화와 결과 기능 간의 관계의 근접성을 보여줍니다.

경험적 상관 비율은 0에서 1까지 다양합니다. 연결이 없으면 연결이 완료된 것입니다.

중간 값은 Chaddock 규모로 평가됩니다.

기능 분산

대체 특성은 둘 중 하나의 값만 취할 수 있는 정성적 특성입니다. 예를 들어, 성별 - 남성 또는 여성; 결혼 여부 - 결혼 여부; 제품이 양호하거나 결함이 있습니다. 인구의 한 부분에는 대체 기능이 있고 다른 부분에는 없습니다. 대체(연구된) 속성을 가진 단위의 비율은 - q를 소유하지 않고 - p로 표시됩니다. 인구 단위에서 대체 속성의 존재는 1로 표시되고 부재는 0으로 표시됩니다.

변형의 개념

평균은 연구 중인 현상 전체의 일반화 특성을 제공합니다.

기능 변형연구 모집단 내에서 특성의 개별 값 간의 차이입니다.

평균값은 연구된 모집단의 특징을 추상적이고 일반화한 특성이지만 모집단의 구조를 나타내지는 않습니다.

평균값은 연구 특성의 개별 값이 평균 근처에 집중되어 있는지 또는 크게 벗어나 있는지 여부에 관계없이 평균을 중심으로 그룹화되는 방법에 대한 아이디어를 제공하지 않습니다.

속성의 개별 값이 산술 평균에 가깝다면 이 경우 평균은 전체 모집단을 잘 나타냅니다. 그 반대.

개별 값의 변동이 특징입니다. 변동 지표.

변이(variation)라는 용어는 변화, 요동, 차이를 의미하는 라틴어 변이에서 유래했습니다. 그러나 모든 차이점을 일반적으로 변형이라고 하는 것은 아닙니다.

변형 중통계에서 그들은 다양한 요인의 작용의 교차 영향으로 인한 동종 모집단 내에서 연구중인 특성 값의 양적 변화를 이해합니다. 절대값과 상대값에는 특성의 변형이 있습니다. 절대 - R, L, σ, σ 2.

변동 지표

1 세트 2세트
n=5 80, 100, 120, 200, 300 n=8 145, 150, 155, 160, 160, 162, 168, 180

80 100 120×200 300

따라서 이 경우 특징의 변화량 즉, 서로에 대한 시리즈의 개별 값의 비율.

변동 지표

1. 변동 범위는 특성의 최대값과 최소값의 차이입니다.

R = 최대 X - X 최소

R 1 \u003d 300-80 \u003d 220 R 2 \u003d 180-145 \u003d 35

실습: 동종 모집단, 제품 품질 관리용.

2. 산술 평균에서 모든 옵션의 편차를 고려한 지표.

a) 평균 선형 편차

b) 표준편차

평균 선형 편차평균에서 개별 옵션 편차의 절대 값의 산술 평균을 나타냅니다.

그룹화되지 않은 경우:

;

그룹화:

관행:다음을 분석합니다.

1. 직원의 구성

2. 생산의 리듬

3. 재료의 균일한 공급

결함:이 지표는 가능한 유형의 계산을 복잡하게 만들고 수학 통계 방법을 적용하기 어렵게 만듭니다.

표준 편차(표준)- 이것

그룹화되지 않은 데이터

그룹화된 데이터

적당히 치우친 분포의 경우

평균 선형 편차와 같은 표준 편차는 산술 평균과 동일한 단위로 표현되는 절대 지표입니다.

두 모집단에 대한 평균 제곱 또는 평균 선형 편차의 지표는 이러한 모집단에 대한 부호 자체가 동일하지 않은 경우 비교할 수 없는 것으로 판명되었습니다. 이 지표는 동일한 인구의 다른 징후에 대해 비교되지 않습니다. 저것들. 두 모집단의 평균이 동일한 측정 단위로 표현되고 동일할 때 비교가 가능하며 특성 변동의 차이를 반영합니다.

표준 편차는 평균의 신뢰도를 측정한 것입니다. σ가 작을수록 산술 평균이 전체 모집단을 더 잘 반영합니다.

3. 분산기능의 변동성을 측정하는 데 사용됩니다. 이 지표는 변동 측정을 보다 객관적으로 반영합니다.

그룹화되지 않은 경우

그룹화

이 지표의 특징은 제곱할 때 작은 편차의 비율이 감소하고 총 편차가 크게 증가한다는 것입니다.

이것도 절대적인

분산에는 여러 속성이 있으며 그 중 일부는 계산을 더 쉽게 만듭니다.

1. 상수 값의 분산은 0입니다.

2. 특성 값(x) ↓의 모든 변형이 동일한 숫자이면 분산이 감소하지 않습니다.

3. 모든 옵션이 ↓만큼 같은 횟수(K회)이면 분산 ↓만큼 K만큼 2회

엑스 에프 엑스"

× 100배

분산 σ는 0.909*10000=9090

위에서는 양적형질에 대한 변이지표 계산을 고려하였으나, 변이를 평가하는 과제를 제기할 수 있다. 질적 특징. 예를 들어 제조된 제품의 품질을 연구할 때 양품과 불량품으로 나눌 수 있습니다.

이 경우 대체 표시에 대해 이야기하고 있습니다.

기능 분산

대체 표지판인구의 일부 단위가 소유하고 다른 단위는 그렇지 않은 것으로 불립니다. 예를 들어 지원자의 업무 경험, 대학 교사의 학위 등이 있습니다. 모집단 단위의 특징의 존재는 일반적으로 1로 표시되고 부재는 0입니다. x 1 =1, x 2 =0. (전체 모집단에서) 특성을 가진 단위의 비율은 p로 표시되고 특성이 없는 단위의 비율은 q로 표시됩니다. 저것들. p+q=1, q=1-p.

대체 기능의 평균값 계산

; ;

저것들. 대체 속성의 평균값은 주어진 속성을 갖지 않는 단위의 비율에 대한 주어진 속성을 갖는 단위의 비율과 같습니다.

표준편차는 B p =

품질 검사: 완제품 1000개, 불량품 20개.

우리는 결혼 비율을 찾습니다 : (20/1000) * 100% \u003d 0.02%

분산에는 여러 가지 속성이 있습니다.계산을 단순화하기 위해.

1. 옵션의 모든 값에서 상수 A를 빼면 이것의 표준 편차는 변경되지 않습니다.