सांख्यिकी में फैलाव को कैसे मापा जाता है? पूर्ण विविधताएँ

आइए इसमें गणना करेंएमएसएक्सेलनमूना विचरण और मानक विचलन। यदि किसी यादृच्छिक चर का वितरण ज्ञात हो तो हम उसके प्रसरण की भी गणना करेंगे।

आइए पहले विचार करें फैलाव, तब मानक विचलन.

नमूना विचरण

नमूना विचरण (नमूना विचरण,नमूनाझगड़ा) के सापेक्ष सरणी में मूल्यों के प्रसार की विशेषता है।

सभी 3 सूत्र गणितीय रूप से समतुल्य हैं।

प्रथम सूत्र से यह स्पष्ट है कि नमूना विचरणसरणी में प्रत्येक मान के वर्ग विचलन का योग है औसत से, नमूना आकार शून्य से 1 से विभाजित।

प्रसरण नमूने DISP() फ़ंक्शन का उपयोग किया जाता है, अंग्रेज़ी। नाम VAR, यानी वैरियन्स। संस्करण MS EXCEL 2010 से, इसके एनालॉग DISP.V(), अंग्रेजी का उपयोग करने की अनुशंसा की जाती है। नाम VARS, यानी नमूना भिन्नता. इसके अलावा, MS EXCEL 2010 के संस्करण से शुरू होकर, एक फ़ंक्शन DISP.Г(), अंग्रेजी है। नाम VARP, यानी जनसंख्या भिन्नता, जो गणना करती है फैलावके लिए जनसंख्या. पूरा अंतर हर में आता है: DISP.V() की तरह n-1 के बजाय, DISP.G() में हर में सिर्फ n है। MS EXCEL 2010 से पहले, VAR() फ़ंक्शन का उपयोग जनसंख्या के विचरण की गणना के लिए किया जाता था।

नमूना विचरण
=QUADROTCL(नमूना)/(गिनती(नमूना)-1)
=(योग(नमूना)-गिनती(नमूना)*औसत(नमूना)^2)/ (गिनती(नमूना)-1)- सामान्य सूत्र
=SUM((नमूना -औसत(नमूना))^2)/ (गिनती(नमूना)-1) –

नमूना विचरण 0 के बराबर है, केवल तभी जब सभी मान एक दूसरे के बराबर हों और, तदनुसार, बराबर हों औसत मूल्य. आमतौर पर, मूल्य जितना बड़ा होगा प्रसरण, सरणी में मानों का प्रसार जितना अधिक होगा।

नमूना विचरणएक बिंदु अनुमान है प्रसरणउस यादृच्छिक चर का वितरण जिससे इसे बनाया गया था नमूना. निर्माण के बारे में आत्मविश्वास अंतराल मूल्यांकन करते समय प्रसरणलेख में पढ़ा जा सकता है.

एक यादृच्छिक चर का प्रसरण

की गणना करना फैलावयादृच्छिक चर, आपको इसे जानना आवश्यक है।

के लिए प्रसरणयादृच्छिक चर X को अक्सर Var(X) से दर्शाया जाता है। फैलावमाध्य E(X) से विचलन के वर्ग के बराबर: Var(X)=E[(X-E(X)) 2 ]

फैलावसूत्र द्वारा गणना:

जहां x i वह मान है जो एक यादृच्छिक चर ले सकता है, और μ औसत मान है (), p(x) संभावना है कि यादृच्छिक चर मान x लेगा।

यदि एक यादृच्छिक चर है, तो फैलावसूत्र द्वारा गणना:

आयाम प्रसरणमूल मानों की माप की इकाई के वर्ग से मेल खाता है। उदाहरण के लिए, यदि नमूने में मान आंशिक वजन माप (किलो में) का प्रतिनिधित्व करते हैं, तो विचरण आयाम किलो 2 होगा। इसकी व्याख्या करना कठिन हो सकता है, इसलिए मूल्यों के प्रसार को चिह्नित करने के लिए, एक मूल्य के बराबर वर्गमूलसे प्रसरणमानक विचलन.

कुछ गुण प्रसरण:

Var(X+a)=Var(X), जहां X एक यादृच्छिक चर है और a एक स्थिरांक है।

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*ई(एक्स)*ई(एक्स)+(ई(एक्स)) 2 =ई(एक्स 2)-(ई(एक्स)) 2

इस फैलाव गुण का उपयोग किया जाता है रैखिक प्रतिगमन के बारे में लेख.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), जहां X और Y यादृच्छिक चर हैं, Cov(X;Y) इनका सहप्रसरण है यादृच्छिक चर.

यदि यादृच्छिक चर स्वतंत्र हैं, तो वे सहप्रसरण 0 के बराबर है, और इसलिए Var(X+Y)=Var(X)+Var(Y). फैलाव के इस गुण का उपयोग व्युत्पत्ति में किया जाता है।

आइए हम दिखाते हैं कि स्वतंत्र मात्राओं के लिए Var(X-Y)=Var(X+Y). दरअसल, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 वार(वाई)= वार(एक्स)+वार(वाई)= वार(एक्स+वाई)। इस फैलाव गुण का उपयोग निर्माण के लिए किया जाता है।

नमूना मानक विचलन

नमूना मानक विचलनयह इस बात का माप है कि किसी नमूने में मान उनके सापेक्ष कितने व्यापक रूप से बिखरे हुए हैं।

परिभाषा से, मानक विचलनके वर्गमूल के बराबर प्रसरण:

मानक विचलनमें मूल्यों के परिमाण को ध्यान में नहीं रखता है नमूना, लेकिन केवल उनके आसपास मूल्यों के फैलाव की डिग्री औसत. इसे स्पष्ट करने के लिए, आइए एक उदाहरण दें।

आइए 2 नमूनों के लिए मानक विचलन की गणना करें: (1; 5; 9) और (1001; 1005; 1009)। दोनों मामलों में, s=4. यह स्पष्ट है कि सरणी मानों के मानक विचलन का अनुपात नमूनों के बीच महत्वपूर्ण रूप से भिन्न होता है। ऐसे मामलों के लिए इसका उपयोग किया जाता है गुणांक का परिवर्तन(भिन्नता का गुणांक, सीवी) - अनुपात मानक विचलनऔसत तक अंकगणित, प्रतिशत के रूप में व्यक्त किया गया।

गणना के लिए MS EXCEL 2007 और पुराने संस्करणों में नमूना मानक विचलनफ़ंक्शन =STDEVAL() का उपयोग किया जाता है, अंग्रेजी। नाम STDEV, यानी मानक विचलन. MS EXCEL 2010 के संस्करण से, इसके एनालॉग =STDEV.B(), अंग्रेजी का उपयोग करने की अनुशंसा की जाती है। नाम STDEV.S, अर्थात्। नमूना मानक विचलन.

इसके अलावा, MS EXCEL 2010 के संस्करण से शुरू होकर, एक फ़ंक्शन STANDARDEV.G(), अंग्रेजी है। नाम STDEV.P, अर्थात्। जनसंख्या मानक विचलन, जो गणना करता है मानक विचलनके लिए जनसंख्या. पूरा अंतर हर में आता है: STANDARDEV.V() में n-1 के बजाय, STANDARDEVAL.G() में हर में सिर्फ n है।

मानक विचलननीचे दिए गए सूत्रों का उपयोग करके सीधे भी गणना की जा सकती है (उदाहरण फ़ाइल देखें)
=रूट(QUADROTCL(नमूना)/(गिनती(नमूना)-1))
=रूट((योग(नमूना)-गिनती(नमूना)*औसत(नमूना)^2)/(गिनती(नमूना)-1))

बिखराव के अन्य उपाय

SQUADROTCL() फ़ंक्शन गणना करता है उनके मूल्यों के वर्ग विचलन का योग औसत. यह फ़ंक्शन सूत्र के समान परिणाम देगा =DISP.G( नमूना)*जाँच करना( नमूना) , कहाँ नमूना- नमूना मानों की एक सरणी वाली श्रेणी का संदर्भ ()। QUADROCL() फ़ंक्शन में गणना सूत्र के अनुसार की जाती है:

SROTCL() फ़ंक्शन डेटा सेट के प्रसार का एक माप भी है। फ़ंक्शन SROTCL() मानों के विचलन के निरपेक्ष मानों के औसत की गणना करता है औसत. यह फ़ंक्शन सूत्र के समान परिणाम लौटाएगा =SUMPRODUCT(ABS(नमूना-औसत(नमूना)))/COUNT(नमूना), कहाँ नमूना- नमूना मानों की एक श्रृंखला वाली श्रेणी का एक लिंक।

फ़ंक्शन SROTCL () में गणना सूत्र के अनुसार की जाती है:

पिछले एक में, हमने कई सूत्र प्रस्तुत किए जो हमें तर्कों के वितरण के नियम ज्ञात होने पर कार्यों की संख्यात्मक विशेषताओं को खोजने की अनुमति देते हैं। हालाँकि, कई मामलों में, कार्यों की संख्यात्मक विशेषताओं को खोजने के लिए, तर्कों के वितरण के नियमों को जानना भी आवश्यक नहीं है, बल्कि उनकी कुछ संख्यात्मक विशेषताओं को जानना ही पर्याप्त है; साथ ही, हम आम तौर पर वितरण के किसी भी नियम के बिना काम करते हैं। तर्कों की दी गई संख्यात्मक विशेषताओं से कार्यों की संख्यात्मक विशेषताओं का निर्धारण संभाव्यता सिद्धांत में व्यापक रूप से उपयोग किया जाता है और कई समस्याओं के समाधान को महत्वपूर्ण रूप से सरल बना सकता है। इनमें से अधिकांश सरलीकृत विधियाँ रैखिक कार्यों से संबंधित हैं; हालाँकि, कुछ प्राथमिक अरेखीय कार्य भी एक समान दृष्टिकोण की अनुमति देते हैं।

वर्तमान में हम कार्यों की संख्यात्मक विशेषताओं पर कई प्रमेय प्रस्तुत करेंगे, जो एक साथ इन विशेषताओं की गणना के लिए एक बहुत ही सरल उपकरण का प्रतिनिधित्व करते हैं, जो कई स्थितियों में लागू होते हैं।

1. गैर-यादृच्छिक मान की गणितीय अपेक्षा

तैयार की गई संपत्ति काफी स्पष्ट है; इसे एक गैर-यादृच्छिक चर को एक विशेष प्रकार के यादृच्छिक के रूप में मानकर, संभाव्यता के साथ एक संभावित मान के साथ सिद्ध किया जा सकता है; फिर गणितीय अपेक्षा के सामान्य सूत्र के अनुसार:

.

2. गैर-यादृच्छिक मात्रा का विचरण

यदि एक गैर-यादृच्छिक मान है, तो

3. गणितीय अपेक्षा के चिह्न के स्थान पर एक गैर-यादृच्छिक मान प्रतिस्थापित करना

, (10.2.1)

अर्थात्, एक गैर-यादृच्छिक मान को गणितीय अपेक्षा के संकेत के रूप में निकाला जा सकता है।

सबूत।

ए) असंतुलित मात्राओं के लिए

b) निरंतर मात्राओं के लिए

.

4. फैलाव और मानक विचलन के संकेत से एक गैर-यादृच्छिक मान लेना

यदि एक गैर-यादृच्छिक मात्रा है, और यादृच्छिक है, तो

, (10.2.2)

अर्थात्, एक गैर-यादृच्छिक मान को विचरण के चिह्न से वर्गित करके निकाला जा सकता है।

सबूत। विचरण की परिभाषा के अनुसार

परिणाम

,

अर्थात्, एक गैर-यादृच्छिक मान को मानक विचलन के चिह्न से उसके निरपेक्ष मान से निकाला जा सकता है। हम सूत्र (10.2.2) से वर्गमूल निकालकर और यह ध्यान में रखकर प्रमाण प्राप्त करते हैं कि आर.एस.ओ. - एक महत्वपूर्ण सकारात्मक मूल्य.

5. यादृच्छिक चरों के योग की गणितीय अपेक्षा

आइए हम यह सिद्ध करें कि किन्हीं दो यादृच्छिक चरों के लिए और

यानी गणितीय अपेक्षादो यादृच्छिक चरों का योग उनकी गणितीय अपेक्षाओं के योग के बराबर है।

इस गुण को गणितीय अपेक्षाओं के योग के प्रमेय के रूप में जाना जाता है।

सबूत।

ए) असंतत यादृच्छिक चरों की एक प्रणाली बनें। यादृच्छिक चरों के योग पर लागू करें सामान्य सूत्र(10.1.6) दो तर्कों के एक फ़ंक्शन की गणितीय अपेक्षा के लिए:

.

हो कुल संभावना से अधिक कुछ नहीं दर्शाता है कि मात्रा मान लेगी:

;

इस तरह,

.

हम इसी तरह इसे साबित भी करेंगे

,

और प्रमेय सिद्ध है.

बी) सतत यादृच्छिक चर की एक प्रणाली बनें। सूत्र के अनुसार (10.1.7)

. (10.2.4)

आइए हम पहले अभिन्नों को रूपांतरित करें (10.2.4):

;

इसी तरह

,

और प्रमेय सिद्ध है.

यह विशेष रूप से ध्यान दिया जाना चाहिए कि गणितीय अपेक्षाओं को जोड़ने का प्रमेय किसी भी यादृच्छिक चर के लिए मान्य है - आश्रित और स्वतंत्र दोनों।

गणितीय अपेक्षाओं को जोड़ने के लिए प्रमेय को शब्दों की एक मनमानी संख्या के लिए सामान्यीकृत किया गया है:

, (10.2.5)

अर्थात्, कई यादृच्छिक चरों के योग की गणितीय अपेक्षा उनकी गणितीय अपेक्षाओं के योग के बराबर है।

इसे सिद्ध करने के लिए पूर्ण प्रेरण की विधि का उपयोग करना ही पर्याप्त है।

6. एक रैखिक फलन की गणितीय अपेक्षा

कई यादृच्छिक तर्कों के एक रैखिक कार्य पर विचार करें:

गैर-यादृच्छिक गुणांक कहां हैं. आइए इसे साबित करें

, (10.2.6)

यानी एक रैखिक फ़ंक्शन की गणितीय अपेक्षा तर्कों की गणितीय अपेक्षाओं के समान रैखिक फ़ंक्शन के बराबर है।

सबूत। एमओ के अतिरिक्त प्रमेय का उपयोग करना और एमओ के चिह्न के बाहर एक गैर-यादृच्छिक मात्रा रखने का नियम, हम प्राप्त करते हैं:

.

7. डिस्पईपीयादृच्छिक चरों का यह योग

दो यादृच्छिक चरों के योग का प्रसरण उनके प्रसरणों के योग और सहसंबंध क्षण के दोगुने के बराबर होता है:

सबूत। चलो निरूपित करें

गणितीय अपेक्षाओं के योग के प्रमेय के अनुसार

आइए यादृच्छिक चर से संबंधित केन्द्रित चर की ओर बढ़ें। समानता (10.2.9) को समानता (10.2.8) से पद दर पद घटाने पर, हमें प्राप्त होता है:

विचरण की परिभाषा के अनुसार

क्यू.ई.डी.

योग के विचरण के लिए सूत्र (10.2.7) को किसी भी संख्या में सामान्यीकृत किया जा सकता है:

, (10.2.10)

मात्राओं का सहसंबंध क्षण कहां है, योग के नीचे चिह्न का मतलब है कि योग यादृच्छिक चर के सभी संभावित जोड़ीदार संयोजनों तक फैला हुआ है .

प्रमाण पिछले प्रमाण के समान है और बहुपद के वर्ग के सूत्र का अनुसरण करता है।

सूत्र (10.2.10) को दूसरे रूप में लिखा जा सकता है:

, (10.2.11)

जहां दोगुना योग मात्राओं की प्रणाली के सहसंबंध मैट्रिक्स के सभी तत्वों तक फैला हुआ है , जिसमें सहसंबंध क्षण और भिन्नताएं दोनों शामिल हैं।

यदि सभी यादृच्छिक चर , सिस्टम में शामिल, असंबंधित हैं (यानी, जब ), सूत्र (10.2.10) रूप लेता है:

, (10.2.12)

अर्थात्, असंबंधित यादृच्छिक चरों के योग का प्रसरण, पदों के प्रसरणों के योग के बराबर होता है।

इस स्थिति को भिन्नताओं के योग के प्रमेय के रूप में जाना जाता है।

8. एक रैखिक फलन का प्रसरण

आइए कई यादृच्छिक चरों के एक रैखिक फलन पर विचार करें।

गैर-यादृच्छिक मात्राएँ कहाँ हैं.

आइए हम सिद्ध करें कि इस रैखिक फलन का विचरण सूत्र द्वारा व्यक्त किया जाता है

, (10.2.13)

मात्राओं का सहसंबंध क्षण कहां है।

सबूत। आइए हम संकेतन का परिचय दें:

. (10.2.14)

अभिव्यक्ति के दाईं ओर योग के फैलाव के लिए सूत्र (10.2.10) लागू करना (10.2.14) और इसे ध्यान में रखते हुए, हम प्राप्त करते हैं:

मात्राओं का सहसंबंध क्षण कहां है:

.

आइए इस पल की गणना करें। हमारे पास है:

;

इसी तरह

इस अभिव्यक्ति को (10.2.15) में प्रतिस्थापित करने पर, हम सूत्र (10.2.13) पर पहुंचते हैं।

विशेष स्थिति में जब सभी मात्राएँ असंबंधित हैं, सूत्र (10.2.13) रूप लेता है:

, (10.2.16)

अर्थात्, असंबंधित यादृच्छिक चर के एक रैखिक फ़ंक्शन का विचरण गुणांक के वर्गों के उत्पादों और संबंधित तर्कों के प्रसरण के योग के बराबर है।

9. यादृच्छिक चर के उत्पाद की गणितीय अपेक्षा

दो यादृच्छिक चर के उत्पाद की गणितीय अपेक्षा उनकी गणितीय अपेक्षाओं और सहसंबंध क्षण के उत्पाद के बराबर है:

सबूत। हम सहसंबंध क्षण की परिभाषा से आगे बढ़ेंगे:

आइए गणितीय अपेक्षा के गुणों का उपयोग करके इस अभिव्यक्ति को रूपांतरित करें:

जो स्पष्टतः सूत्र (10.2.17) के समतुल्य है।

यदि यादृच्छिक चर असंबद्ध हैं, तो सूत्र (10.2.17) रूप लेता है:

अर्थात्, दो असंबद्ध यादृच्छिक चर के उत्पाद की गणितीय अपेक्षा उनकी गणितीय अपेक्षाओं के उत्पाद के बराबर है।

इस स्थिति को गणितीय अपेक्षाओं के गुणन के प्रमेय के रूप में जाना जाता है।

फॉर्मूला (10.2.17) दूसरे मिश्रित प्रारंभिक क्षण और गणितीय अपेक्षाओं के माध्यम से सिस्टम के दूसरे मिश्रित केंद्रीय क्षण की अभिव्यक्ति से ज्यादा कुछ नहीं है:

. (10.2.19)

इस अभिव्यक्ति का उपयोग अक्सर व्यवहार में सहसंबंध क्षण की गणना करते समय उसी तरह किया जाता है जैसे एक यादृच्छिक चर के लिए विचरण की गणना अक्सर दूसरे प्रारंभिक क्षण और गणितीय अपेक्षा के माध्यम से की जाती है।

गणितीय अपेक्षाओं के गुणन के प्रमेय को कारकों की एक मनमानी संख्या के लिए सामान्यीकृत किया जाता है, केवल इस मामले में, इसके अनुप्रयोग के लिए, यह पर्याप्त नहीं है कि मात्राएँ असंबद्ध हों, बल्कि कुछ उच्च मिश्रित क्षणों की आवश्यकता होती है, जिनकी संख्या निर्भर करती है उत्पाद में शब्दों की संख्या पर, गायब हो जाएं। यदि उत्पाद में शामिल यादृच्छिक चर स्वतंत्र हैं तो ये शर्तें निश्चित रूप से संतुष्ट हैं। इस मामले में

, (10.2.20)

अर्थात्, स्वतंत्र यादृच्छिक चर के उत्पाद की गणितीय अपेक्षा उनकी गणितीय अपेक्षाओं के उत्पाद के बराबर है।

इस प्रस्ताव को पूर्ण प्रेरण द्वारा आसानी से सिद्ध किया जा सकता है।

10. स्वतंत्र यादृच्छिक चरों के गुणनफल का प्रसरण

आइए हम इसे स्वतंत्र मात्राओं के लिए सिद्ध करें

सबूत। चलो निरूपित करें. विचरण की परिभाषा के अनुसार

चूँकि मात्राएँ स्वतंत्र हैं, और

स्वतंत्र होने पर मात्राएँ भी स्वतंत्र होती हैं; इस तरह,

,

लेकिन परिमाण के दूसरे प्रारंभिक क्षण से अधिक कुछ नहीं है, और इसलिए, इसे फैलाव के माध्यम से व्यक्त किया जाता है:

;

इसी तरह

.

इन भावों को सूत्र (10.2.22) में प्रतिस्थापित करने और समान पदों को लाने पर, हम सूत्र (10.2.21) पर पहुंचते हैं।

ऐसे मामले में जब केंद्रित यादृच्छिक चर (शून्य के बराबर गणितीय अपेक्षाओं वाले चर) को गुणा किया जाता है, सूत्र (10.2.21) रूप लेता है:

, (10.2.23)

अर्थात्, स्वतंत्र केन्द्रित यादृच्छिक चरों के उत्पाद का प्रसरण उनके प्रसरणों के गुणनफल के बराबर होता है।

11. यादृच्छिक चरों के योग के उच्चतर क्षण

कुछ मामलों में, स्वतंत्र यादृच्छिक चर के योग के उच्चतम क्षणों की गणना करना आवश्यक है। आइए यहां इससे जुड़े कुछ संबंधों को सिद्ध करते हैं।

1) यदि मात्राएँ स्वतंत्र हैं, तो

सबूत।

कहाँ से, गणितीय अपेक्षाओं के गुणन के प्रमेय के अनुसार

लेकिन किसी भी मात्रा के लिए पहला केंद्रीय क्षण शून्य के बराबर; दो मध्य पद लुप्त हो जाते हैं, और सूत्र (10.2.24) सिद्ध हो जाता है।

संबंध (10.2.24) को स्वतंत्र शब्दों की एक मनमानी संख्या में शामिल करके आसानी से सामान्यीकृत किया जाता है:

. (10.2.25)

2) दो स्वतंत्र यादृच्छिक चरों के योग का चौथा केंद्रीय क्षण सूत्र द्वारा व्यक्त किया जाता है

मात्राओं में भिन्नता कहां है और .

प्रमाण पिछले वाले के समान ही है।

पूर्ण प्रेरण की विधि का उपयोग करके, सूत्र (10.2.26) के सामान्यीकरण को स्वतंत्र पदों की मनमानी संख्या में सिद्ध करना आसान है।

सांख्यिकी में विचरण को माध्य के रूप में परिभाषित किया गया है मानक विचलनअंकगणित माध्य से विशेषता के व्यक्तिगत मान का वर्ग। औसत से विकल्पों के वर्ग विचलन की गणना करने और फिर उनका औसत निकालने की एक सामान्य विधि।

आर्थिक सांख्यिकीय विश्लेषण में, किसी विशेषता की भिन्नता का मूल्यांकन अक्सर मानक विचलन का उपयोग करके करने की प्रथा है, यह भिन्नता का वर्गमूल है;

(3)

एक अलग विशेषता के मूल्यों के पूर्ण उतार-चढ़ाव को दर्शाता है और विकल्पों के समान माप की इकाइयों में व्यक्त किया जाता है। सांख्यिकी में अक्सर विभिन्न विशेषताओं की भिन्नता की तुलना करने की आवश्यकता होती है। ऐसी तुलनाओं के लिए, भिन्नता के सापेक्ष माप, भिन्नता के गुणांक का उपयोग किया जाता है।

फैलाव गुण:

1) यदि आप सभी विकल्पों में से कोई भी संख्या घटा दें, तो प्रसरण नहीं बदलेगा;

2) यदि विकल्प के सभी मानों को किसी भी संख्या b से विभाजित किया जाता है, तो विचरण b^2 ​​गुना कम हो जाएगा, अर्थात।

3) यदि आप असमान अंकगणितीय माध्य वाली किसी भी संख्या से विचलन के औसत वर्ग की गणना करते हैं, तो यह प्रसरण से अधिक होगा। साथ ही, औसत मूल्य सी के बीच अंतर के प्रति वर्ग एक अच्छी तरह से परिभाषित मूल्य द्वारा।

फैलाव को माध्य वर्ग और माध्य वर्ग के बीच के अंतर के रूप में परिभाषित किया जा सकता है।

17. समूह और अंतरसमूह विविधताएँ। प्रसरण जोड़ नियम

यदि किसी सांख्यिकीय जनसंख्या को अध्ययन की जा रही विशेषता के अनुसार समूहों या भागों में विभाजित किया जाता है, तो ऐसी जनसंख्या के लिए निम्नलिखित प्रकार के फैलाव की गणना की जा सकती है: समूह (निजी), समूह औसत (निजी), और अंतरसमूह।

कुल विचरण- किसी दी गई सांख्यिकीय जनसंख्या में कार्यरत सभी स्थितियों और कारणों के कारण किसी विशेषता की भिन्नता को दर्शाता है।

समूह विचरण- इस समूह के अंकगणितीय माध्य से एक समूह के भीतर किसी विशेषता के व्यक्तिगत मूल्यों के विचलन के माध्य वर्ग के बराबर, जिसे समूह माध्य कहा जाता है। हालाँकि, समूह का औसत पूरी आबादी के समग्र औसत से मेल नहीं खाता है।

समूह भिन्नता केवल समूह के भीतर संचालित होने वाली स्थितियों और कारणों के कारण किसी गुण की भिन्नता को दर्शाती है।

समूह भिन्नताओं का औसत- को समूह प्रसरणों के भारित अंकगणितीय माध्य के रूप में परिभाषित किया गया है, जिसमें भार समूह की मात्रा है।

अंतरसमूह विचरण- समग्र औसत से समूह औसत के विचलन के माध्य वर्ग के बराबर।

अंतरसमूह फैलाव समूहीकरण विशेषता के कारण परिणामी विशेषता की भिन्नता को दर्शाता है।

विचार किए गए फैलाव के प्रकारों के बीच एक निश्चित संबंध है: कुल फैलाव औसत समूह और अंतरसमूह फैलाव के योग के बराबर है।

इस संबंध को विचरण योग नियम कहा जाता है।

18. गतिशील श्रृंखला और उसके घटक। समय श्रृंखला के प्रकार.

आंकड़ों में कतार- यह डिजिटल डेटा है जो समय या स्थान में किसी घटना में परिवर्तन दिखाता है और समय और समय दोनों में उनके विकास की प्रक्रिया में घटनाओं की सांख्यिकीय तुलना करना संभव बनाता है। विभिन्न रूपऔर प्रक्रियाओं के प्रकार. इसके लिए धन्यवाद, घटना की पारस्परिक निर्भरता का पता लगाना संभव है।

सांख्यिकी में, समय के साथ सामाजिक घटनाओं की गति के विकास की प्रक्रिया को आमतौर पर गतिशीलता कहा जाता है। गतिशीलता प्रदर्शित करने के लिए, गतिशीलता श्रृंखला (कालानुक्रमिक, समय) का निर्माण किया जाता है, जो एक सांख्यिकीय संकेतक के समय-भिन्न मूल्यों की श्रृंखला होती है (उदाहरण के लिए, 10 वर्षों से अधिक दोषी लोगों की संख्या), में स्थित कालानुक्रमिक क्रम में. उनके घटक तत्व किसी दिए गए संकेतक के डिजिटल मान और समय की अवधि या बिंदु हैं जिनसे वे संबंधित हैं।

गतिकी श्रृंखला की सबसे महत्वपूर्ण विशेषता- किसी विशेष घटना का उनका आकार (आयतन, परिमाण) एक निश्चित अवधि में या एक निश्चित क्षण में प्राप्त किया जाता है। तदनुसार, गतिकी श्रृंखला के पदों का परिमाण ही उसका स्तर है। अंतर करनागतिशील श्रृंखला के प्रारंभिक, मध्य और अंतिम स्तर। प्रवेश के स्तर परपहले का मान दिखाता है, अंतिम - श्रृंखला के अंतिम पद का मान दिखाता है। मध्यवर्ती स्तरऔसत कालानुक्रमिक भिन्नता सीमा का प्रतिनिधित्व करता है और इसकी गणना इस आधार पर की जाती है कि गतिशील श्रृंखला अंतराल है या क्षणिक है।

और एक महत्वपूर्ण विशेषतासमय श्रृंखला- प्रारंभिक से अंतिम अवलोकन तक बीता हुआ समय, या ऐसे अवलोकनों की संख्या।

समय श्रृंखला विभिन्न प्रकार की होती है; उन्हें निम्नलिखित मानदंडों के अनुसार वर्गीकृत किया जा सकता है।

1) स्तरों को व्यक्त करने की विधि के आधार पर, गतिशीलता श्रृंखला को निरपेक्ष और व्युत्पन्न संकेतकों (सापेक्ष और औसत मान) की श्रृंखला में विभाजित किया जाता है।

2) इस पर निर्भर करता है कि श्रृंखला के स्तर समय के कुछ बिंदुओं (महीने, तिमाही, वर्ष, आदि की शुरुआत में) पर घटना की स्थिति को कैसे व्यक्त करते हैं या निश्चित समय अंतराल पर इसके मूल्य को कैसे व्यक्त करते हैं (उदाहरण के लिए, प्रति दिन, महीना, वर्ष, आदि) आदि), क्रमशः क्षण और अंतराल गतिशीलता श्रृंखला के बीच अंतर करें। कानून प्रवर्तन एजेंसियों के विश्लेषणात्मक कार्य में मोमेंट श्रृंखला का उपयोग अपेक्षाकृत कम ही किया जाता है।

सांख्यिकीय सिद्धांत में, गतिशीलता को कई अन्य वर्गीकरण मानदंडों के अनुसार प्रतिष्ठित किया जाता है: स्तरों के बीच की दूरी के आधार पर - समय में समान स्तर और असमान स्तर के साथ; अध्ययन की जा रही प्रक्रिया की मुख्य प्रवृत्ति की उपस्थिति पर निर्भर करता है - स्थिर और गैर-स्थिर। समय श्रृंखला का विश्लेषण करते समय, वे निम्नलिखित से आगे बढ़ते हैं: श्रृंखला के स्तरों को घटकों के रूप में प्रस्तुत किया जाता है:

वाई टी = टीपी + ई (टी)

जहां टीपी निर्धारक घटक है जो निर्धारित करता है सामान्य प्रवृत्तिसमय या प्रवृत्ति के साथ परिवर्तन।

ई (टी) एक यादृच्छिक घटक है जो स्तरों में उतार-चढ़ाव का कारण बनता है।

आंकड़ों में भिन्नता के मुख्य सामान्यीकरण संकेतक फैलाव और मानक विचलन हैं।

फैलावयह अंकगणित औसत समग्र औसत से प्रत्येक विशेषता मान का वर्ग विचलन। प्रसरण को आमतौर पर विचलन का माध्य वर्ग कहा जाता है और इसे  2 द्वारा दर्शाया जाता है। स्रोत डेटा के आधार पर, विचरण की गणना सरल या भारित अंकगणितीय माध्य का उपयोग करके की जा सकती है:

 अभारित (सरल) विचरण;

 विचरण भारित।

मानक विचलन यह निरपेक्ष आकारों की एक सामान्यीकरण विशेषता है बदलाव समुच्चय में संकेत. इसे माप की समान इकाइयों में विशेषता के रूप में व्यक्त किया जाता है (मीटर, टन, प्रतिशत, हेक्टेयर, आदि में)।

मानक विचलन विचरण का वर्गमूल है और इसे  द्वारा दर्शाया जाता है:

 मानक विचलन अभारित;

 भारित मानक विचलन.

मानक विचलन माध्य की विश्वसनीयता का माप है। मानक विचलन जितना छोटा होगा, अंकगणितीय माध्य उतना ही बेहतर होगा जो संपूर्ण प्रतिनिधित्व वाली जनसंख्या को दर्शाता है।

मानक विचलन की गणना विचरण की गणना से पहले की जाती है।

भारित विचरण की गणना करने की प्रक्रिया इस प्रकार है:

1) भारित अंकगणितीय माध्य निर्धारित करें:

2) औसत से विकल्पों के विचलन की गणना करें:

3) औसत से प्रत्येक विकल्प के विचलन का वर्ग करें:

4) विचलन के वर्गों को भार (आवृत्तियों) से गुणा करें:

5) परिणामी उत्पादों का सारांश प्रस्तुत करें:

6) परिणामी राशि को वज़न के योग से विभाजित किया जाता है:

उदाहरण 2.1

आइए भारित अंकगणितीय माध्य की गणना करें:

माध्य और उनके वर्गों से विचलन के मान तालिका में प्रस्तुत किए गए हैं। आइए विचरण को परिभाषित करें:

मानक विचलन इसके बराबर होगा:

यदि स्रोत डेटा को अंतराल के रूप में प्रस्तुत किया जाता है वितरण श्रृंखला , तो आपको पहले विशेषता का अलग मान निर्धारित करने की आवश्यकता है, और फिर वर्णित विधि लागू करें।

उदाहरण 2.2

आइए हम गेहूं की उपज के अनुसार सामूहिक खेत के बोए गए क्षेत्र के वितरण पर डेटा का उपयोग करके एक अंतराल श्रृंखला के लिए भिन्नता की गणना दिखाएं।

अंकगणितीय माध्य है:

आइए विचरण की गणना करें:

6.3. व्यक्तिगत डेटा के आधार पर एक सूत्र का उपयोग करके विचरण की गणना

गणना तकनीक प्रसरण जटिल, लेकिन बड़े मूल्यविकल्प और आवृत्तियाँ भारी पड़ सकती हैं। फैलाव के गुणों का उपयोग करके गणना को सरल बनाया जा सकता है।

फैलाव में निम्नलिखित गुण होते हैं।

1. किसी भिन्न विशेषता के भार (आवृत्तियों) को एक निश्चित संख्या तक कम करने या बढ़ाने से फैलाव नहीं बदलता है।

2. किसी विशेषता के प्रत्येक मान को समान स्थिर मात्रा से घटाना या बढ़ाना फैलाव नहीं बदलता.

3. किसी विशेषता के प्रत्येक मान को एक निश्चित संख्या में घटाना या बढ़ाना केक्रमशः विचरण को कम या बढ़ा देता है के 2 बार और मानक विचलन  में केएक बार।

4. एक मनमाने मूल्य के सापेक्ष एक विशेषता का फैलाव हमेशा औसत और मनमाना मूल्यों के बीच अंतर के प्रति वर्ग अंकगणितीय माध्य के सापेक्ष फैलाव से अधिक होता है:

अगर  0, तो हम निम्नलिखित समानता पर पहुंचते हैं:

अर्थात्, विशेषता का विचरण, विशेषता मानों के माध्य वर्ग और माध्य के वर्ग के बीच के अंतर के बराबर है।

विचरण की गणना करते समय प्रत्येक संपत्ति का उपयोग स्वतंत्र रूप से या दूसरों के साथ संयोजन में किया जा सकता है।

विचरण की गणना की प्रक्रिया सरल है:

1) निर्धारित करें अंकगणित औसत :

2) अंकगणितीय माध्य का वर्ग करें:

3) श्रृंखला के प्रत्येक प्रकार के विचलन का वर्ग करें:

एक्स मैं 2 .

4) विकल्पों के वर्गों का योग ज्ञात करें:

5) विकल्पों के वर्गों के योग को उनकी संख्या से विभाजित करें, यानी औसत वर्ग निर्धारित करें:

6) विशेषता के माध्य वर्ग और माध्य के वर्ग के बीच अंतर निर्धारित करें:

उदाहरण 3.1श्रमिक उत्पादकता पर निम्नलिखित डेटा उपलब्ध है:

आइए निम्नलिखित गणना करें:

यह पृष्ठ वर्णन करता है मानक उदाहरणभिन्नता का पता लगाने के लिए, आप इसे खोजने के लिए अन्य समस्याओं को भी देख सकते हैं

उदाहरण 1. समूह, समूह औसत, अंतरसमूह और कुल विचरण का निर्धारण

उदाहरण 2. समूहीकरण तालिका में विचरण और भिन्नता का गुणांक ज्ञात करना

उदाहरण 3. एक असतत श्रृंखला में भिन्नता ढूँढना

उदाहरण 4. निम्नलिखित डेटा 20 छात्रों के समूह के लिए उपलब्ध है पत्राचार विभाग. बनाने की जरूरत है अंतराल श्रृंखलाकिसी विशेषता का वितरण, विशेषता के औसत मूल्य की गणना करें और उसके विचरण का अध्ययन करें

आइए एक अंतराल समूह बनाएं। आइए सूत्र का उपयोग करके अंतराल की सीमा निर्धारित करें:

जहां एक्स अधिकतम समूहीकरण विशेषता का अधिकतम मूल्य है;
एक्स मिनट - समूहीकरण विशेषता का न्यूनतम मूल्य;
n - अंतरालों की संख्या:

हम n=5 स्वीकार करते हैं। चरण है: h = (192 - 159)/5 = 6.6

आइए एक अंतराल समूह बनाएं

आगे की गणना के लिए, हम एक सहायक तालिका बनाएंगे:

X"i - अंतराल का मध्य। (उदाहरण के लिए, अंतराल 159 - 165.6 = 162.3 का मध्य)

हम भारित अंकगणितीय औसत सूत्र का उपयोग करके छात्रों की औसत ऊंचाई निर्धारित करते हैं:

आइए सूत्र का उपयोग करके विचरण निर्धारित करें:

सूत्र को इस प्रकार बदला जा सकता है:

इस सूत्र से यह निष्कर्ष निकलता है विचरण बराबर है विकल्पों के वर्गों के औसत और वर्ग तथा औसत के बीच का अंतर।

भिन्नता श्रृंखला में फैलावसमान अंतराल पर क्षणों की विधि का उपयोग करके गणना की जा सकती है निम्नलिखित तरीके सेफैलाव की दूसरी संपत्ति का उपयोग करते समय (अंतराल के मूल्य से सभी विकल्पों को विभाजित करना)। विचरण का निर्धारण, क्षणों की विधि का उपयोग करके गणना की गई, निम्नलिखित सूत्र का उपयोग करना कम श्रमसाध्य है:

जहां i अंतराल का मान है;
ए एक पारंपरिक शून्य है, जिसके लिए उच्चतम आवृत्ति वाले अंतराल के मध्य का उपयोग करना सुविधाजनक है;
m1 प्रथम क्रम क्षण का वर्ग है;
एम2 - दूसरे क्रम का क्षण

वैकल्पिक गुण विचरण (यदि किसी सांख्यिकीय जनसंख्या में कोई विशेषता इस प्रकार बदलती है कि केवल दो परस्पर अनन्य विकल्प हैं, तो ऐसी परिवर्तनशीलता को वैकल्पिक कहा जाता है) की गणना सूत्र का उपयोग करके की जा सकती है:

इस विचरण सूत्र में q = 1-p प्रतिस्थापित करने पर, हमें प्राप्त होता है:

विचरण के प्रकार

कुल विचरणइस भिन्नता का कारण बनने वाले सभी कारकों के प्रभाव में संपूर्ण जनसंख्या में किसी विशेषता की भिन्नता को मापता है। यह x के समग्र माध्य मान से किसी विशेषता x के व्यक्तिगत मानों के विचलन के माध्य वर्ग के बराबर है और इसे सरल विचरण या भारित विचरण के रूप में परिभाषित किया जा सकता है।

समूह के भीतर भिन्नता यादृच्छिक भिन्नता की विशेषता है, अर्थात भिन्नता का वह भाग जो बेहिसाब कारकों के प्रभाव के कारण होता है और समूह का आधार बनाने वाले कारक-विशेषता पर निर्भर नहीं होता है। ऐसा फैलाव समूह के अंकगणितीय माध्य से समूह X के भीतर विशेषता के व्यक्तिगत मूल्यों के विचलन के माध्य वर्ग के बराबर है और इसकी गणना साधारण फैलाव या भारित फैलाव के रूप में की जा सकती है।



इस प्रकार, समूह के भीतर विचरण के उपायएक समूह के भीतर एक विशेषता की भिन्नता और सूत्र द्वारा निर्धारित की जाती है:

जहां xi समूह का औसत है;
ni समूह में इकाइयों की संख्या है।

उदाहरण के लिए, किसी कार्यशाला में श्रम उत्पादकता के स्तर पर श्रमिकों की योग्यता के प्रभाव का अध्ययन करने की समस्या में अंतर-समूह भिन्नताएं निर्धारित की जानी चाहिए, जो सभी संभावित कारकों के कारण प्रत्येक समूह में आउटपुट में भिन्नता दिखाती हैं ( तकनीकी स्थितिउपकरण, उपकरण और सामग्री की उपलब्धता, श्रमिकों की आयु, श्रम तीव्रता, आदि), में अंतर को छोड़कर योग्यता श्रेणी(एक समूह के भीतर सभी श्रमिकों की योग्यताएँ समान होती हैं)।