इस बिंदु पर, हम एक प्रयोग के परिणामों का वर्णन कर सकते हैं - कम से कम संख्यात्मक चर के लिए - औसत (या मध्यिका) और मानक विचलन का उपयोग करके। यह हमें मानों के वितरण का \"केंद्र\" और उस केंद्र के चारों ओर \"फैलाव\" बताएगा। उदाहरण के लिए, यदि हम अमेरिकी सेना के सैनिकों की ऊंचाई को मापते हैं, तो हम कह सकते हैं कि अमेरिकी सैनिकों की औसत ऊँचाई 1.73 मीटर है, जिसका मानक विचलन 0.15 मीटर है (ये आंकड़े काल्पनिक हैं)। वितरण का अधिक विस्तृत वर्णन करने के लिए हमें अतिरिक्त वर्णनात्मक उपायों की आवश्यकता है।
इस संकेतन के अनुसार, मध्यिका को वास्तव में \"मध्य क्वारटाइल\" Q2 कहा जाना चाहिए, क्योंकि यह वह संख्या है जिसके लिए 50% मान उससे कम हैं और 50% मान उससे अधिक हैं।
नोट: क्वारटाइल्स (quartiles) खोजने के लिए, आपको पहले अपने डेटा को क्रमबद्ध करना होगा (जैसे कि औसत (mean) खोजने में)।
उदाहरण: संख्याओं 1, 2, 3, 4, 5, 6, 7 के ऊपरी और निचले क्वारटाइल की गणना करें।
संख्याएँ पहले से क्रमबद्ध हैं, इसलिए यह देखना आसान है कि मध्यांक (median) 4 है (3 संख्याएँ 4 से कम हैं और 3 उससे अधिक हैं)। दूसरे शब्दों में, 4 हमारी संख्याओं को छोटे सेट {1, 2, 3} और बड़े सेट {5, 6, 7} में विभाजित करता है। क्वारटाइल्स, इसके परिणामस्वरूप, इन सेट्स को बीच में विभाजित करते हैं, इसलिए Q1 = 2 और Q3 = 6।
ध्यान दें कि संख्याएँ 1, 2 निचले क्वारटाइल से कम या उसके बराबर हैं, जबकि 2, 3, 4, 5, 6, 7 Q1 से बड़े या उसके बराबर हैं। इसलिए, 7 में से 2 या 28% मान Q1 से कम या उसके बराबर हैं और 7 में से 6 या 85% Q1 से बड़े हैं।
उदाहरण: संख्याओं 1, 2, 3, 4, 5 के ऊपरी और निचले क्वारटाइल की गणना करें।
अब मध्यांक 3 है, जिससे दो सेट {1, 2} और {4, 5} बनते हैं। इन संख्याओं को बीच में विभाजित करना काम नहीं करता, इसलिए यह तुरंत स्पष्ट नहीं है कि क्वारटाइल्स क्या हैं।
इसी तरह, ऊपरी क्वारटाइल 4 होना दिखाया जा सकता है।
बड़े डेटा सेट के लिए, चौथाई (quartiles) निम्नलिखित तरीके से चुने जा सकते हैं:
निम्न चौथाई (Lower Quartile) के लिए;
उच्च चौथाई (Upper Quartile) के लिए;
उदाहरण: मानों 1, 2, 3, 4, 5, 6, 7 के लिए चौथाई खोजें और साथ ही मानों 1, 2, 3, 4, 5 के लिए इस नए तरीके का उपयोग करें।
सेट 1, 2, 3, 4, 5, 6, 7 के लिए हमारे पास N = 7 है। इस प्रकार:
सेट 1, 2, 3, 4, 5 के लिए हमारे पास N = 5 है। इस प्रकार:
क्वारटाइल उपयोगी हैं और वे मानों के वितरण का वर्णन करने में मदद करते हैं, जैसा कि हम आगे देखेंगे। हालाँकि, हम अक्सर यह जानना चाहते हैं कि एक विशेष डेटा मान दूसरों के मुकाबले कैसे है। उदाहरण के लिए, जब मानकीकृत परीक्षण स्कोर जैसे SAT स्कोर लेते हैं, तो मैं केवल अपना स्कोर नहीं जानना चाहता, बल्कि यह भी जानना चाहता हूँ कि मेरा स्कोर सभी स्कोरों के सापेक्ष कैसे रैंक करता है। इस स्थिति के लिए प्रतिशतिल बिल्कुल सही होते हैं।
K-th Percentile
नोट: निचला क्वारटाइल 25वें प्रतिशत के समान है, मीडियन 50वें प्रतिशत के समान है, और ऊपरी क्वारटाइल 75वें प्रतिशत के समान है।
K-th Percentile
उदाहरण: 40 धूम्रपान करने वालों के कोटिनाइन स्तर पर विचार करें:
क्वारटाइल और 40वें percentile की गणना करें।
पहले ध्यान दें कि हम अपनी गणनाएँ शुरू करने से पहले डेटा को क्रमबद्ध करना होगा - गैर-क्रमबद्ध डेटा के लिए प्रतिशत निकालना सबसे आम गलती है (इसलिए कृपया इससे बचें)। यहाँ डेटा एक बार फिर से, इस बार क्रमबद्ध किया गया है:
अब हम अपनी गणनाएँ कर सकते हैं, जहाँ N = 40 (हमारे डेटा सेट में मानों की संख्या)।
लेकिन प्रतिशत के लिए एक और प्रश्न आमतौर पर पूछा जाता है: एक विशेष मान दिया गया है, उस मान के अनुरूप प्रतिशत ज्ञात करें। दूसरे शब्दों में, यह निर्धारित करें कि कितने मान कम हैं और कितने मान इस विशेष मान से बड़े हैं।
किसी विशेष डेटा मान x के लिए प्रतिशतांक (percentile) ज्ञात करने का तरीका है:
उदाहरण: मान लीजिए कि आपने उपर्युक्त कोटिनिन स्तरों के अध्ययन में भाग लिया, और आपका व्यक्तिगत कोटिनिन स्तर 245 था। 245 का प्रतिशतांक मान क्या है, और अध्ययन में आपसे अधिक कोटिनिन स्तर वाले कितने लोग थे?
पहले यह नोट करें कि हमारी सॉर्ट की गई डेटा में मान 245 29वें स्थान पर है (मुझे निश्चित रूप से सॉर्ट की गई डेटा का उपयोग करना होगा)। इसलिए, हमारे सूत्र के अनुसार:
इस प्रकार, प्रतिशतांक की परिभाषा के अनुसार, 72.5% मान 245 से कम हैं, जबकि (100 - 72.5) = 27.5% 245 से अधिक हैं।
बिल्कुल, Excel का उपयोग करके प्रतिशतांक ज्ञात किया जा सकता है, और इसलिए ऊपरी और निचले क्वारटाइल (जो कि क्रमशः 25वां और 75वां प्रतिशतांक हैं) भी ज्ञात किए जा सकते हैं।
प्रतिशतांक की गणना करने के लिए Excel का फंक्शन है \"=percentile(RANGE, K)\", जहाँ RANGE सेल्स की एक रेंज है और K वह प्रतिशतांक है जिसे 0 और 1 के बीच के दशमलव संख्या के रूप में गणना की जानी है। डेटा को सॉर्ट करने की आवश्यकता नहीं है, Excel इसे अपने आप संभाल सकता है।
डेटा सेट में किसी मान x की रैंक को डेटा सेट के प्रतिशत के रूप में ज्ञात करने के लिए Excel का फंक्शन है \"=percentrank(RANGE, X)\"। डेटा को सॉर्ट करने की आवश्यकता नहीं है, Excel इसे अपने आप संभाल सकता है।
उदाहरण के लिए, फंक्शन \"=percentile(A1:A10, 0.40)\" A1 से A10 तक के सेल्स में मानों का 40वां प्रतिशतांक ज्ञात करता है।
374 videos|1072 docs|1174 tests
|