डेटा साइंस, मशीन लर्निंग और एआई के लिए पायथन और सांख्यिकी ट्यूटोरियल
डेटा साइंस, मशीन लर्निंग और आर्टिफिशियल इंटेलिजेंस मार्केट में उछाल है।
डेटा विज्ञान मूल रूप से वैज्ञानिक तरीकों, प्रक्रियाओं और एल्गोरिदम का उपयोग करके अंतर्दृष्टि, समझ और ज्ञान के लिए संरचित या असंरचित डेटा को परिवर्तित कर रहा है।
R और Python डाटा साइंस में इस्तेमाल होने वाली सबसे आम प्रोग्रामिंग लैंग्वेज हैं।
R सांख्यिकीय और विज़ुअलाइज़ेशन सॉफ़्टवेयर के रूप में उपयोग की जाने वाली मुक्त ओपन सोर्स भाषा है। यह संरचित (संगठित) और अर्ध-संरचित (अर्ध-संगठित) डेटा से निपट सकता है।
डेटा विज्ञान के लिए आर सीखने के लिए हमने सभी पहलुओं को निम्न प्रकार से कवर किया है:
& # 10020; परिचय
& # 10020; डेटा प्रकार आर में
& # 10020; चर में आर
& # 10020; संचालकों में आर
& # 10020; सशर्त बयान
& # 10020; लूप स्टेटमेंट्स
& # 10020; लूप नियंत्रण विवरण
& # 10020; आर स्क्रिप्ट
& # 10020; कार्य
& # 10020; कस्टम फ़ंक्शन
& # 10020; डेटा संरचनाएं
• परमाणु वैक्टर
• आव्यूह
• अर्र
• कारक
• डेटा फ्रेम्स
• सूची
& # 10020; आयात / निर्यात डेटा - डेटा संरचना के लिए मान निर्दिष्ट करें
& # 10020; डेटा हेरफेर / परिवर्तन
& # 10020; बेस आर का फ़ंक्शन लागू करें
& # 10020; dplyr पैकेज
पायथन के लिए हमने निम्नलिखित कवर किया -
& # 10020; पर्यावरण स्थापना और पायथन की अनिवार्यता
• परिचय और पर्यावरण सेटअप
• अजगर में चर कार्य
• पायथन में डेटा प्रकार
• डेटा संरचना: टपल
• डेटा संरचना: सूची
• डेटा संरचना: शब्दकोश (डिक्ट)
• डेटा संरचना: सेट
• मूल ऑपरेटर: में
• मूल ऑपरेटर: + (प्लस)
• मूल ऑपरेटर: * (गुणा)
• कार्य
• पायथन में निर्मित अनुक्रम समारोह
• नियंत्रण प्रवाह विवरण: यदि, एलिफ, और
• नियंत्रण प्रवाह विवरण: लूप्स के लिए
• नियंत्रण प्रवाह विवरण: जबकि लूप
• उपवाद सम्भालना
& # 10020; पायथन में न्यूमपी के साथ गणितीय संगणना
• अर्र के प्रकार
• ndarray के गुण
• बुनियादी संचालन
• ऐरे तत्व तक पहुँचना
• कॉपी और दृश्य
• यूनिवर्सल फ़ंक्शंस (ufunc)
• आकार हेरफेर
• प्रसारण
• रेखीय बीजगणित
& # 10020; पंडों के साथ डेटा हेरफेर
• क्यों पंडों?
• डेटा संरचनाएं
• श्रृंखला - निर्माण
• श्रृंखला - एक्सेस तत्व
• श्रृंखला - वेक्टरिंग ऑपरेशन
• डेटाफ़्रेम - निर्माण
• डेटाफ़्रेम देखना
• गुम मानों को संभालना
• कार्यों के साथ डेटा संचालन
डेटा संचालन के लिए सांख्यिकीय कार्य
• GroupBy के साथ डेटा ऑपरेशन
• डेटा ऑपरेशन: सॉर्टिंग
• डेटा ऑपरेशन: मर्ज, डुप्लिकेट, कॉनटेनटेशन
पंडों में एसक्यूएल ऑपरेशन
इस क्षेत्र में सीखने के लिए सांख्यिकी महत्वपूर्ण हिस्सा है।
आंकड़ों में उपयोग की जाने वाली शर्तें शुरुआती लोगों के लिए समझने में बहुत अजीब और कठिन हैं, इसलिए हमने इन शब्दों को डेटा साइंस, मशीन लर्निंग, एआई क्षेत्र में नोविस, इंटरमीडिएट या उन्नत स्तर के लोगों के लिए बहुत आसान भाषा में समझाने की पूरी कोशिश की।
यहाँ हमने आँकड़ों में प्रयुक्त बहुत सारे शब्दों को शामिल किया है जैसे -
• परिकल्पनाएँ
• मात्रात्मक विधियां
• गुणात्मक तरीके
• स्वतंत्र और आश्रित चर
• प्रिडिक्टर और आउटकम वैरिएबल
• श्रेणीगत चर
• बाइनरी चर
• नाममात्र का चर
• साधारण चर
• लगातार बदलने वाला
• अंतराल चर
• अनुपात चर
• असतत चर
• गड़बड़ी करने वाले चर
• माप त्रुटि
• वैधता और विश्वसनीयता
• डेटा संग्रह के दो तरीके
• भिन्नता के प्रकार
• अनैच्छिक परिवर्तन
• व्यवस्थित रूपांतर
• आवृत्ति वितरण
• मतलब
• मेडियन
• मोड
• डेटा के वितरण में फैलाव
• रेंज
• अन्तःचतुर्थक श्रेणी
• चतुर्थांश
• संभावना
• मानक विचलन
इस परियोजना का सबसे महत्वपूर्ण लाभ यह है कि नमूना परियोजना को छोड़कर पूरी सामग्री ऑफ़लाइन उपलब्ध है, नमूना परियोजना भाग ऑनलाइन है क्योंकि हम इसे नियमित रूप से वेब आधारित जोड़ते रहते हैं।
मोबाइल डिवाइस पर ऑनलाइन संकलक, आप मोबाइल पर कोड लिख सकते हैं और आउटपुट देखने के लिए इसे चला सकते हैं।
सिमुलेशन टेस्ट / परीक्षा - इस सिमुलेशन परीक्षा का प्रयास करके डेटा विज्ञान में अपने ज्ञान की जांच करें, प्रत्येक प्रश्न में 4 विकल्प और 1 सही उत्तर हैं।