डेटा साइंस क्या होता है:- हम इस बारे में बहुत कुछ सुनते हैं कि कैसे कृत्रिम बुद्धिमत्ता और मशीन लर्निंग दुनिया को बदलने जा रही है और कैसे इंटरनेट ऑफ थिंग्स सभी के जीवन को आसान बना देगा।
लेकिन इन सभी क्रांतिकारी तकनीकों का आधार क्या है?
जवाब डेटा है।
सोशल मीडिया से लेकर आईओटी डिवाइसेज को जनरेट करने के लिए। डेटा की बिल राशि कैब सेवा प्रदाता उबर पर विचार करें। मुझे यकीन है कि आप सभी ने Uber का इस्तेमाल किया होगा। आपको क्या लगता है कि उबेर एक बहु-अरब डॉलर की कंपनी है।
क्या यह कैब की उपलब्धता है या यह उनकी सेवा है?
खैर, इसका उत्तर यह है कि डेटा डेटा उन्हें बहुत समृद्ध बनाता है, लेकिन रुकिए, क्या कोई व्यवसाय विकसित करने के लिए पर्याप्त है?
बेशक, आपको यह नहीं पता होना चाहिए कि उपयोगी अंतर्दृष्टि प्राप्त करने और समस्याओं को हल करने के लिए डेटा का उपयोग कैसे करें। यहीं से डेटा साइंस आता है।
शब्द डेटा विज्ञान डेटा विज्ञान को बेहतर ढंग से समझने के लिए समाधान खोजने के लिए या किसी समस्या कथन के परिणामों की भविष्यवाणी करने के लिए डेटा का उपयोग करने की प्रक्रिया है।
आइए देखें कि यह हमारी दिन-प्रतिदिन की गतिविधियों को कैसे प्रभावित करता है।
सोमवार की सुबह है और मुझे मीटिंग शुरू होने से पहले ऑफिस पहुंचना है।
इसलिए मैं जल्दी से उबेर खोलता हूं और कैब की तलाश करता हूं, लेकिन दिन के इस समय में गैब ए को तुलनात्मक रूप से अधिक पढ़ता है।
क्यों होता है ऐसा?
खैर, जाहिर है क्योंकि सोमवार की सुबह पी कार हैं और हर कोई काम पर जा रहा है। कैम की उच्च मांग के कारण कैब किराए में वृद्धि होती है।
हम सभी यह जानते हैं लेकिन यह सब कैसे लागू किया गया डेटा विज्ञान Ubers मूल्य निर्धारण एल्गोरिथ्म के केंद्र में है सर्ज मूल्य निर्धारण एल्गोरिथ्म यह सुनिश्चित करता है कि उनके यात्रियों को हमेशा एक सवारी की आवश्यकता हो।
यहां तक कि अगर यह बढ़ी हुई कीमतों की कीमत पर आता है, तो उबेर डेटा विज्ञान को लागू करता है ताकि यह पता लगाया जा सके कि कौन से पड़ोस सबसे व्यस्त होंगे ताकि वह अधिकतम से अधिक ड्राइवरों को सड़क पर अधिक ड्राइवरों को प्राप्त करने के लिए खोज मूल्य निर्धारण को सक्रिय कर सके।
यह कितनी सवारी प्रदान कर सकता है और इसलिए इस उबेर वृद्धि मूल्य निर्धारण एल्गोरिदम से लाभ डेटा विज्ञान का उपयोग करता है।
आइए देखें कि कैसे एक डेटा विज्ञान प्रक्रिया हमेशा व्यावसायिक आवश्यकता या समस्या को समझने के साथ शुरू होती है।
आप इस मामले को सुलझाने की कोशिश कर रहे हैं।
व्यावसायिक आवश्यकता एक गतिशील मूल्य निर्धारण मॉडल का निर्माण करना है जो प्रभावी हो। जब एक ही क्षेत्र में बहुत सारे लोग एक ही समय में सवारी का अनुरोध कर रहे हों। इसके बाद डेटा संग्रह होता है उबर मौसम जैसे डेटा एकत्र करता है।
Oracle डेटा छुट्टियों का समय ट्रैफ़िक पिक एंड ड्रॉप लोकेशन और यह इस सब का ट्रैक रखता है। डेटा साइंस क्या होता है,
अगला चरण डेटा की सफाई है, जबकि कभी-कभी अनावश्यक डेटा एकत्र किया जाता है, इस तरह के डेटा केवल समस्या की जटिलता को बढ़ाते हैं, एक उदाहरण है कि बूबर आस-पास के रेस्तरां और कैफे के स्थान जैसी जानकारी एकत्र कर सकता है, ऐसे डेटा के लिए उबेर सर्ज मूल्य निर्धारण का विश्लेषण करने की आवश्यकता नहीं है। इस चरण पर डेटा को हटाना होगा डेटा नियोजन के बाद तिथि होगी। अन्वेषण और विश्लेषण।
डेटा अन्वेषण चरण डेटा विश्लेषण के विचार-मंथन की तरह है।
यह वह जगह है जहां आप अपने डेटा में पैटर्न को समझते हैं।
इसके बाद डेटा मॉडलिंग डेटा मॉडलिंग चरण में मूल रूप से एक मशीन लर्निंग मॉडल का निर्माण शामिल है जो किसी निश्चित समय और स्थान पर उबेर वृद्धि की भविष्यवाणी करता है।
यह मॉडल अन्वेषण चरण में एकत्रित सभी अंतर्दृष्टि और रुझानों का उपयोग करके बनाया गया है।
मॉडल को हजारों ग्राहक रिकॉर्डों को खिलाकर प्रशिक्षित किया जाता है, ताकि वह परिणाम की अधिक सटीक भविष्यवाणी करना सीख सके। डेटा साइंस क्या होता है,
अगला डेटा सत्यापन चरण है अब यहां मॉडल का परीक्षण किया जाता है जब एक नई ग्राहक पुस्तकें आती हैं नई बुकिंग के डेटा की तुलना ऐतिहासिक डेटा से की जाती है ताकि यह जांच की जा सके कि खोज कीमतों में कोई विसंगतियां हैं या कोई गलत भविष्यवाणी, यदि कोई है इस तरह की विसंगतियों का पता चलता है, एक सूचना तुरंत उबेर के डेटा वैज्ञानिकों को भेजी जाती है जो इस मुद्दे को ठीक करते हैं।
इस प्रकार उबर किसी दिए गए स्थान और समय के लिए वृद्धि मूल्य की भविष्यवाणी करता है विज्ञान का अंतिम चरण परिनियोजन और अनुकूलन है।
इसलिए मॉडल का परीक्षण करने और इसकी दक्षता में सुधार करने के बाद, इसे सभी उपयोगकर्ताओं पर तैनात किया जाता है, इस स्तर पर ग्राहक प्रतिक्रिया प्राप्त होती है और यदि कोई समस्या है, तो उन्हें यहां ठीक किया जाता है। तो वह थी संपूर्ण डेटा विज्ञान प्रक्रिया।
अब, डेटा विज्ञान के कुछ अन्य अनुप्रयोगों पर नजर डालते हैं, डेटा विज्ञान ई-कॉमर्स प्लेटफॉर्म जैसे अमेज़ॅन और फ्लिपकार्ट में लागू किया गया है।
नेटफ्लिक्स की सिफारिश प्रणाली के पीछे यह तर्क भी है कि अब सभी वास्तविकता में गुणवत्ता डेटा विज्ञान ने आज के बाजार में उल्लेखनीय बदलाव किए हैं।
इसके एप्लिकेशन क्रेडिट कार्ड धोखाधड़ी का पता लगाने से लेकर सेल्फ-ड्राइविंग कारों और वर्चुअल असिस्टेंट जैसे सिटी और एलेक्सा तक हैं। डेटा साइंस क्या होता है,
आइए एक उदाहरण पर विचार करें मान लीजिए कि आप अमेज़ॅन पर जूते की तलाश करते हैं, लेकिन आप इसे वहां नहीं खरीदते हैं।
अब अगले दिन आप YouTube पर वीडियो देख रहे हैं और अचानक आपको उसी आइटम के लिए एक विज्ञापन दिखाई देता है जिसे आप वहां फेसबुक पर स्विच करते हैं।
साथ ही, आप वही विज्ञापन देखते हैं तो यह कैसे होता है?
ऐसा इसलिए होता है क्योंकि Google आपके खोज इतिहास को ट्रैक करता है और आपके खोज इतिहास के आधार पर विज्ञापनों की अनुशंसा करता है।
यह डेटा विज्ञान के सबसे अच्छे अनुप्रयोगों में से एक है। वास्तव में अमेज़न के राजस्व का 35% उत्पाद अनुशंसा से उत्पन्न होता है। और उत्पाद अनुशंसा के पीछे तर्क डेटा विज्ञान है।
Apple ने डेटा साइंस का उपयोग एक ऐसी घड़ी बनाने के लिए किया जो मॉनिटर और व्यक्तियों के स्वास्थ्य की निगरानी करती है यह घड़ी व्यक्ति की हृदय गति नींद चक्र श्वास दर गतिविधि स्तर रक्तचाप आदि जैसे डेटा एकत्र करती है और इन उपायों का रिकॉर्ड 24 बार सात रखती है।
इस एकत्र किए गए डेटा को तब संसाधित किया जाता है और एक मॉडल बनाने के लिए विश्लेषण किया जाता है जो दिल के दौरे के जोखिम की भविष्यवाणी करता है। डेटा साइंस क्या होता है,
तो ये कुछ घंटे थे लोकेशन अब सवाल यह है कि आपको लिंक्डइन के मार्च 2019 के सर्वेक्षण के अनुसार डेटा वैज्ञानिक कैसे और क्यों बनना चाहिए, एक डेटा वैज्ञानिक अमेरिका में सबसे आशाजनक नौकरी की भूमिका है और यह कांच के दरवाजे पर नंबर एक पर है। 2019 ।
यहां कुछ नौकरी के रुझान हैं जो लिंक्डइन से एकत्र किए गए हैं जैसे कि माइक्रोसॉफ्ट आईबीएम फेसबुक और गूगल जैसी शीर्ष कंपनियों में हजार से अधिक रिक्तियां हैं, और यह संख्या केवल बढ़ने जा रही है।
हर्ले ये नौकरी रुझान एक डेटा वैज्ञानिक के वेतन पर आने वाले जॉग मानहानि के संबंध में नौकरियों की रिक्ति दिखाते हैं, औसत वेतन एक लाख डॉलर दो सौ अस्सी दो हजार डॉलर के बीच होता है।
अब याद रखें कि आपका वेतन आपके कौशल पर निर्भर करता है, आपके अनुभव का स्तर आपके भूगोल और जिस कंपनी के लिए आप यहां काम कर रहे हैं, वे कौशल हैं जो डेटा वैज्ञानिक बनने के लिए आवश्यक हैं।
आपको हमारी जैसी प्रोग्रामिंग भाषाओं में सांख्यिकी विशेषज्ञता में कुशल होना चाहिए और पायथन एक बस आपको प्रक्रियाओं की अच्छी समझ होनी चाहिए, जैसे डेटा निष्कर्षण प्रसंस्करण तकरार और अन्वेषण। डेटा साइंस क्या होता है,
आपको विभिन्न प्रकार के मशीन लर्निंग एल्गोरिदम से भी अच्छी तरह वाकिफ होना चाहिए और वे कैसे काम करते हैं उन्नत मशीन लर्निंग कॉन्सेप्ट जैसे डीप लर्निंग भी आवश्यक है, आपको हडूप और स्पार्क जैसे विभिन्न बड़े डेटा प्रोसेसिंग फ्रेमवर्क की अच्छी समझ होनी चाहिए और अंत में , आपको पता होना चाहिए कि झांकी और पावर बाय जैसे उपकरणों का उपयोग करके डेटा की कल्पना कैसे की जाती है, अब आप जानते हैं कि डेटा वैज्ञानिक बनने के लिए क्या करना पड़ता है।
डेटा साइंटिस्ट के रूप में अपना करियर शुरू करने का समय आ गया है।