कृत्रिम बुद्धिमत्ता मानसिक स्वास्थ्य स्थितियों जैसे डिप्रेशन के निदान के लिए सोशल मीडिया चैनलों के माध्यम से एक प्रमुख उपकरण बन गई है। हालांकि, नॉर्थईस्टर्न यूनिवर्सिटी के हाल के स्नातकों यचेन काओ और शियाओरुई शेन द्वारा की गई एक विस्तृत समीक्षा ने इन एआई मॉडलों में महत्वपूर्ण पक्षपात और पद्धतिगत मुद्दों को उजागर किया है। उनकी अंतर्दृष्टियाँ इन उपकरणों की अपूर्ण डेटा और कार्यप्रणालियों पर निर्भरता को प्रकट करती हैं, जिससे उनके वास्तविक दुनिया में विश्वसनीयता पर सवाल उठे हैं।
अध्ययन की पृष्ठभूमि
यचेन काओ और शियाओरुई शेन ने नॉर्थईस्टर्न यूनिवर्सिटी के सिएटल कैंपस में अपने अनुसंधान यात्रा की शुरुआत की। मशीन लर्निंग और डीप लर्निंग मॉडलों का मानसिक स्वास्थ्य अध्ययन में उपयोग कैसे किया जाता है, इसे निकटता से देखने की चाह के साथ प्रेरित होकर, उन्होंने अन्य विश्वविद्यालयों के साथियों के साथ मिलकर मौजूदा अकादमिक साहित्य का आलोचनात्मक मूल्यांकन किया। उनका संयुक्त प्रयास 47 पत्रों की एक व्यवस्थित समीक्षा में परिणित हुआ, जो विभिन्न सोशल मीडिया प्लेटफार्मों पर उपयोगकर्ताओं में डिप्रेशन को पहचानने के लिए एआई के उपयोग पर केंद्रित था। इस व्यापक कार्य को जर्नल ऑफ बिहेवियरल डेटा साइंस में स्थान मिला है।
पद्धति में खामियाँ
विश्लेषण ने समीक्षा के अधीन एआई मॉडलों में कई खामियाँ उजागर कीं। एक महत्वपूर्ण खोज ने संकेत दिया कि केवल 28% अध्ययनों ने उपयुक्त हाइपरमैटर समायोजन किया। यह लापरवाही एआई उपकरणों के प्रदर्शन को कमजोर कर देती है। इसके अलावा, लगभग 17% अध्ययनों ने दोषपूर्ण डेटा विभाजन पद्धतियों का उपयोग किया, जिससे ओवरफिटिंग का खतरा बढ़ गया, जहाँ मॉडल शोर को पैटर्न के बजाय सीखता है, जिससे अविश्वसनीय भविष्यवाणियाँ होती हैं।
डेटा में असमानता और इसके परिणाम
ट्विटर, रेडिट, और फेसबुक जैसे सोशल मीडिया प्लेटफॉर्म उपयोगकर्ता जनित सामग्री का खजाना प्रदान करते हैं जो इस प्रकार के विश्लेषण के लिए तैयार है। हालांकि, अध्ययनों ने एक सीमित जनसांख्यिकी—मुख्य रूप से संयुक्त राज्य अमेरिका और यूरोप के अंग्रेजी-भाषी उपयोगकर्ताओं—से डेटा पर अत्यधिक भरोसा किया। पश्चिमी उपयोगकर्ताओं के अत्यधिक प्रतिनिधित्व ने इन अध्ययनों के निष्कर्षों की वैश्विक पैमाने पर प्रासंगिकता पर सवाल उठाए। प्लेटफॉर्म का उपयोग असंतुलित था क्योंकि X (पूर्व में ट्विटर) सबसे उपयोग किया गया, डेटा संग्रहण नीतियों में आठ अध्ययनों ने कई प्लेटफॉर्म को संयोजित किया।
भाषा की जटिल प्रकृति
मानव भाषा में निहित भाषाई सूक्ष्मताओं का समाधान करना सबसे बड़े चुनौती में से एक बना हुआ है। अध्ययनों में प्रायः इन सूक्ष्मताओं, जैसे नकारात्मक और व्यंग्य, का सटीकता से पता लगाने में विफल रहे। समीक्षा किए गए अध्ययनों में से केवल 23% ने बताया कि वे इन भाषाई चुनौतियों से कैसे निपटते हैं, जिससे कार्यप्रणालियों में एक अंतर का पता चलता है।
परिष्करण की दिशा में मार्ग
स्नातकों द्वारा जोर दिया गया, ज्ञात कंप्यूटर विज्ञान के कुछ मूलभूत सिद्धांतों का पालन करने में विफलता अक्सर अशुद्धियों का कारण बनती है। उनकी आलोचनात्मक समीक्षा ने PROBAST उपकरण का उपयोग किया, जो भविष्यवाणी मॉडल की पारदर्शिता और पुन: उत्पन्नता का मूल्यांकन करने के लिए डिज़ाइन किया गया है। अनजाने में, कई अध्ययन महत्वपूर्ण जानकारी प्रदान करने में विफल रहे, जिससे उनके आकलन और पुन: निर्माण में बाधा आई। अधिक सटीक एआई उपकरणों की ओर बढ़ने के लिए, शोधकर्ता सहयोगात्मक प्रयासों के पोषण का सुझाव देते हैं, जैसे कि विकिस या ट्यूटोरियल के रूप में शिक्षण संसाधनों का विकास, विशेषज्ञ ज्ञान को प्रभावी ढंग से फैलाने के लिए।
ये अंतर्दृष्टियाँ वैज्ञानिक समुदाय के लिए मानसिक स्वास्थ्य अनुप्रयोगों में प्रयुक्त एआई मॉडलों का पुनर्मूल्यांकन और परिष्करण करने की एक कॉल के रूप में खड़ी हैं। अधिक विविध डेटा सेट, बेहतर समायोजित मॉडल, और स्पष्ट कार्यप्रणालियाँ एआई उपकरणों के लिए एक सच्चे वैश्विक दर्शकों की सेवा करेगी। जैसा कि Northeastern Global News में कहा गया है, वे अपने निष्कर्षों को साझा करने और वाशिंगटन, डी.सी. में आगामी अंतर्राष्ट्रीय सोसाइटी फॉर डेटा साइंस एंड एनालिटिक्स सभा में अधिक कठोर एआई मॉडल निर्माण की दिशा में एक बदलाव को प्रोत्साहित करने की उम्मीद रखते हैं।