‘डेटा ब्लैकहोल’ का अंधियारा: विश्वसनीय आंकड़ों के संकट में नीति निर्माण की चुनौती

पुस्तक अंश: रीतिका खेरा अपनी किताब 'रेवड़ी या हक' में लिखती हैं, 'स्वतंत्रता के बाद, कभी भी ऐसा नहीं हुआ कि देश में जनगणना समय पर न हुई हो. जब से सरकार को कोविड का बहाना मिला, तब से आम चुनाव, कई राज्यों में चुनाव, कुंभ इत्यादि का आयोजन तो सरकार कर चुकी है, लेकिन 2024 के अंत तक जनगणना स्थगित रही.'

पुस्तक आवरण (साभार: राजकमल प्रकाशन)

राजकमल प्रकाशन से प्रकाशित रीतिका खेरा की नई किताब रेवड़ी या हक में लेखिका बताती हैं कि किस तरह भारत में विश्वसनीय आंकड़ों की अनुपलब्धता नीति-निर्माण को अंधेरे में धकेल रही है. जनगणना, एनएसएस, एनएफएचएस जैसे महत्वपूर्ण सर्वेक्षणों की अनदेखी और बिग डेटा व निजी सर्वेक्षणों पर बढ़ती निर्भरता से न केवल लोकतांत्रिक जवाबदेही प्रभावित हो रही है, बल्कि करोड़ों लोग ज़रूरी कल्याणकारी योजनाओं से वंचित भी हो रहे हैं. प्रस्तुत है इसी विषय पर केंद्रित इस किताब से एक महत्त्वपूर्ण अंश.

§

भारत ‘डेटा ब्लैकहोल’ की ओर जा रहा है, जिसके अंधियारे में अर्थव्यवस्था सुधार की राह खो सकती है. मुद्दा विश्वसनीय आंकड़ों का है जिनकी नीति-निर्णय में महत्त्वपूर्ण भूमिका है. यदि लोगों के जीवन में सुधार लाना है (स्वास्थ्य-शिक्षा, रोज़गार-कमाई), यह तब मुमकिन होगा जब स्थ‌ित‌ि का सही आकलन करने की क्षमता हो. कहां स्कूल की ज़रूरत है, कहां शिक्षक की, किस रोज़गार में कितनी कमाई है? इस तरह के मौलिक सवालों के जवाब के लिए डेटा ज़रूरी है. 

प्रशांत चंद्र महालानोबिस जैसे दूरदर्शी लोगों ने देश में बेहतरीन सांख्य‌िकी ढांचा सृजित किया. जनगणना, नेशनल सैम्पल सर्वे (NSS) की व्यवस्था दशकों से वह सारी जानकारी उपलब्ध करवा रही है जिसके आधार पर नीति निर्माण हो. लेकिन पिछले दशक में यह व्यवस्था कमज़ोर पड़ी है.

जनगणना 2021 के न होने से काफ़ी नुक़सान हो रहा है—आज यह भी बताना मुश्किल है कि देश की कितनी आबादी शहरी है और कितनी ग्रामीण. स्वतंत्रता के बाद, कभी भी ऐसा नहीं हुआ कि देश में जनगणना समय पर न हुई हो. जब से सरकार को कोविड का बहाना मिला, तब से आम चुनाव, कई राज्यों में चुनाव, कुम्भ मेले, इत्यादि का आयोजन तो सरकार कर चुकी है, लेकिन 2024 के अंत तक जनगणना स्थगित रही. 

यह कोई अकादमिक मुद्दा नहीं, इसका लोगों पर सीधा प्रभाव पड़ता है. चूंकि खाद्य सुरक्षा क़ानून के अनुसार जन-वितरण प्रणाली में कवरेज जनगणना की आबादी के आधार पर तय होती है, हमारे अनुमान के अनुसार आज 10 करोड़ से अधिक लोग पीडीएस से वंचित हैं. कहीं-कहीं तो 2013-2017 के बाद पैदा हुए बच्चों के नाम भी नहीं जुड़ पाए हैं!

उदाहरण के लिए, एनएसएस हर पांच वर्ष में लोगों के रोज़गार पर और उनके उपभोग के ख़र्चों (कंजम्पशन एक्सपेंड‌िचर) पर विश्वसनीय सर्वे डेटा एकत्रित करती आई है. 2011-12 के बाद, 2017 का डेटा इसलिए रद्द कर दिया गया कि उसमें आर्थिक स्थ‌ित‌ि में ख़ास सुधार नहीं दिख रहा था. आख़िरकार, 2024 में 2022-23 का डेटा रिलीज़ हुआ—यानी दस सालों तक कोई विश्वसनीय डेटा उपलब्ध नहीं था. एनएफ़एचएस-3, जो 2005-6 में हुआ और एनएफ़एचएस-4 (2015-16) के बीच दस साल बीत गए, हालांकि इन्हें पांच साल के अंतराल में होना चाहिए. यह केवल दो उदाहरण हैं; राष्ट्रीय स्तर पर होनेवाले बड़े सर्वेक्षणों से जुड़ी दिक़्क़त और व्यापक है.

मुद्दा केवल तथ्यों की अनुपलब्धता तक ही सीमित नहीं. हमने देखा कि एनएफ़एचएस-5 के अनुसार देश में, एनएफ़एचएस-4 की तुलना में, अनीमिया बढ़ गया. इस पर जब लोगों ने सवाल उठाने शुरू किये, तो ख़बर आई कि अगले एनएफ़एचएस में सरकार ने अनीमिया पर सवाल हटवा दिये हैं. अपनी विफलता को छुपाने का आसान उपाय—ना रहेगा बांस, ना बजेगी बांसुरी.

एक और मुद्दा है कि किसी भी आर्थिक संकेतक की गिनती करने का एक मेथड रहा है. उदाहरण के लिए, बेरोज़गारी. भारत जैसी अर्थव्यवस्था में, जहां बहुत से लोग असंगठित क्षेत्र में काम करते हैं, वहां रोज़गार को परिभाषित करना आसान नहीं. कुछ साल पहले रोज़गार को परिभाषित करने की विधि को बदल दिया गया, जिसके परिणामस्वरूप पहले की स्थ‌ित‌ि और आज की स्थ‌ित‌ि की तुलना करना मुमकिन नहीं, या तुलना करने के लिए कई अनुमान लगाने होंगे.

तथ्य या डेटा ना हो तो हक़ीक़त से छुपना, उससे मुंह मोड़ लेना, जवाबदेही से बचना, आसान हो जाता है. ऐसे कई उदाहरण हैं—अगस्त 2021 में राज्य सभा में केंद्र सरकार ने बताया कि ऑक्सीजन की कमी से किसी राज्य ने मौत की जानकारी नहीं दी है. जुलाई 2021 में मंत्री ने जवाब दिया कि ‘मैनुअल स्कॅवेंजिंग’ (यानी, मैला उठाने) से देश में, पिछले पांच सालों में, किसी की मौत की दर्ज नहीं हुई. राज्य गृह मंत्री और कृषि मंत्री ने कहा कि किसान आंदोलन में कितनी मौतें हुई हैं, उसका रेकॉर्ड नहीं. 2020 में तालाबन्दी (लॉकडाउन) में फंसे मज़दूरों के लिए श्रमिक ट्रेन चलाई गई. सितम्बर 2020, संसद में श्रम मंत्री ने कहा कि श्रमिक ट्रेन में मौत की जानकारी एकत्रित नहीं की जा रही. इन सबमें सूचना का न होना, जवाबदेही से बचने का रास्ता था.

हालात सुधरने के बजाय बिगड़ रहे हैं. सूचना के अधिकार के तहत, सरकार को कई सारी जानकार‌ियां अपने आप, बिना किसे के मांगे अपनी वेबसाइट (या अन्य रूप में) लोगों को उपलब्ध करवाना अनिवार्य है. लेकिन नरेगा की वेबसाइट पर आज 2014 से पहले की काफ़ी सारी जानकारी ग़ायब कर दी गई है. आरटीआई द्वारा मांगने पर कहा गया कि यह जानकारी नरेगा अनुभाग के पास उपलब्ध नहीं, हालांकि राज्य सभा की वेबसाइट से प्राप्त हो गई.

प्रधानमंत्री मातृ वन्दना योजना के द्वारा लाभान्वित महिलाओं की संख्या महिला एवं बाल विकास मंत्रालय की वेबसाइट पर नहीं उपलब्ध—आरटीआई लगाकर ही मिलती है.

आंकड़े नीति-निर्णय में रोशनी डालने का काम करते हैं, राह ढूंढ़ने में मददगार होते हैं. तथ्यों के बिना आर्थिक, और कुछ हद तक सामाजिक राजनीतिक, स्थ‌ित‌ि का जायज़ा लेना, नामुमकिन नहीं तो कठिन हो जाता है. तथ्यों के अभाव में, सबसे बुलंद आवाज़ वाले व्यक्ति का सत्य, सबका सत्य हो जाता है.

क्या ‘बिग डेटा’ और निजी सर्वेक्षण के चलते जनगणना और सरकारी सर्वे की ज़रूरत है? बिग डेटा को लेकर कई लोग बावले हो रहे हैं, लेकिन देश में मूल आंकड़े (रोज़गार, ग़रीबी, मृत्यु दर) हास‌िल कर पाना एक संघर्ष है. केवल आंकड़ों को ‘रियल टाइम’ (जैसा कि बिग डेटा के बारे में कहा जाता है) में एकत्रित करने से किसी आर्थिक, सामाजिक या राजनीतिक समस्या पर समझ नहीं बन सकती और न उसका समाधान हो सकता.

एक हास्यास्पद उदाहरण अहमदाबाद से है. वहां किसी व्यक्ति का स्कूटर चोरी हो गया. उसने थाने में रपट दर्ज कराई थी. चोरी के स्कूटर की ख़बर मालिक को किस तरह मिल रही थी? शहर में ट्रैफ़िक लाइट को फांदने पर ट्रैफ़िक पुलिस के कैमरा उस स्कूटर को ‘पकड़’ रहे थे, और मालिक को जुर्माना भरने के चालान भेजे जा रहे थे! क़ायदे से, ट्रैफ़िक पुलिस कैमरा में पकड़े जाने पर स्कूटर को ज़ब्त, और चोर को गिरफ़्तार, होना चाहिए था. भारत में बिग डेटा, रियल टाइम डेटा के जन हित में प्रयोगों के उदाहरण खोजना मुश्किल है.

निजी सर्वेक्षण का अनुभव भी बहुत अच्छा नहीं रहा. 2011-12 के बाद, एनएसएस का डेटा उपलब्ध नहीं था, तब मूल आर्थिक आंकड़ों के लिए अर्थशास्त्रियों को निजी कम्पनी, ‘सेंटर फ़ॉर मॉनीटरिंग द इंडियन इकोनॉमी’ (CMIE) के फ़ोन सर्वे पर निर्भर होना पड़ा. 2021 में बेरोज़गारी पर बहस CMIE के सर्वेक्षण के आंकड़ों पर हुई. ज्यां द्रेज़ और अनमोल सोमांची (2021) ने उत्तरदाताओं की सामाजिक-आर्थिक परिस्थ‌ित‌ि की औसत को, अन्य सरकारी सर्वेक्षण से प्राप्त उन्हीं संकेतकों से मैच किया.

उदाहरण के लिए, उन्होंने पाया कि 2015 में CMIE के अनुसार वयस्क साक्षरता की दर 83% थी, जो 2019 तक लगभग शत-प्रतिशत हो गई. यह मुमकिन नहीं लगता. CMIE के अनुसार 2015 में 98% घरों में बिजली थी, हालांकि NFHS-4 (2015-16) में केवल 88% में ही. निष्कर्ष यह है कि जिस डेटा के आधार पर चर्चा हो रही है, वह स्रोत शायद वास्तविकता नहीं दर्शा रहा था; CMIE का दावा, कि उनका सर्वे सांख्य‌िकी की दृष्टि से देश की आबादी का प्रतिनिधित्व करता, संदिग्ध था. हालांकि ‘बिग डेटा’ और निजी सर्वे काम आ सकते हैं लेक‌िन वह जनगणना और सरकारी सर्वेक्षणों की जगह नहीं ले सकते.

(साभार: राजकमल प्रकाशन)