पायथन के साथ csv फ़ाइल को कैसे विभाजित करें?

पायथन के साथ csv फ़ाइल को कैसे विभाजित करें?

पायथन ने csv फ़ाइलों को chunks में विभाजित किया

पायथन एक शक्तिशाली प्रोग्रामिंग भाषा है जिसका उपयोग कई अलग -अलग उद्देश्यों के लिए किया जा सकता है। उनमें से एक CSV फ़ाइलों को आयात कर रहा है और उन्हें chunks में संसाधित कर रहा है।

इस ट्यूटोरियल का लक्ष्य आपको यह सिखाना है कि सीएसवी फाइलों को कैसे आयात किया जाए और उन पर पायथन स्प्लिट फ़ंक्शन का उपयोग किया जाए। आप सीखेंगे कि इसे दो उदाहरणों के साथ कैसे उपयोग किया जाए: पहले कॉलम के आधार पर एक फ़ाइल को कई फ़ाइलों में विभाजित करना और एक फ़ाइल को मनमाना चंक्स में विभाजित करना।

यदि आप डेटा विज्ञान क्या है, तो आप परिचित नहीं हैं, यह डेटा से ज्ञान निकालने की प्रक्रिया है ताकि इसका उपयोग भविष्य के कार्यों के बारे में निर्णय लेने या परिष्कृत करने में किया जा सके।

CSV फ़ाइलों को chunks में विभाजित करने के लिए पायथन प्रोग्रामिंग भाषा का उपयोग कैसे करें?

आप CSV मॉड्यूल के साथ फ़ाइलों को विभाजित कर सकते हैं। यह मॉड्यूल पायथन 2 और पायथन 3 दोनों के साथ संगत है।

पायथन 3:

एक पायथन शेल में एक CSV फ़ाइल खोलें। आप CSV का उपयोग करेंगे। रीडर (फ़ाइल, सीमांकक =), फिर इसे CSV को पास करें। लेखक और आप फ़ाइल के बजाय स्ट्रिंग का उपयोग करेंगे क्योंकि पायथन 3 स्ट्रिंग्स में ऑब्जेक्ट्स (समान मेमोरी स्टेटस इन लिस्ट) हैं, इसलिए हमें उस तरीके को बदलना पड़ सकता है जिस तरह से डेटा संग्रहीत है (परिवर्तन प्रकार) जिसके परिणामस्वरूप अप्रत्याशित व्यवहार होगा।

Python3 में एक फ़ाइल खोलें:

Python3 विभाजित csv फ़ाइल chunks.py में

पायथन के साथ CSV फ़ाइलों को कैसे विभाजित करें? पायथन के साथ एक CSV फ़ाइल को कैसे विभाजित करें? पाठ फ़ाइल में पहले कॉलम के आधार पर कई छोटी फ़ाइलों में एक पाठ फ़ाइल को विभाजित करता है। यह CSV फ़ाइलों को बनाने या CSV/कॉमा सीमांकित फ़ाइलों को अन्य में बदलने के लिए एक सरल, आसान और शक्तिशाली तरीका है।

यह है कि आप अपनी फ़ाइल को कैसे आयात करते हैं:

आयात CSV

अब आप पाठक वर्ग के लिए सीमांकक = तर्क का उपयोग करने जा रहे हैं। यह उन पात्रों का एक सेट है जो फ़ील्ड को अलग करेंगे। इस मामले में, यह एक अल्पविराम (,) है। तो रीडर (फ़ाइल, डीमाइटर = ', प्रत्येक पंक्ति को उस कॉलम के आधार पर कई भागों में विभाजित करेगा।

पाठक = csv.reader (myfile, delimiter = ',')

अगली बात यह है कि एक फ़ाइल में डेटा लिखने के लिए लेखक वर्ग का उपयोग करना है। लेखक वर्ग का उपयोग करके डेटा लिखें और इसे फ़ाइल के बजाय एक स्ट्रिंग ऑब्जेक्ट पर पास करें क्योंकि स्ट्रिंग्स पायथन 3 में ऑब्जेक्ट हैं और आपके पास प्रकार को बदले बिना अप्रत्याशित व्यवहार हो सकता है। इसके मोड विशेषता को 'के रूप में सेट करें ताकि यह इस फ़ाइल पर लिखना शुरू कर दे।

लेखक = csv.writer (stringio)

अगला कदम यह है कि लेखक वर्ग को पाठक वर्ग के सभी डेटा का उपयोग करने के लिए निर्देश देना है कि वह इसे फ़ाइल में लिखें। आप पंक्तियों के माध्यम से लूप करेंगे और फ़ाइल में प्रत्येक को लिखेंगे। अंतिम चरण लेखकों का उपयोग करना है, जो लेखक का उपयोग करके एक फ़ाइल में एक पंक्ति (डेटा की एक पंक्ति) लिखेगा। लेखक (पंक्ति)।

I के लिए, पाठक में पंक्ति: #यह लूप पाठक से प्रत्येक पंक्ति के माध्यम से जाता है और प्रत्येक पंक्ति को एक फ़ाइल में लिखता है। row.append (पंक्ति)
लेखक (पंक्ति) #फ़ाइल के अंत में एक पंक्ति।
राइटर्स (पंक्तियाँ) एक ही बार में सभी पंक्तियों को #add।

अंत में, अपनी फ़ाइल को बंद करें और यह सुनिश्चित करने के लिए इसे खोलें कि सब कुछ सही तरीके से सहेजा गया है। यह आपके CSV से प्रत्येक चंक को अपनी मूल फ़ाइल में अपनी मूल फ़ाइल के रूप में अपनी फ़ाइल में विभाजित करना चाहिए, लेकिन .CSV के एक्सटेंशन के साथ।

stringio = io.stringio (myfile.read ())
लेखक = csv.writer (stringio)
लेखक = csv.writer (stringio, delimiter = ',
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) stringio = io.stringio (myfile.read ()) लेखक = csv.writer (stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) stringio = io.stringio (myfile.read ()) लेखक = csv.writer (stringio) लेखक = csv.writer (stringio, delimiter = ',’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

पायथन ने csv फ़ाइल को हिस्सा.py में विभाजित किया

पायथन का उपयोग करके सीएसवी को कैसे विभाजित करें? पायथन में एक सीएसवी को कैसे विभाजित करें? कई वर्कशीट में पायथन, डेटा साइंस, और एक्सेल फॉर्मूले, मैक्रोज़, और वीबीए टूल का उपयोग करके कॉलम हेडर के आधार पर एक सीएसवी या अल्पविराम-अलग किए गए मान (सीएसवी) को विभाजित करें। Tokenize () फ़ंक्शन आपको CSV स्ट्रिंग को अलग -अलग टोकन में विभाजित करने में मदद कर सकता है।

एक्सेल डेटा विश्लेषण के लिए सबसे अधिक उपयोग किए जाने वाले सॉफ़्टवेयर टूल में से एक है। यह बहुत सारी सुविधाओं के साथ आता है जो पायथन और अन्य प्रोग्रामिंग भाषाओं द्वारा समर्थित नहीं हैं। जैसा कि एक्सेल डेटा विश्लेषण के लिए सबसे अधिक उपयोग किए जाने वाले उपकरणों में से एक है, इसे पायथन के साथ एकीकृत करना महत्वपूर्ण है क्योंकि कुछ उपयोगकर्ता हो सकते हैं जो पायथन सहित किसी भी अन्य प्रोग्रामिंग भाषा की तुलना में एक्सेल से अधिक परिचित हैं।

इस ट्यूटोरियल में, आप सीखने जा रहे हैं कि पायथन में कई छोटी फ़ाइलों के रूप में CSV फ़ाइल को कैसे सहेजा जाए। आप एक फ़ाइल से कई नई फ़ाइलों में डेटा के अलग -अलग चंक्स के रूप में फ़ाइलों को सहेजने जा रहे हैं।

आप CSV फ़ाइलों को पढ़ने और लिखने के लिए CSV मॉड्यूल का उपयोग कर सकते हैं। आप स्ट्रिंग्स का भी उपयोग करेंगे जो एक्सेल फॉर्मूले और मैक्रोज़ का उपयोग करने की तुलना में पायथन को बहुत तेजी से और आसान बना देगा। CSV मॉड्यूल पायथन 2 और पायथन 3 संस्करण दोनों में उपलब्ध है।

पायथन के साथ CSV फ़ाइलों को कैसे विभाजित करें? पायथन में एक सीएसवी को कैसे विभाजित करें? कई वर्कशीट में पायथन, डेटा साइंस, और एक्सेल फॉर्मूले, मैक्रोज़, और वीबीए टूल का उपयोग करके कॉलम हेडर के आधार पर एक सीएसवी या अल्पविराम-अलग किए गए मान (सीएसवी) को विभाजित करें। Tokenize () फ़ंक्शन आपको CSV स्ट्रिंग को अलग -अलग टोकन में विभाजित करने में मदद कर सकता है।

पायथन3 विभाजित csv फ़ाइल हिस्सा.py में

આયાત સીએસવી માયફાઇલ = ખોલો ("list_of_ભાગ.csv", "r") રીડર = csv.reader (માયફાઇલ, સીમાંક = ",") જ્યારે સાચું: પંક્તિ = નેક્સ્ટ (રીડર) # ત્યાં સુધી સીએસવી ફાઇલમાંથી એક લાઇન વાંચતા રહે છે. વધુ લાઇનો નથી. સ્પ્લિટ = પંક્તિ.સ્પ્લિટ ("\ ટી") # દરેક પંક્તિને ટોકનાઇઝ () ફંક્શનનો ઉપયોગ કરીને ટોકન્સની સૂચિમાં વહેંચો. સ્પ્લિટ = ["", ","]. જોડાઓ (સ્પ્લિટ) # ટોકન્સની સૂચિના દરેક તત્વનો નાશ કરો અને તેને અંતે મૂકો
स्प्लिट में I के लिए: प्रिंट (i) # एक लाइन ब्रेक के साथ सूची से प्रत्येक प्रविष्टि को प्रिंट करें। myfile.close () # फ़ाइल को बंद करें ताकि इसे फिर से खोला जा सके

आप CSV मॉड्यूल का उपयोग करके CSV फ़ाइल को विभाजित कर सकते हैं, लेकिन पायथन 3 में उन्होंने एक सूची संग्रहीत करने के तरीके को बदल दिया। एक सूची एक सूची के बजाय पायथन 3 में एक वस्तु है यदि आप STR की तरह एक और डेटा प्रकार लेते हैं जहां आप इसे किसी ऑब्जेक्ट प्रकार में बदल सकते हैं। ऑब्जेक्ट्स के साथ काम करते समय आपके पास अप्रत्याशित व्यवहार हो सकता है क्योंकि स्ट्रिंग मान सभी कार्यों द्वारा स्वीकार नहीं किए जाते हैं।

निष्कर्ष

CSV फ़ाइल एक ऐसी फ़ाइल है जिसका मान अल्पविराम द्वारा अलग किया जाएगा। CSV प्रारूप को एक पाठ प्रारूप माना जाता है और इसका उद्देश्य सारणीबद्ध डेटा प्रदान करना है।

फ़ाइल प्रकार, जिसमें CSV एक्सटेंशन है, में ऐसी जानकारी होती है जिसे डेटाबेस में आयात किया जा सकता है, और एक समान पाठ फ़ाइल टेबल को व्यवस्थित करने के लिए आवश्यक डेटा ले जा सकती है।

यदि आपके पास एक CSV फ़ाइल है जिसे कई फ़ाइलों में विभाजित करने की आवश्यकता है, तो आप CSV मॉड्यूल का उपयोग कर सकते हैं। आप CSV मॉड्यूल का उपयोग करके फ़ाइल को पढ़ सकते हैं और लेखक मॉड्यूल का उपयोग करके इसे कई फ़ाइलों पर लिख सकते हैं।

आप अन्य प्रोग्रामिंग भाषाओं जैसे कि पर्ल, रूबी, जावा, जावास्क्रिप्ट या PHP का उपयोग करके CSV फ़ाइलों को भी पढ़ सकते हैं। CSV मॉड्यूल का उपयोग करें और अपने डेटा को संसाधित करने के लिए उन भाषाओं का उपयोग करें।





टिप्पणियाँ (0)

एक टिप्पणी छोड़ें