पायथनसह सीएसव्ही फाईलला भागांमध्ये कसे विभाजित करावे?

पायथनसह सीएसव्ही फाईलला भागांमध्ये कसे विभाजित करावे?


पायथन स्प्लिट सीएसव्ही फायलींमध्ये भागांमध्ये

पायथन ही एक शक्तिशाली प्रोग्रामिंग भाषा आहे जी बर्‍याच वेगवेगळ्या हेतूंसाठी वापरली जाऊ शकते. त्यापैकी एक म्हणजे सीएसव्ही फायली आयात करणे आणि त्या भागांमध्ये प्रक्रिया करणे.

या ट्यूटोरियलचे ध्येय आपल्याला सीएसव्ही फायली कशा आयात कराव्यात आणि त्यांच्यावर पायथन स्प्लिट फंक्शन कसे वापरावे हे शिकविणे हे आहे. आपण दोन उदाहरणांसह ते कसे वापरावे हे शिकालः पहिल्या स्तंभाच्या आधारे एकाधिक फायलींमध्ये फाइल विभाजित करणे आणि फाइल अनियंत्रित भागांमध्ये विभाजित करणे.

आपण डेटा विज्ञान काय आहे याबद्दल परिचित नसल्यास, डेटामधून ज्ञान काढण्याची ही प्रक्रिया आहे जेणेकरून भविष्यातील क्रियांविषयी निर्णय घेण्यात किंवा परिष्कृत करण्यासाठी त्याचा वापर केला जाऊ शकतो.

सीएसव्ही फायलींना भागांमध्ये विभाजित करण्यासाठी पायथन प्रोग्रामिंग भाषा कशी वापरावी?

आपण सीएसव्ही मॉड्यूलसह ​​फायली विभाजित करू शकता. हे मॉड्यूल पायथन 2 आणि पायथन 3 दोन्हीसह सुसंगत आहे.

पायथन 3:

पायथन शेलमध्ये सीएसव्ही फाइल उघडा. आपण सीएसव्ही वापराल. वाचक (फाईल, डिलिमीटर =), नंतर ते सीएसव्ही वर द्या. लेखक आणि आपण फाईलऐवजी स्ट्रिंग वापराल कारण पायथन 3 स्ट्रिंग्स ऑब्जेक्ट्स आहेत (याद्यांप्रमाणेच मेमरी स्थिती) म्हणून आम्हाला डेटा संग्रहित करण्याचा मार्ग बदलावा लागेल (बदल प्रकार) ज्याचा परिणाम अनपेक्षित वर्तन होईल.

पायथन 3 मध्ये एक फाईल उघडा:

पायथन 3 स्प्लिट सीएसव्ही फाईलमध्ये चंक्स.पी

पायथनसह सीएसव्ही फायली कशा विभाजित करायच्या? पायथनसह सीएसव्ही फाइल कसे विभाजित करावे? मजकूर फाईलमधील पहिल्या स्तंभावर आधारित एकाधिक लहान फायलींमध्ये मजकूर फाइल विभाजित करते. सीएसव्ही फायली तयार करण्याचा किंवा सीएसव्ही/स्वल्पविरामाने फाइल्स इतरांमध्ये रूपांतरित करण्याचा हा एक सोपा, सोपा आणि शक्तिशाली मार्ग आहे.

आपण आपली फाईल अशाप्रकारे आयात करता:

आयात सीएसव्ही

आता आपण वाचक वर्गासाठी डिलिमीटर = युक्तिवाद वापरणार आहात. हे वर्णांचा एक संच आहे जो फील्ड वेगळे करेल. या प्रकरणात, तो एक स्वल्पविराम आहे (,). तर वाचक (फाईल, डिलिमीटर = ’, त्या स्तंभाच्या आधारे प्रत्येक ओळ एकाधिक भागांमध्ये विभाजित करेल.

वाचक = csv.reader (मायफाइल, डिलिमीटर = ’,’)

पुढील गोष्ट म्हणजे फाईलमध्ये डेटा लिहिण्यासाठी लेखक वर्गाचा वापर करणे. लेखक वर्गाचा वापर करून डेटा लिहा आणि त्यास फाईलऐवजी स्ट्रिंग ऑब्जेक्टवर पास करा कारण पायथन 3 मधील स्ट्रिंग्स ऑब्जेक्ट्स आहेत आणि प्रकार बदलल्याशिवाय आपल्याकडे अनपेक्षित वर्तन असू शकते. त्याचे मोड विशेषता ’म्हणून सेट करा जेणेकरून ते या फाईलवर लिहायला प्रारंभ करेल.

लेखक = सीएसव्ही.राइटर (स्ट्रिंगिओ)

पुढील चरण म्हणजे लेखक वर्गाला वाचक वर्गातील सर्व डेटा फाईलमध्ये लिहिण्यासाठी वापरण्यासाठी सूचना देणे. आपण पंक्तींमधून पळवाट आणि फाईलमध्ये प्रत्येकाला लिहाल. शेवटची पायरी म्हणजे लेखकांचा वापर करणे, जे लेखकांचा वापर करून फाईलमध्ये एक पंक्ती (डेटाची एक ओळ) लिहितो. लेखक (पंक्ती)

मी, वाचकात पंक्ती: #हा लूप वाचकांकडून प्रत्येक पंक्तीतून जातो आणि प्रत्येक ओळ फाईलमध्ये लिहितो. पंक्ती.अॅपेन्ड (पंक्ती)
लेखक (पंक्ती) #फाईलच्या शेवटी एक पंक्ती जोडा.
लेखक (पंक्ती) #सर्व पंक्ती एकाच वेळी जोडा.

शेवटी, आपली फाईल बंद करा आणि सर्वकाही योग्य प्रकारे जतन केले आहे हे सुनिश्चित करण्यासाठी ती उघडा. आपल्या सीएसव्हीमधील प्रत्येक भाग आपल्या मूळ फाईलच्या समान नावाने त्याच्या स्वत: च्या फाईलमध्ये विभाजित असावा, परंतु .csv च्या विस्तारासह.

स्ट्रिंगिओ = io.stringio (myfile.read ())
लेखक = सीएसव्ही.राइटर (स्ट्रिंगिओ)
लेखक = सीएसव्ही.राइटर (स्ट्रिंगिओ, डिलिमिटर = ’,
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) स्ट्रिंगिओ = io.stringio (myfile.read ()) लेखक = सीएसव्ही.राइटर (स्ट्रिंगिओ) writer = csv.writer(stringIO, delimiter=’) writerow(row) स्ट्रिंगिओ = io.stringio (myfile.read ()) लेखक = सीएसव्ही.राइटर (स्ट्रिंगिओ) लेखक = सीएसव्ही.राइटर (स्ट्रिंगिओ, डिलिमिटर = ’,’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

पायथन स्प्लिट सीएसव्ही फाईलमध्ये चंक्स.पी

पायथनचा वापर करून सीएसव्हीचे विभाजन कसे करावे? पायथनमध्ये सीएसव्हीचे विभाजन कसे करावे? पायथन, डेटा सायन्स आणि एक्सेल सूत्रे, मॅक्रो आणि व्हीबीए साधनांचा वापर करून स्तंभ शीर्षलेखांवर आधारित सीएसव्ही किंवा स्वल्पविराम-विभाजित मूल्ये (सीएसव्ही) विभाजित करा. टोकनिझ () फंक्शन आपल्याला सीएसव्ही स्ट्रिंगला वेगळ्या टोकनमध्ये विभाजित करण्यात मदत करू शकते.

डेटा विश्लेषणासाठी एक्सेल हे सर्वाधिक वापरल्या जाणार्‍या सॉफ्टवेअर साधनांपैकी एक आहे. हे बर्‍याच वैशिष्ट्यांसह येते जे पायथन आणि इतर प्रोग्रामिंग भाषांद्वारे समर्थित नाहीत. एक्सेल हे डेटा विश्लेषणासाठी सर्वात वापरल्या जाणार्‍या साधनांपैकी एक आहे, पायथनसह त्यास समाकलित करणे महत्वाचे आहे कारण पायथनसह इतर कोणत्याही प्रोग्रामिंग भाषेपेक्षा एक्सेलशी अधिक परिचित असलेले काही वापरकर्ते असू शकतात.

या ट्यूटोरियलमध्ये, आपण पायथनमध्ये एकाधिक लहान फायली म्हणून सीएसव्ही फाईल कशी जतन करावी हे शिकत आहात. आपण एका फाईलमधील डेटाचे स्वतंत्र भाग म्हणून फायली एकाधिक नवीन फायलींमध्ये जतन करणार आहात.

आपण सीएसव्ही फायली वाचण्यासाठी आणि लिहिण्यासाठी सीएसव्ही मॉड्यूल वापरू शकता. आपण स्ट्रिंग्स देखील वापराल जे एक्सेल फॉर्म्युला आणि मॅक्रो वापरण्यापेक्षा पायथनचा वापर अधिक वेगवान आणि सुलभ करेल. सीएसव्ही मॉड्यूल पायथन 2 आणि पायथन 3 दोन्ही आवृत्त्यांमध्ये उपलब्ध आहे.

पायथनसह सीएसव्ही फायली कशा विभाजित करायच्या? पायथनमध्ये सीएसव्हीचे विभाजन कसे करावे? पायथन, डेटा सायन्स आणि एक्सेल सूत्रे, मॅक्रो आणि व्हीबीए साधनांचा वापर करून स्तंभ शीर्षलेखांवर आधारित सीएसव्ही किंवा स्वल्पविराम-विभाजित मूल्ये (सीएसव्ही) विभाजित करा. टोकनिझ () फंक्शन आपल्याला सीएसव्ही स्ट्रिंगला वेगळ्या टोकनमध्ये विभाजित करण्यात मदत करू शकते.

पायथन 3 स्प्लिट सीएसव्ही फाईलमध्ये चंक्स.पी

CSV Myfile = തുറക്കുക ("List_of_chuncs.csv", "R") റീഡർ = csv.reader (myfile, delimiter = ",") ശരിയായിരിക്കുമ്പോൾ: Resv = അടുത്തത് (റീഡർ) # സിഎസ്വി ഫയലിൽ നിന്ന് ഒരു വരി വായിക്കുന്നു കൂടുതൽ വരികളൊന്നുമില്ല. സ്പ്ലിറ്റ് = വരി. ഡിസ്പ്ലിറ്റ് ("\ t") ടോക്കണീസ് () ഫംഗ്ഷൻ ഉപയോഗിച്ച് ഓരോ വരിയും ടോക്കണുകളുടെ ഒരു ലിസ്റ്റിലേക്ക് വിഭജിക്കുക. സ്പ്ലിറ്റ് = ["", ",", "]. ചേരുക (സ്പ്ലിറ്റ്) # ടോക്കണുകളുടെ പട്ടികയുടെ ഓരോ ഘടകവും നശിപ്പിക്കുകയും അവസാനം ഇടുകയും ചെയ്യുക
मी स्प्लिटमध्ये: प्रिंट (i) # लाइन ब्रेकसह सूचीमधून प्रत्येक प्रविष्टी मुद्रित करा. मायफाइल.क्लोज () # फाईल बंद करा जेणेकरून ती पुन्हा उघडली जाऊ शकेल

आपण सीएसव्ही मॉड्यूलचा वापर करून सीएसव्ही फाइल विभाजित करू शकता परंतु पायथन 3 मध्ये त्यांनी यादी संग्रहित करण्याचा मार्ग बदलला. सूचीऐवजी पायथन 3 मधील एक ऑब्जेक्ट आहे जर आपण एसटीआर सारखा दुसरा डेटा प्रकार घेतला असेल जेथे आपण त्यास ऑब्जेक्ट प्रकारात बदलू शकता. ऑब्जेक्ट्ससह कार्य करताना आपल्यास अनपेक्षित वर्तन असू शकते कारण स्ट्रिंग व्हॅल्यूज सर्व फंक्शन्सद्वारे स्वीकारले जात नाहीत.

निष्कर्ष

सीएसव्ही फाईल ही एक फाईल आहे ज्याची मूल्ये स्वल्पविरामाने विभक्त केली जातील. सीएसव्ही स्वरूपन एक मजकूर स्वरूप मानले जाते आणि ते सारणीदार डेटा प्रदान करण्याच्या उद्देशाने आहे.

सीएसव्ही विस्तार असलेल्या फाईल प्रकारात डेटाबेसमध्ये आयात करता येणारी माहिती आहे आणि समान मजकूर फाईल सारण्या आयोजित करण्यासाठी आवश्यक डेटा ठेवू शकते.

आपल्याकडे सीएसव्ही फाइल असल्यास जी एकाधिक फायलींमध्ये विभाजित करणे आवश्यक आहे, आपण सीएसव्ही मॉड्यूल वापरू शकता. आपण सीएसव्ही मॉड्यूल वापरुन फाइल वाचू शकता आणि लेखक मॉड्यूलचा वापर करून एकाधिक फायलींवर लिहू शकता.

आपण पीआरएल, रुबी, जावा, जावास्क्रिप्ट किंवा पीएचपी सारख्या इतर प्रोग्रामिंग भाषांचा वापर करून सीएसव्ही फायली देखील वाचू शकता. सीएसव्ही मॉड्यूल वापरा आणि आपल्या डेटावर प्रक्रिया करण्यासाठी त्या भाषांचा वापर करा.





टिप्पण्या (0)

एक टिप्पणी द्या