சி.எஸ்.வி கோப்பை பைத்தானுடன் துண்டுகளாக பிரிப்பது எப்படி?

சி.எஸ்.வி கோப்பை பைத்தானுடன் துண்டுகளாக பிரிப்பது எப்படி?

பைதான் சி.எஸ்.வி கோப்புகளை துண்டுகளாக பிரித்தது

பைதான் ஒரு சக்திவாய்ந்த நிரலாக்க மொழியாகும், இது பல வேறுபட்ட நோக்கங்களுக்காக பயன்படுத்தப்படலாம். அவற்றில் ஒன்று சி.எஸ்.வி கோப்புகளை இறக்குமதி செய்து அவற்றை துகள்களாக செயலாக்குவது.

இந்த டுடோரியலின் குறிக்கோள், சி.எஸ்.வி கோப்புகளை எவ்வாறு இறக்குமதி செய்வது மற்றும் அவற்றில் பைதான் பிளவு செயல்பாட்டைப் பயன்படுத்துவது என்பதை உங்களுக்குக் கற்பிப்பதாகும். இரண்டு எடுத்துக்காட்டுகளுடன் இதை எவ்வாறு பயன்படுத்துவது என்பதை நீங்கள் கற்றுக் கொள்வீர்கள்: முதல் நெடுவரிசையின் அடிப்படையில் ஒரு கோப்பை பல கோப்புகளாகப் பிரித்து, ஒரு கோப்பை தன்னிச்சையான துகள்களாக பிரித்தல்.

தரவு அறிவியல் என்றால் என்ன என்பதை நீங்கள் அறிந்திருக்கவில்லை என்றால், இது தரவிலிருந்து அறிவைப் பிரித்தெடுக்கும் செயல்முறையாகும், இதனால் எதிர்கால செயல்களைப் பற்றிய முடிவுகளை எடுக்க அல்லது சுத்திகரிப்பதில் பயன்படுத்தப்படலாம்.

சி.எஸ்.வி கோப்புகளை துண்டுகளாகப் பிரிக்க பைதான் நிரலாக்க மொழியை எவ்வாறு பயன்படுத்துவது?

நீங்கள் CSV தொகுதியுடன் கோப்புகளைப் பிரிக்கலாம். இந்த தொகுதி பைதான் 2 மற்றும் பைதான் 3 இரண்டுடனும் இணக்கமானது.

பைதான் 3:

பைதான் ஷெல்லில் ஒரு சி.எஸ்.வி கோப்பைத் திறக்கவும். நீங்கள் CSV ஐப் பயன்படுத்துவீர்கள். வாசகர் (கோப்பு, டிலிமிட்டர் =), பின்னர் அதை CSV க்கு அனுப்பவும். எழுத்தாளரும் நீங்களும் கோப்பிற்கு பதிலாக சரம் பயன்படுத்துவீர்கள், ஏனெனில் பைதான் 3 சரங்கள் பொருள்கள் (பட்டியல்களின் அதே நினைவக நிலை) எனவே தரவு சேமிக்கப்படும் முறையை (வகை மாற்ற வகை) மாற்ற வேண்டியிருக்கும், இது எதிர்பாராத நடத்தை விளைவிக்கும்.

பைதான் 3 இல் ஒரு கோப்பைத் திறக்கவும்:

பைதான் 3 சி.எஸ்.வி கோப்பை sunks.py ஆக பிரிக்கவும்

சி.எஸ்.வி கோப்புகளை பைத்தானுடன் பிரிப்பது எப்படி? ஒரு CSV கோப்பை பைத்தானுடன் பிரிப்பது எப்படி? உரை கோப்பில் முதல் நெடுவரிசையின் அடிப்படையில் ஒரு உரை கோப்பை பல சிறிய கோப்புகளாக பிரிக்கிறது. சி.எஸ்.வி கோப்புகளை உருவாக்க அல்லது சி.எஸ்.வி/கமா பிரிக்கப்பட்ட கோப்புகளை மற்றவர்களுக்கு மாற்ற இது ஒரு எளிய, எளிதான மற்றும் சக்திவாய்ந்த வழியாகும்.

உங்கள் கோப்பை இப்படித்தான் இறக்குமதி செய்கிறீர்கள்:

சி.எஸ்.வி இறக்குமதி

இப்போது நீங்கள் டிலிமிட்டர் = வாதத்தை வாசகர் வகுப்பிற்கு பயன்படுத்தப் போகிறீர்கள். இது புலங்களை பிரிக்கும் எழுத்துக்களின் தொகுப்பாகும். இந்த வழக்கில், இது ஒரு கமா (,). எனவே வாசகர் (கோப்பு, டிலிமிட்டர் = ’, ஒவ்வொரு வரியையும் அந்த நெடுவரிசையின் அடிப்படையில் பல பகுதிகளாகப் பிரிக்கும்.

வாசகர் = csv.reader (myfile, delimiter = ’,’)

அடுத்த விஷயம் என்னவென்றால், தரவை ஒரு கோப்பில் எழுத எழுத்தாளர் வகுப்பைப் பயன்படுத்துவது. எழுத்தாளர் வகுப்பைப் பயன்படுத்தி தரவை எழுதி, கோப்புக்கு பதிலாக ஒரு சரம் பொருளுக்கு அனுப்பவும், ஏனெனில் சரங்கள் பைதான் 3 இல் உள்ள பொருள்கள் மற்றும் வகையை மாற்றாமல் உங்களுக்கு எதிர்பாராத நடத்தை இருக்கலாம். இந்த கோப்பில் எழுதத் தொடங்கும் வகையில் அதன் பயன்முறை பண்புகளை ’என அமைக்கவும்.

எழுத்தாளர் = csv.writer (stringio)

அடுத்த கட்டம், வாசகர் வகுப்பில் உள்ள எல்லா தரவையும் கோப்பில் எழுத எழுத்தாளர் வகுப்பிற்கு அறிவுறுத்துவதாகும். நீங்கள் வரிசைகள் வழியாக சுழன்று கோப்பில் ஒவ்வொன்றையும் எழுதுவீர்கள். கடைசி கட்டம் எழுத்தாளர்களைப் பயன்படுத்தி ஒரு வரிசையை (தரவு ஒரு வரி) எழுதும் எழுத்தாளர்களைப் பயன்படுத்துவது. எழுத்தாளர்கள் (வரிசை).

நான், வாசகரில் வரிசை: #இந்த வளையம் ஒவ்வொரு வரிசையிலும் வாசகரிடமிருந்து சென்று ஒவ்வொரு வரியையும் ஒரு கோப்பில் எழுதுகிறது. rows.append (வரிசை)
எழுத்தாளர்கள் (வரிசை) #கோப்பின் முடிவில் ஒரு வரிசையை சேர்க்கவும்.
எழுத்தாளர்கள் (வரிசைகள்) #ஒரே நேரத்தில் அனைத்து வரிசைகளையும் சேர்க்கவும்.

இறுதியாக, உங்கள் கோப்பை மூடி, எல்லாம் சரியாக சேமிக்கப்பட்டுள்ளதா என்பதை உறுதிப்படுத்த அதைத் திறக்கவும். உங்கள் சி.எஸ்.வி யிலிருந்து ஒவ்வொரு பகுதியும் உங்கள் அசல் கோப்பின் அதே பெயருடன் அதன் சொந்த கோப்பில் பிரிக்கப்பட்டிருக்க வேண்டும், ஆனால் .csv இன் நீட்டிப்புடன்.

stringio = io.stringio (myfile.read ())
எழுத்தாளர் = csv.writer (stringio)
எழுத்தாளர் = csv.writer (stringio, delimiter = ’,
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) stringio = io.stringio (myfile.read ()) எழுத்தாளர் = csv.writer (stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) stringio = io.stringio (myfile.read ()) எழுத்தாளர் = csv.writer (stringio) எழுத்தாளர் = csv.writer (stringio, delimiter = ’,’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

பைதான் சி.எஸ்.வி கோப்பை chanks.py ஆக பிரிக்கிறது

பைத்தானைப் பயன்படுத்தி ஒரு சி.எஸ்.வி. பைத்தானில் ஒரு சி.எஸ்.வி. மலைப்பாம்பு, தரவு அறிவியல் மற்றும் எக்செல் சூத்திரங்கள், மேக்ரோக்கள் மற்றும் விபிஏ கருவிகளைப் பயன்படுத்தி பல பணித்தாள்களில் நெடுவரிசை தலைப்புகளின் அடிப்படையில் ஒரு சி.எஸ்.வி அல்லது கமாவால் பிரிக்கப்பட்ட மதிப்புகள் (சி.எஸ்.வி) பிரிக்கவும். டோக்கனைஸ் () செயல்பாடு ஒரு சி.எஸ்.வி சரத்தை தனி டோக்கன்களாகப் பிரிக்க உதவும்.

தரவு பகுப்பாய்விற்கான மிகவும் பயன்படுத்தப்படும் மென்பொருள் கருவிகளில் எக்செல் ஒன்றாகும். இது பைதான் மற்றும் பிற நிரலாக்க மொழிகளால் ஆதரிக்கப்படாத நிறைய அம்சங்களுடன் வருகிறது. தரவு பகுப்பாய்விற்கு எக்செல் மிகவும் பயன்படுத்தப்படும் கருவிகளில் ஒன்றாகும் என்பதால், அதை பைத்தானுடன் ஒருங்கிணைப்பது முக்கியம், ஏனெனில் பைத்தான் உட்பட வேறு எந்த நிரலாக்க மொழியையும் விட எக்செல் உடன் அதிகம் தெரிந்த சில பயனர்கள் இருக்கலாம்.

இந்த டுடோரியலில், பைத்தானில் பல சிறிய கோப்புகளாக ஒரு சி.எஸ்.வி கோப்பை எவ்வாறு சேமிப்பது என்பதை நீங்கள் கற்றுக் கொள்ளப் போகிறீர்கள். ஒரு கோப்பிலிருந்து ஒரு கோப்பின் தனித்தனி பகுதிகளாக கோப்புகளை பல புதிய கோப்புகளாக சேமிக்கப் போகிறீர்கள்.

CSV கோப்புகளைப் படிக்கவும் எழுதவும் CSV தொகுதியைப் பயன்படுத்தலாம். எக்செல் ஃபார்முலாக்கள் மற்றும் மேக்ரோக்களைப் பயன்படுத்துவதை விட பைத்தானைப் பயன்படுத்துவதை மிக விரைவாகவும் எளிதாகவும் செய்யும் சரங்களையும் நீங்கள் பயன்படுத்துவீர்கள். சி.எஸ்.வி தொகுதி பைதான் 2 மற்றும் பைதான் 3 பதிப்புகள் இரண்டிலும் கிடைக்கிறது.

சி.எஸ்.வி கோப்புகளை பைத்தானுடன் பிரிப்பது எப்படி? பைத்தானில் ஒரு சி.எஸ்.வி. மலைப்பாம்பு, தரவு அறிவியல் மற்றும் எக்செல் சூத்திரங்கள், மேக்ரோக்கள் மற்றும் விபிஏ கருவிகளைப் பயன்படுத்தி பல பணித்தாள்களில் நெடுவரிசை தலைப்புகளின் அடிப்படையில் ஒரு சி.எஸ்.வி அல்லது கமாவால் பிரிக்கப்பட்ட மதிப்புகள் (சி.எஸ்.வி) பிரிக்கவும். டோக்கனைஸ் () செயல்பாடு ஒரு சி.எஸ்.வி சரத்தை தனி டோக்கன்களாகப் பிரிக்க உதவும்.

பைதான் 3 சி.எஸ்.வி கோப்பை sunks.py ஆக பிரிக்கவும்

import csv myfile = open ("list_of_bitar.csv", "r") läsare = csv.reader (myfile, delimiter = ",") medan sant: rad = nästa (läsare) # fortsätter att läsa en rad från CSV -filen tills det är där där där tills det där där är inga fler linjer. split = row.Split ("\ t") # Dela upp varje rad i en lista med tokens med hjälp av tokenize () -funktionen. split = ["", ","]. Gå med (split) # förstöra varje element i listan över tokens och lägg dem i slutet
நான் பிளவு: அச்சிடு (i) # பட்டியலிலிருந்து ஒவ்வொரு உள்ளீட்டையும் ஒரு வரி இடைவெளியுடன் அச்சிடுக. myfile.close () # கோப்பை மீண்டும் திறக்கும்படி மூடு

நீங்கள் CSV தொகுதியைப் பயன்படுத்தி ஒரு CSV கோப்பைப் பிரிக்கலாம், ஆனால் பைதான் 3 இல் அவை ஒரு பட்டியல் சேமிக்கப்படும் முறையை மாற்றின. ஒரு பட்டியல் ஒரு பட்டியலுக்கு பதிலாக பைதான் 3 இல் உள்ள ஒரு பொருளாகும், நீங்கள் STR போன்ற மற்றொரு தரவு வகையை எடுத்துக் கொண்டால், அதை ஒரு பொருள் வகையாக மாற்றலாம். அனைத்து செயல்பாடுகளாலும் சரம் மதிப்புகள் ஏற்றுக்கொள்ளப்படாததால், பொருள்களுடன் பணிபுரியும் போது உங்களுக்கு எதிர்பாராத நடத்தை இருக்கலாம்.

முடிவுரை

ஒரு CSV கோப்பு என்பது ஒரு கோப்பாகும், அதன் மதிப்புகள் காற்புள்ளிகளால் பிரிக்கப்படும். CSV வடிவம் ஒரு உரை வடிவமாகக் கருதப்படுகிறது மற்றும் அட்டவணை தரவை வழங்கும் நோக்கம் கொண்டது.

சி.எஸ்.வி நீட்டிப்பைக் கொண்ட கோப்பு வகை, தரவுத்தளத்தில் இறக்குமதி செய்யக்கூடிய தகவல்களைக் கொண்டுள்ளது, மேலும் இதேபோன்ற உரை கோப்பு அட்டவணைகளை ஒழுங்கமைக்கத் தேவையான தரவை எடுத்துச் செல்ல முடியும்.

உங்களிடம் ஒரு CSV கோப்பு இருந்தால், அது பல கோப்புகளாகப் பிரிக்கப்பட வேண்டும், நீங்கள் CSV தொகுதியைப் பயன்படுத்தலாம். நீங்கள் CSV தொகுதியைப் பயன்படுத்தி கோப்பைப் படித்து எழுத்தாளர் தொகுதியைப் பயன்படுத்தி பல கோப்புகளுக்கு எழுதலாம்.

பெர்ல், ரூபி, ஜாவா, ஜாவாஸ்கிரிப்ட் அல்லது பி.எச்.பி போன்ற பிற நிரலாக்க மொழிகளைப் பயன்படுத்தி சி.எஸ்.வி கோப்புகளையும் நீங்கள் படிக்கலாம். CSV தொகுதியைப் பயன்படுத்தவும், உங்கள் தரவை செயலாக்க அந்த மொழிகளைப் பயன்படுத்தவும்.





கருத்துக்கள் (0)

கருத்துரையிடுக