Hoe om CSV -lêer in stukke met Python te verdeel?

Hoe om CSV -lêer in stukke met Python te verdeel?


Python verdeel CSV -lêers in stukke

Python is 'n kragtige programmeringstaal wat vir baie verskillende doeleindes gebruik kan word. Een daarvan is om CSV -lêers in te voer en in stukke te verwerk.

Die doel van hierdie tutoriaal is om u te leer hoe om CSV -lêers in te voer en die Python Split -funksie daarop te gebruik. U sal leer hoe om dit met twee voorbeelde te gebruik: om 'n lêer in verskeie lêers te verdeel op grond van die eerste kolom en 'n lêer in arbitrêre stukke te verdeel.

As u nie vertroud is met wat data -wetenskap is nie, is dit die proses om kennis uit data te onttrek, sodat dit gebruik kan word om besluite oor toekomstige aksies te neem of te verfyn.

Hoe om python -programmeringstaal te gebruik om CSV -lêers in stukke te verdeel?

U kan lêers met die CSV -module verdeel. Hierdie module is versoenbaar met beide Python 2 en Python 3.

Python 3:

Maak 'n CSV -lêer in 'n Python -dop oop. U sal die CSV gebruik. Leser (lêer, delimiter =), gee dit dan aan CSV. Writer en u sal String in plaas van die lêer gebruik, want in Python 3 -snare is voorwerpe (dieselfde geheuestatus as lyste), sodat ons die manier waarop die data gestoor word (veranderingstipe) moet verander, wat tot onverwagte gedrag sal lei.

Maak 'n lêer in Python3 oop:

Python3 Split CSV -lêer in stukke.py

Hoe om CSV -lêers met Python te verdeel? Hoe om 'n CSV -lêer met Python te verdeel? Verdeel 'n tekslêer in verskeie kleiner lêers gebaseer op die eerste kolom in die tekslêer. Dit is 'n eenvoudige, maklike en kragtige manier om CSV -lêers te skep of CSV/komma -afgebakende lêers na ander te omskep.

Dit is hoe u u lêer invoer:

Voer CSV in

Nou gaan u die afbakening = argument in die lesersklas gebruik. Dit is 'n stel karakters wat die velde sal skei. In hierdie geval is dit 'n komma (,). Dus sal leser (lêer, delimiter = ', elke reël in verskeie dele verdeel op grond van die kolom.

leser = csv.reader (MyFile, delimiter = ',')

Die volgende ding om te doen is om die skrywersklas te gebruik om die data in 'n lêer te skryf. Skryf die data met behulp van die skrywersklas en gee dit aan 'n string -objek in plaas van die lêer, want snare is voorwerpe in Python 3 en u kan onverwagte gedrag hê sonder om die tipe te verander. Stel die modus -attribuut in 'sodat dit op hierdie lêer sal begin skryf.

skrywer = csv.writer (Stringio)

Die volgende stap is om die skrywersklas opdrag te gee om al die data in die lesersklas te gebruik om dit in die lêer te skryf. U sal deur die rye loop en elkeen in die lêer skryf. Die laaste stap is om skrywers te gebruik, wat 'n ry (een reël data) in 'n lêer met die skrywer sal skryf. skrywers (ry).

Vir ek, ry in die leser: #hierdie lus gaan deur elke ry van die leser en skryf elke reël in 'n lêer. rye.Anpend (ry)
Skrywers (ry) #Add 'n ry aan die einde van die lêer.
Skrywers (rye) #add al die rye tegelyk.

Sluit uiteindelik u lêer en maak dit oop om seker te maak dat alles korrek gestoor is. Daar moet elke deel van u CSV in sy eie lêer verdeel word met dieselfde naam as u oorspronklike lêer, maar met 'n uitbreiding van .CSV.

Stringio = io.Stringio (MyFile.read ())
skrywer = csv.writer (Stringio)
skrywer = csv.writer (Stringio, delimiter = ',
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) Stringio = io.Stringio (MyFile.read ()) skrywer = csv.writer (Stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) Stringio = io.Stringio (MyFile.read ()) skrywer = csv.writer (Stringio) skrywer = csv.writer (Stringio, delimiter = ',’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

Python Split CSV -lêer in stukke.py

Hoe om 'n CSV met behulp van Python te verdeel? Hoe om 'n CSV in Python te verdeel? Verdeel 'n CSV- of komma-geskeide waardes (CSV) gebaseer op kolomopskrifte met behulp van Python-, Data Science- en Excel-formules, makro's en VBA-instrumente oor verskeie werkkaarte. Die tokenize () -funksie kan u help om 'n CSV -string in aparte tokens te verdeel.

Excel is een van die mees gebruikte sagteware -instrumente vir data -analise. Dit bevat baie funksies wat nie deur Python en ander programmeertale ondersteun word nie. Aangesien Excel een van die mees gebruikte instrumente is vir data -analise, is dit belangrik om dit met Python te integreer, aangesien daar sommige gebruikers kan wees wat meer vertroud is met Excel as met enige ander programmeringstaal, insluitend Python.

In hierdie tutoriaal gaan u leer hoe om 'n CSV -lêer te stoor as verskeie klein lêers in Python. U gaan die lêers as afsonderlike stukke data van een lêer in verskeie nuwe lêers stoor.

U kan die CSV -module gebruik om CSV -lêers te lees en te skryf. U sal ook snare gebruik wat die gebruik van Python baie vinniger en makliker sal maak as om Excel -formules en makro's te gebruik. Die CSV -module is beskikbaar in beide Python 2- en Python 3 -weergawes.

Hoe om CSV -lêers met Python te verdeel? Hoe om 'n CSV in Python te verdeel? Verdeel 'n CSV- of komma-geskeide waardes (CSV) gebaseer op kolomopskrifte met behulp van Python-, Data Science- en Excel-formules, makro's en VBA-instrumente oor verskeie werkkaarte. Die tokenize () -funksie kan u help om 'n CSV -string in aparte tokens te verdeel.

Python3 Split CSV -lêer in stukke.py

invoer csv myfile = open ("list_of_stukke.csv", "r") leser = csv.reader (MyFile, delimiter = ",") terwyl waar: ry = volgende (leser) # lees steeds 'n reël uit die CSV -lêer tot daar is nie meer lyne nie. split = row.split ("\ t") # verdeel elke ry in 'n lys tokens deur die tokenize () -funksie te gebruik. split = ["", ","]. Sluit aan (split) # vernietig elke element van die lys tekens en plaas dit aan die einde
Vir ek in split: druk (i) # druk elke inskrywing uit die lys met 'n lynbreuk. MyFile.close () # Maak die lêer toe sodat dit weer oopgemaak kan word

U kan 'n CSV -lêer met behulp van die CSV -module verdeel, maar in Python 3 het hulle die manier waarop 'n lys gestoor is, verander. 'N Lys is 'n voorwerp in Python 3 in plaas van 'n lys as u 'n ander datatipe soos STR neem, waar u dit na 'n objektipe kan verander. U kan onverwagte gedrag hê as u met voorwerpe werk, aangesien stringwaardes nie deur alle funksies aanvaar word nie.

AFSLUITING

'N CSV -lêer is 'n lêer waarvan die waardes deur kommas geskei sal word. Die CSV -formaat word as 'n teksformaat beskou en is bedoel om tabeldata te verskaf.

Die lêertipe, wat die CSV -uitbreiding het, bevat inligting wat in 'n databasis ingevoer kan word, en 'n soortgelyke tekslêer kan die data bevat wat nodig is om tabelle te organiseer.

As u 'n CSV -lêer het wat in verskeie lêers verdeel moet word, kan u die CSV -module gebruik. U kan die lêer met die CSV -module lees en dit met die skrywersmodule op verskeie lêers skryf.

U kan ook CSV -lêers lees met behulp van ander programmeertale soos Perl, Ruby, Java, JavaScript of PHP. Gebruik die CSV -module en gebruik daardie tale om u data te verwerk.





kommentaar (0)

Los kommentaar