Cum să împărțiți fișierul CSV în bucăți cu Python?

Cum să împărțiți fișierul CSV în bucăți cu Python?


Python a împărțit fișierele CSV în bucăți

Python este un limbaj de programare puternic care poate fi utilizat în mai multe scopuri diferite. Unul dintre ei este importarea fișierelor CSV și le prelucrează în bucăți.

Scopul acestui tutorial este de a vă învăța cum să importați fișierele CSV și să utilizați funcția de împărțire Python pe ele. Veți învăța cum să -l utilizați cu două exemple: împărțirea unui fișier în mai multe fișiere bazate pe prima coloană și împărțirea unui fișier în bucăți arbitrare.

Dacă nu sunteți familiarizat cu ceea ce este știința datelor, este procesul de extragere a cunoștințelor din date, astfel încât să poată fi utilizat în luarea sau rafinarea deciziilor despre acțiunile viitoare.

Cum se folosește limbajul de programare Python pentru a împărți fișierele CSV în bucăți?

Puteți împărți fișiere cu modulul CSV. Acest modul este compatibil atât cu Python 2 cât și cu Python 3.

Python 3:

Deschideți un fișier CSV într -o coajă Python. Veți utiliza CSV. cititor (fișier, delimiter =), apoi treceți -l la CSV. Scriitor și veți folosi String în loc de fișier, deoarece în Python 3 Strings sunt obiecte (aceeași stare de memorie ca listele), astfel încât ar trebui să schimbăm modul în care datele sunt stocate (tip de schimbare), ceea ce ar duce la un comportament neașteptat.

Deschideți un fișier în Python3:

Python3 Split CSV File în chunks.py

Cum să împărțiți fișierele CSV cu Python? Cum să împărțiți un fișier CSV cu Python? Împarte un fișier text în mai multe fișiere mai mici pe baza primei coloane din fișierul text. Este o modalitate simplă, ușoară și puternică de a crea fișiere CSV sau de a converti fișierele delimitate CSV/Comma în altele.

Acesta este modul în care vă importați fișierul:

Import CSV

Acum veți folosi argumentul delimiter = la clasa cititorului. Este un set de personaje care vor separa câmpurile. În acest caz, este o virgulă (,). Deci Reader (File, Delimiter = ”, va împărți fiecare linie în mai multe părți pe baza coloanei respective.

cititor = csv.reader (myfile, delimiter = ",")

Următorul lucru de făcut este să folosiți clasa Writer pentru a scrie datele într -un fișier. Scrieți datele folosind clasa Writer și treceți -le la un obiect String în loc de fișier, deoarece șirurile sunt obiecte din Python 3 și s -ar putea să aveți un comportament neașteptat fără a schimba tipul. Setați atributul de mod ca „astfel încât să înceapă să scrie pe acest fișier.

Writer = CSV.Writer (Stringio)

Următorul pas este să instruiți clasa Writer să utilizeze toate datele din clasa de cititori pentru a le scrie în fișier. Veți bucura prin rânduri și veți scrie fiecare în fișier. Ultimul pas este să folosiți scriitori, care vor scrie un rând (o linie de date) într -un fișier folosind scriitorul. Scriitori (rând).

Pentru I, rând în cititor: #Această buclă trece prin fiecare rând de la cititor și scrie fiecare linie într -un fișier. rânduri.Append (rând)
Scriitori (rând) #ADD un rând la sfârșitul fișierului.
Scriitori (rânduri) #ADD toate rândurile simultan.

În cele din urmă, închideți fișierul și deschideți -l pentru a vă asigura că totul este salvat corect. Ar trebui să aibă fiecare bucată din CSV împărțită în propriul fișier cu același nume ca fișierul dvs. original, dar cu o extensie de .csv.

STRingio = io.stringio (myfile.read ())
Writer = CSV.Writer (Stringio)
Writer = csv.writer (Stringio, delimiter = ",
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) STRingio = io.stringio (myfile.read ()) Writer = CSV.Writer (Stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) STRingio = io.stringio (myfile.read ()) Writer = CSV.Writer (Stringio) Writer = csv.writer (Stringio, delimiter = ",’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

Piton a împărțit fișierul CSV în bucăți.py

Cum să împărțiți un CSV folosind Piton? Cum să împărțiți un CSV în Piton? Împărțiți un CSV sau valorile separate de virgulă (CSV) pe baza anteturilor de coloană folosind Piton, Data Science și Excel Formule, Macros și instrumente VBA pe mai multe foi de lucru. Funcția Tokenize () vă poate ajuta să împărțiți un șir CSV în jetoane separate.

Excel este unul dintre cele mai utilizate instrumente software pentru analiza datelor. Este livrat cu o mulțime de caracteristici care nu sunt acceptate de Piton și alte limbaje de programare. Deoarece Excel este unul dintre cele mai utilizate instrumente pentru analiza datelor, integrarea acestuia cu Piton este importantă, deoarece pot exista unii utilizatori care sunt mai familiarizați cu Excel decât cu orice alt limbaj de programare, inclusiv Piton.

În acest tutorial, veți învăța cum să salvați un fișier CSV ca mai multe fișiere mici în Piton. Veți salva fișierele ca niște bucăți separate de date dintr -un fișier în mai multe fișiere noi.

Puteți utiliza modulul CSV pentru a citi și scrie fișiere CSV. De asemenea, veți folosi șiruri care vor face utilizarea Piton mult mai rapidă și mai ușoară decât utilizarea Formulelor Excel și Macro. Modulul CSV este disponibil atât în ​​versiunile Piton 2 cât și în Piton 3.

Cum să împărțiți fișierele CSV cu Piton? Cum să împărțiți un CSV în Piton? Împărțiți un CSV sau valorile separate de virgulă (CSV) pe baza anteturilor de coloană folosind Piton, Data Science și Excel Formule, Macros și instrumente VBA pe mai multe foi de lucru. Funcția Tokenize () vă poate ajuta să împărțiți un șir CSV în jetoane separate.

Piton3 Split CSV File în bucăți.py

د CSV Myfile = خلاص ("لیست_ف_چونف"، "RSV. نورې لیکې نه دي. پا shaph ې = قطار. سپیکټ ("\ t") # # د هر قطار په واسطه د توکیو () فعالیت په کارولو سره د ټوکنونو لیست کې تقسیم کړئ. پا shape ه = ["،"، "ګډون کول
Pentru i în Split: Print (i) # Tipăriți fiecare intrare din listă cu o pauză de linie. myfile.close () # Închideți fișierul astfel încât să poată fi deschis din nou

Puteți împărți un fișier CSV folosind modulul CSV, dar în Piton 3 au schimbat modul în care este stocată o listă. O listă este un obiect din Piton 3 în loc de o listă dacă luați un alt tip de date precum STR, unde puteți schimba asta într -un tip de obiect. S -ar putea să aveți un comportament neașteptat atunci când lucrați cu obiecte, deoarece valorile șirului nu sunt acceptate de toate funcțiile.

CONCLUZIE

Un fișier CSV este un fișier ale cărui valori vor fi separate prin virgule. Formatul CSV este considerat un format de text și este destinat să furnizeze date tabulare.

Tipul de fișier, care are extensia CSV, conține informații care pot fi importate într -o bază de date, iar un fișier text similar poate transporta datele necesare pentru organizarea tabelelor.

Dacă aveți un fișier CSV care trebuie împărțit în mai multe fișiere, puteți utiliza modulul CSV. Puteți citi fișierul folosind modulul CSV și îl puteți scrie în mai multe fișiere folosind modulul Writer.

De asemenea, puteți citi fișiere CSV folosind alte limbaje de programare, cum ar fi Perl, Ruby, Java, JavaScript sau PHP. Utilizați modulul CSV și utilizați aceste limbi pentru a vă prelucra datele.





Comentarii (0)

Lasa un comentariu