Com dividir el fitxer CSV en trossos amb Python?

Com dividir el fitxer CSV en trossos amb Python?


Python dividit fitxers CSV en trossos

Python és un potent llenguatge de programació que es pot utilitzar per a diversos propòsits diferents. Un d’ells és importar fitxers CSV i processar -los a trossos.

L’objectiu d’aquest tutorial és ensenyar -vos a importar fitxers CSV i utilitzar -los la funció de divisió de Python. Aprendràs a utilitzar -lo amb dos exemples: dividir un fitxer en diversos fitxers basats en la primera columna i dividir un fitxer en trossos arbitraris.

Si no coneixeu què és la ciència de dades, és el procés d’extreure coneixement de les dades perquè es pugui utilitzar per prendre o perfeccionar decisions sobre accions futures.

Com utilitzar el llenguatge de programació Python per dividir fitxers CSV en trossos?

Podeu dividir fitxers amb el mòdul CSV. Aquest mòdul és compatible amb Python 2 i Python 3.

Python 3:

Obriu un fitxer CSV en una closca Python. Utilitzareu el CSV. Reader (fitxer, Delimiter =) i després passar -lo a CSV. L’escriptor i utilitzaràs String en lloc del fitxer perquè a Python 3 les cadenes són objectes (el mateix estat de memòria que les llistes), per la qual cosa potser haurem de canviar la manera d’emmagatzemar les dades (tipus de canvi) que resultarien en un comportament inesperat.

Obriu un fitxer a Python3:

Python3 Split CSV Fitxer a Chunks.py

Com dividir fitxers CSV amb Python? Com dividir un fitxer CSV amb Python? Divideix un fitxer de text en diversos fitxers més petits basats en la primera columna del fitxer de text. És una manera senzilla, senzilla i potent de crear fitxers CSV o convertir fitxers delimitats CSV/Comes en altres.

Així és com importeu el fitxer:

Importa CSV

Ara utilitzareu el delimitador = argument a la classe de lector. És un conjunt de personatges que separaran els camps. En aquest cas, és una coma (). Per tant, el lector (fitxer, delimiter = ”, dividirà cada línia en diverses parts basades en aquesta columna.

Reader = csv.reader (myfile, delimiter = ",")

El següent que cal fer és utilitzar la classe d’escriptors per escriure les dades en un fitxer. Escriviu les dades mitjançant la classe d’escriptor i passeu -la a un objecte de cadena en lloc del fitxer perquè les cadenes són objectes a Python 3 i podríeu tenir un comportament inesperat sense canviar el tipus. Definiu el seu atribut de mode com a de manera que començarà a escriure en aquest fitxer.

escriptor = csv.Writer (Stringio)

El següent pas és instruir a la classe d’escriptors que utilitzi totes les dades de la classe de lector per escriure -les al fitxer. Us bloquejareu per les files i escriviu cadascuna al fitxer. L’últim pas és utilitzar escriptors, que escriuran una fila (una línia de dades) en un fitxer mitjançant l’escriptor. Escriptors (fila).

Per a I, fila al lector: #This Loop passa per cada fila del lector i escriu cada línia en un fitxer. Rows.Append (fila)
Escriptors (fila) #ADD una fila al final del fitxer.
Escriptors (files) #Add totes les files alhora.

Finalment, tanqueu el fitxer i obriu -lo per assegurar -vos que tot es desarà correctament. Hauria de tenir cada tros del vostre CSV dividit en el seu propi fitxer amb el mateix nom que el vostre fitxer original, però amb una extensió de .CSV.

stringio = io.stringio (myfile.read ())
escriptor = csv.Writer (Stringio)
escriptor = csv.Writer (Stringio, Delimiter = ',
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) stringio = io.stringio (myfile.read ()) escriptor = csv.Writer (Stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) stringio = io.stringio (myfile.read ()) escriptor = csv.Writer (Stringio) escriptor = csv.Writer (Stringio, Delimiter = ',’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

Fitxer CSV de divisió de Python a Chunks.py

Com dividir un CSV amb Python? Com dividir un CSV en Python? Dividiu un CSV o valors separats per comes (CSV) basats en capçaleres de columnes mitjançant python, ciències de dades i fórmules Excel, macros i eines VBA a través de diversos fulls de treball. La funció tokenize () us pot ajudar a dividir una cadena CSV en fitxes separades.

Excel és una de les eines de programari més utilitzades per a l’anàlisi de dades. Inclou moltes funcions que no són compatibles amb Python i altres llenguatges de programació. Com que Excel és una de les eines més utilitzades per a l’anàlisi de dades, la integració amb Python és important, ja que pot haver -hi alguns usuaris que estiguin més familiaritzats amb Excel que amb qualsevol altre llenguatge de programació, inclòs Python.

En aquest tutorial, aprendràs a desar un fitxer CSV com a diversos fitxers petits a Python. Desareu els fitxers com a trossos separats de dades d’un fitxer en diversos fitxers nous.

Podeu utilitzar el mòdul CSV per llegir i escriure fitxers CSV. També utilitzareu cadenes que faran que Python sigui molt més ràpid i fàcil que utilitzar fórmules i macros Excel. El mòdul CSV està disponible tant en versions Python 2 com Python 3.

Com dividir fitxers CSV amb Python? Com dividir un CSV en Python? Dividiu un CSV o valors separats per comes (CSV) basats en capçaleres de columnes mitjançant python, ciències de dades i fórmules Excel, macros i eines VBA a través de diversos fulls de treball. La funció tokenize () us pot ajudar a dividir una cadena CSV en fitxes separades.

Python3 Split CSV Fitxer a Chunks.py

import csv myfile = obert ("list_of_trossos.csv", "r") lector = csv.reader (myfile, delimiter = ",") mentre que true: row = next (lector) # segueix llegint una línia del fitxer csv fins que fins allà ja no és més línies. split = row.split ("\ t") # dividiu cada fila en una llista de fitxes mitjançant la funció tokenize (). split = ["" ","]. Uniu -vos (dividiu) # destruïu cada element de la llista de fitxes i poseu -les al final
Per a Split: Imprimeix (i) # Imprimeix cada entrada de la llista amb un descans de línia. myfile.close () # tanqueu el fitxer perquè es pugui obrir de nou

Podeu dividir un fitxer CSV mitjançant el mòdul CSV, però a Python 3 han canviat la manera com es guarda una llista. Una llista és un objecte a Python 3 en lloc d'una llista si agafeu un altre tipus de dades com STR on podeu canviar -ho a un tipus d'objecte. Pot ser que tingueu un comportament inesperat quan treballeu amb objectes, ja que les funcions no accepten els valors de cadena.

Conclusió

Un fitxer CSV és un fitxer que els seus valors seran separats per comes. El format CSV es considera un format de text i està destinat a proporcionar dades tabulars.

El tipus de fitxer, que té l’extensió CSV, conté informació que es pot importar a una base de dades i un fitxer de text similar pot transportar les dades necessàries per organitzar taules.

Si teniu un fitxer CSV que cal dividir en diversos fitxers, podeu utilitzar el mòdul CSV. Podeu llegir el fitxer mitjançant el mòdul CSV i escriure -lo a diversos fitxers mitjançant el mòdul d'escriptor.

També podeu llegir fitxers CSV mitjançant altres llenguatges de programació com Perl, Ruby, Java, JavaScript o PHP. Utilitzeu el mòdul CSV i utilitzeu aquests idiomes per processar les vostres dades.





Comentaris (0)

Deixa un comentari