¿Cómo dividir el archivo CSV en trozos con Python?

¿Cómo dividir el archivo CSV en trozos con Python?

Python dividió archivos CSV en trozos

Python es un poderoso lenguaje de programación que puede usarse para muchos propósitos diferentes. Uno de ellos es importar archivos CSV y procesarlos en trozos.

El objetivo de este tutorial es enseñarle cómo importar archivos CSV y usar la función dividida de Python en ellos. Aprenderá cómo usarlo con dos ejemplos: dividir un archivo en múltiples archivos basados ​​en la primera columna y dividir un archivo en fragmentos arbitrarios.

Si no está familiarizado con qué es la ciencia de datos, es el proceso de extraer conocimiento de los datos para que pueda usarse para tomar o refinar decisiones sobre acciones futuras.

¿Cómo usar el lenguaje de programación de Python para dividir los archivos CSV en fragmentos?

Puede dividir archivos con el módulo CSV. Este módulo es compatible con Python 2 y Python 3.

Python 3:

Abra un archivo CSV en un shell de Python. Usará el CSV. Reader (archivo, delimitador =), luego pasarlo a CSV. El escritor y usted usará String en lugar del archivo porque en las cadenas de Python 3 hay objetos (el mismo estado de memoria que las listas), por lo que podríamos tener que cambiar la forma en que se almacenan los datos (tipo de cambio), lo que daría como resultado un comportamiento inesperado.

Abra un archivo en Python3:

Python3 divide el archivo CSV en Chunks.py

¿Cómo dividir los archivos CSV con Python? ¿Cómo dividir un archivo CSV con Python? Divide un archivo de texto en múltiples archivos más pequeños basados ​​en la primera columna en el archivo de texto. Es una forma simple, fácil y potente de crear archivos CSV o convertir archivos delimitados CSV/Coma a otros.

Así es como importa su archivo:

Importar CSV

Ahora va a usar el argumento delimitador = a la clase del lector. Es un conjunto de personajes que separarán los campos. En este caso, es una coma (,). Entonces, el lector (archivo, delimiter = ’, dividirá cada línea en múltiples partes en función de esa columna.

lector = csv.reader (myFile, delimiter = ",")

Lo siguiente que debe hacer es usar la clase de escritor para escribir los datos en un archivo. Escriba los datos utilizando la clase de escritor y pasándolo a un objeto de cadena en lugar del archivo porque las cadenas son objetos en Python 3 y puede tener un comportamiento inesperado sin cambiar el tipo. Establezca su atributo de modo como para que comience a escribir en este archivo.

escritor = csv.writer (stringio)

El siguiente paso es instruir a la clase del escritor que use todos los datos en la clase del lector para escribirlos en el archivo. Reunirá las filas y escribirá cada una en el archivo. El último paso es usar escritores, que escribirán una fila (una línea de datos) en un archivo usando el escritor. Escritores (fila).

Para I, fila en el lector: #Este bucle pasa por cada fila desde el lector y escribe cada línea en un archivo. filas.append (fila)
Escritores (fila) #Add una fila al final del archivo.
Escritores (filas) #Add todas las filas a la vez.

Finalmente, cierre su archivo y ábralo para asegurarse de que todo se guarde correctamente. Debe tener cada fragmento de su CSV dividido en su propio archivo con el mismo nombre que su archivo original, pero con una extensión de .csv.

stringio = io.stringio (myFile.read ())
escritor = csv.writer (stringio)
escritor = csv.writer (stringio, delimiter = ’,
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) stringio = io.stringio (myFile.read ()) escritor = csv.writer (stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) stringio = io.stringio (myFile.read ()) escritor = csv.writer (stringio) escritor = csv.writer (stringio, delimiter = ’,’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

Pitón dividió el archivo CSV en Chunks.py

¿Cómo dividir un CSV usando Pitón? ¿Cómo dividir un CSV en Pitón? Divida un CSV o valores separados por comas (CSV) en función de los encabezados de columnas utilizando Pitón, Data Science y Fórmulas de Excel, Macros y VBA en múltiples hojas de trabajo. La función Tokenize () puede ayudarlo a dividir una cadena CSV en tokens separados.

Excel es una de las herramientas de software más utilizadas para el análisis de datos. Viene con muchas características que no son compatibles con Pitón y otros lenguajes de programación. Como Excel es una de las herramientas más utilizadas para el análisis de datos, integrarlo con Pitón es importante, ya que puede haber algunos usuarios que estén más familiarizados con Excel que con cualquier otro lenguaje de programación, incluido Pitón.

En este tutorial, aprenderá a guardar un archivo CSV como múltiples archivos pequeños en Pitón. Va a guardar los archivos como fragmentos de datos separados de un archivo en múltiples archivos nuevos.

Puede usar el módulo CSV para leer y escribir archivos CSV. También usará cadenas que harán que el uso de Pitón sea mucho más rápido y más fácil que el uso de fórmulas de Excel y macros. El módulo CSV está disponible en versiones de Pitón 2 y Pitón 3.

¿Cómo dividir los archivos CSV con Pitón? ¿Cómo dividir un CSV en Pitón? Divida un CSV o valores separados por comas (CSV) en función de los encabezados de columnas utilizando Pitón, Data Science y Fórmulas de Excel, Macros y VBA en múltiples hojas de trabajo. La función Tokenize () puede ayudarlo a dividir una cadena CSV en tokens separados.

Pitón3 divide el archivo CSV en Chunks.py

Εισαγωγή csv myfile = open ("list_of_κομμάτια.csv", "r") reader = csv.reader (myfile, delimiter = ",") δεν είναι περισσότερες γραμμές. split = row.split ("\ t") # χωρίστε κάθε σειρά σε μια λίστα με τα μάρκες χρησιμοποιώντας τη συνάρτηση tokenize (). split = ["", ","].
Para I en Split: Imprima (i) # Imprima cada entrada de la lista con un descanso de línea. myFile.Close () # Cierre el archivo para que pueda abrirse nuevamente

Puede dividir un archivo CSV usando el módulo CSV, pero en Pitón 3 cambiaron la forma en que se almacena una lista. Una lista es un objeto en Pitón 3 en lugar de una lista si toma otro tipo de datos como STR, donde puede cambiarlo a un tipo de objeto. Es posible que tenga un comportamiento inesperado cuando trabaje con objetos, ya que todas las funciones no aceptan los valores de cadena.

CONCLUSIÓN

Un archivo CSV es un archivo cuyos valores estarán separados por comas. El formato CSV se considera un formato de texto y está destinado a proporcionar datos tabulares.

El tipo de archivo, que tiene la extensión CSV, contiene información que puede importarse a una base de datos, y un archivo de texto similar puede llevar los datos necesarios para organizar tablas.

Si tiene un archivo CSV que debe dividirse en varios archivos, puede usar el módulo CSV. Puede leer el archivo usando el módulo CSV y escribirlo en varios archivos utilizando el módulo de escritor.

También puede leer archivos CSV utilizando otros lenguajes de programación como Perl, Ruby, Java, JavaScript o PHP. Use el módulo CSV y use esos idiomas para procesar sus datos.





Comentarios (0)

Deja un comentario