Comment diviser le fichier CSV en morceaux avec Python?

Comment diviser le fichier CSV en morceaux avec Python?


Python a divisé les fichiers CSV en morceaux

Python est un langage de programmation puissant qui peut être utilisé à de nombreuses fins différentes. L'un d'eux est d'importer des fichiers CSV et de les traiter en morceaux.

Le but de ce tutoriel est de vous apprendre à importer des fichiers CSV et à utiliser la fonction Python Split sur eux. Vous apprendrez à l'utiliser avec deux exemples: diviser un fichier en plusieurs fichiers en fonction de la première colonne et diviser un fichier en morceaux arbitraires.

Si vous ne connaissez pas ce qu'est la science des données, c'est le processus d'extraction des connaissances des données afin qu'elle puisse être utilisée pour prendre ou affiner les décisions concernant les actions futures.

Comment utiliser le langage de programmation Python pour diviser les fichiers CSV en morceaux?

Vous pouvez diviser des fichiers avec le module CSV. Ce module est compatible avec Python 2 et Python 3.

Python 3:

Ouvrez un fichier CSV dans un shell Python. Vous utiliserez le CSV. lecteur (fichier, délimiteur =), puis le passer à CSV. L'écrivain et vous utiliserez une chaîne au lieu du fichier car dans les chaînes Python 3 sont des objets (même statut de mémoire que les listes), nous devrions donc modifier la façon dont les données sont stockées (type de modification), ce qui entraînerait un comportement inattendu.

Ouvrez un fichier dans Python3:

Python3 diviser le fichier CSV en chunks.py

Comment diviser les fichiers CSV avec Python? Comment diviser un fichier CSV avec Python? Fruit un fichier texte en plusieurs fichiers plus petits en fonction de la première colonne du fichier texte. C'est un moyen simple, facile et puissant de créer des fichiers CSV ou de convertir des fichiers délimités CSV / virgules à d'autres.

C'est ainsi que vous importez votre fichier:

Importer CSV

Vous allez maintenant utiliser l'argument Delimiter = pour la classe de lecteur. C'est un ensemble de caractères qui sépareront les champs. Dans ce cas, c'est une virgule (,). Le lecteur (fichier, Delimiter = ’, divisera chaque ligne en plusieurs parties en fonction de cette colonne.

Reader = CSV.Reader (MyFile, Delimiter = ’,’)

La prochaine chose à faire est d'utiliser la classe d'écrivain pour écrire les données dans un fichier. Écrivez les données à l'aide de la classe d'écrivain et passez-la à un objet String au lieu du fichier car les chaînes sont des objets dans Python 3 et vous pourriez avoir un comportement inattendu sans changer le type. Définissez son attribut de mode comme «afin qu'il commence à écrire sur ce fichier.

écrivain = csv.writer (stringio)

L'étape suivante consiste à demander à la classe d'écrivains d'utiliser toutes les données de la classe Reader pour l'écrire dans le fichier. Vous traverserez les lignes et écrirez chacun dans le fichier. La dernière étape consiste à utiliser des écrivains, qui écriront une ligne (une ligne de données) dans un fichier utilisant l'écrivain. écrivains (ligne).

Pour I, Row in Reader: # Cette boucle passe par chaque ligne à partir du lecteur et écrit chaque ligne dans un fichier. Rows.APPEND (ROW)
écrivains (ligne) #add une ligne à la fin du fichier.
écrivains (lignes) #add toutes les lignes à la fois.

Enfin, fermez votre fichier et ouvrez-le pour vous assurer que tout est enregistré correctement. Il devrait avoir chaque morceau de votre CSV divisé en son propre fichier avec le même nom que votre fichier d'origine, mais avec une extension de .csv.

stringio = io.stringio (myfile.read ())
écrivain = csv.writer (stringio)
écrivain = csv.writer (stristio, dlimiter = ’,
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) stringio = io.stringio (myfile.read ()) écrivain = csv.writer (stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) stringio = io.stringio (myfile.read ()) écrivain = csv.writer (stringio) écrivain = csv.writer (stristio, dlimiter = ’,’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

Python Split CSV Fichier en Chunks.py

Comment diviser un CSV à l'aide de Python? Comment diviser un CSV dans Python? Divisez un CSV ou des valeurs séparées par des virgules (CSV) basées sur des en-têtes de colonne à l'aide de Python, de la science des données et des outils de formules, de macros et de VBA sur plusieurs feuilles de calcul. La fonction tokenize () peut vous aider à diviser une chaîne CSV en jetons séparés.

Excel est l'un des outils logiciels les plus utilisés pour l'analyse des données. Il est livré avec de nombreuses fonctionnalités qui ne sont pas prises en charge par Python et d'autres langages de programmation. Comme Excel est l'un des outils les plus utilisés pour l'analyse des données, l'intégrer à Python est important car certains utilisateurs sont plus familiers avec Excel qu'avec tout autre langage de programmation, y compris Python.

Dans ce didacticiel, vous allez apprendre à enregistrer un fichier CSV en tant que plusieurs petits fichiers dans Python. Vous allez enregistrer les fichiers sous forme de morceaux de données séparés d'un fichier dans plusieurs nouveaux fichiers.

Vous pouvez utiliser le module CSV pour lire et écrire des fichiers CSV. Vous utiliserez également des chaînes qui rendront l'utilisation de Python beaucoup plus rapide et plus facile que d'utiliser des formules et des macros Excel. Le module CSV est disponible dans les versions Python 2 et Python 3.

Comment diviser les fichiers CSV avec Python? Comment diviser un CSV dans Python? Divisez un CSV ou des valeurs séparées par des virgules (CSV) basées sur des en-têtes de colonne à l'aide de Python, de la science des données et des outils de formules, de macros et de VBA sur plusieurs feuilles de calcul. La fonction tokenize () peut vous aider à diviser une chaîne CSV en jetons séparés.

Python3 diviser le fichier CSV en morceaux.py

Importer csv myFile = open ("list_of_morceaux.csv", "r") reader = csv.reader (myFile, Delimiter = ",") tandis que true: row = next (lecteur) # continue de lire une ligne du fichier CSV jusqu'à ce qu'il soit là n'est plus de lignes. Split = row.split ("\ t") # divisez chaque ligne en une liste de jetons en utilisant la fonction tokenize (). Split = ["", ","]. Join (Split) # Détruisez chaque élément de la liste des jetons et mettez-les à la fin
pour i in Split: Imprimer (i) # Imprimez chaque entrée de la liste avec une pause de ligne. myFile.close () # Fermez le fichier afin qu'il puisse être ouvert à nouveau

Vous pouvez diviser un fichier CSV à l'aide du module CSV, mais dans Python 3, ils ont changé la façon dont une liste est stockée. Une liste est un objet dans Python 3 au lieu d'une liste si vous prenez un autre type de données comme STR où vous pouvez le changer en type d'objet. Vous pourriez avoir un comportement inattendu lorsque vous travaillez avec des objets car les valeurs de chaîne ne sont pas acceptées par toutes les fonctions.

CONCLUSION

Un fichier CSV est un fichier dont les valeurs seront séparées par des virgules. Le format CSV est considéré comme un format de texte et est destiné à fournir des données tabulaires.

Le type de fichier, qui a l'extension CSV, contient des informations qui peuvent être importées dans une base de données, et un fichier texte similaire peut transporter les données nécessaires pour organiser des tables.

Si vous avez un fichier CSV qui doit être divisé en plusieurs fichiers, vous pouvez utiliser le module CSV. Vous pouvez lire le fichier à l'aide du module CSV et l'écrire sur plusieurs fichiers à l'aide du module d'écrivain.

Vous pouvez également lire les fichiers CSV à l'aide d'autres langages de programmation tels que Perl, Ruby, Java, JavaScript ou PHP. Utilisez le module CSV et utilisez ces langages pour traiter vos données.





commentaires (0)

laissez un commentaire