Wie teilen Sie die CSV -Datei mit Python in Stücke auf?

Wie teilen Sie die CSV -Datei mit Python in Stücke auf?

Python hat CSV -Dateien in Stücke geteilt

Python ist eine leistungsstarke Programmiersprache, die für viele verschiedene Zwecke verwendet werden kann. Einer von ihnen ist es, CSV -Dateien zu importieren und in Stücke zu verarbeiten.

Das Ziel dieses Tutorials ist es, Ihnen beizubringen, wie Sie CSV -Dateien importieren und die Python -Split -Funktion auf ihnen verwenden. Sie erfahren, wie Sie es mit zwei Beispielen verwenden: Aufteilung einer Datei in mehreren Dateien basierend auf der ersten Spalte und in beliebigen Stücken aufzuteilen.

Wenn Sie nicht mit der Datenwissenschaft vertraut sind, ist dies der Prozess des Extrahierens von Wissen aus Daten, damit sie bei der Treffen oder Verfeinerung von Entscheidungen über zukünftige Aktionen verwendet werden können.

Wie kann ich Python -Programmiersprache verwenden, um CSV -Dateien in Stücke aufzuteilen?

Sie können Dateien mit dem CSV -Modul teilen. Dieses Modul ist sowohl mit Python 2 als auch mit Python 3 kompatibel.

Python 3:

Öffnen Sie eine CSV -Datei in einer Python -Shell. Sie werden das CSV verwenden. Leser (Datei, Delimiter =) und übergeben Sie sie an CSV. Writer und Sie verwenden String anstelle der Datei, da in Python 3 Zeichenfolgen Objekte sind (gleiche Speicherstatus wie Listen), sodass wir möglicherweise die Art und Weise ändern müssen, wie die Daten gespeichert werden (Änderungstyp), was zu unerwartetem Verhalten führen würde.

Öffnen Sie eine Datei in Python3:

Python3 Split CSV -Datei in stücke.py.py

Wie trenne ich CSV -Dateien mit Python? Wie teilen Sie eine CSV -Datei mit Python auf? Spaltet eine Textdatei in mehrere kleinere Dateien basierend auf der ersten Spalte in der Textdatei auf. Es ist eine einfache, einfache und leistungsstarke Möglichkeit, CSV -Dateien zu erstellen oder CSV/Comma -Abgrenzungsdateien in andere zu konvertieren.

So importieren Sie Ihre Datei:

CSV importieren

Jetzt verwenden Sie das Argument der Leserklasse. Es ist eine Reihe von Zeichen, die die Felder trennen. In diesem Fall ist es ein Komma (,). Leser (Datei, Delimiter = ’, teilen jede Zeile basierend auf dieser Spalte in mehrere Teile auf.

reader = csv.reader (myFile, delimiter = ',')

Das nächste, was Sie tun müssen, ist, die Autorenklasse zu verwenden, um die Daten in eine Datei zu schreiben. Schreiben Sie die Daten mit der Autor -Klasse und geben Sie sie an ein String -Objekt anstelle der Datei weiter, da Zeichenfolgen Objekte in Python 3 sind und Sie möglicherweise ein unerwartetes Verhalten haben, ohne den Typ zu ändern. Setzen Sie das Modusattribut so, dass es in dieser Datei schreiben wird.

writer = csv.writer (Stringio)

Der nächste Schritt besteht darin, die Schriftstellungsklasse anzuweisen, alle Daten in der Leserklasse zu verwenden, um sie in die Datei zu schreiben. Sie werden die Zeilen durchlaufen und jeden in die Datei schreiben. Der letzte Schritt besteht darin, Autoren zu verwenden, die eine Zeile (eine Datenzeile) mit dem Schriftsteller in eine Datei schreiben. Autoren (Reihe).

Für mich geht die Zeile in Reader: #Dis -Schleife jede Zeile vom Leser durch und schreibt jede Zeile in eine Datei. Zeilen.Append (Zeile)
Autoren (Zeile) #add eine Zeile am Ende der Datei.
Autoren (Zeilen) #Add alle Zeilen gleichzeitig.

Schließlich schließen Sie Ihre Datei und öffnen Sie sie, um sicherzustellen, dass alles richtig gespeichert wird. Es sollte jeden Chunk von Ihrem CSV in seine eigene Datei mit demselben Namen wie Ihrer Originaldatei aufgeteilt haben, jedoch mit einer Erweiterung von .csv.

Stringio = io.stringio (myFile.read ())
writer = csv.writer (Stringio)
writer = csv.writer (Stringio, Delimiter = ’,
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) Stringio = io.stringio (myFile.read ()) writer = csv.writer (Stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) Stringio = io.stringio (myFile.read ()) writer = csv.writer (Stringio) writer = csv.writer (Stringio, Delimiter = ’,’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

Python teilte die CSV -Datei in talks.py auf

Wie teilen Sie ein CSV mit Python auf? Wie teilen Sie einen CSV in Python auf? Teilen Sie eine CSV- oder Comma-getrennte Werte (CSV) auf Basis von Säulenkopfzeilen mit Python-, Datenwissenschafts- und Excel-Formeln, Makros und VBA-Tools über mehrere Arbeitsblätter hinweg. Die Funktion tokenize () kann Ihnen helfen, eine CSV -Zeichenfolge in separate Token aufzuteilen.

Excel ist eines der am häufigsten verwendeten Softwaretools für die Datenanalyse. Es kommt mit vielen Funktionen, die nicht von Python und anderen Programmiersprachen unterstützt werden. Da Excel eines der am häufigsten verwendeten Tools für die Datenanalyse ist, ist es wichtig, es in Python zu integrieren, da es möglicherweise einige Benutzer gibt, die sich mit Excel vertraut machen als mit jeder anderen Programmiersprache, einschließlich Python.

In diesem Tutorial lernen Sie, wie Sie eine CSV -Datei als mehrere kleine Dateien in Python speichern. Sie speichern die Dateien als separate Datenbrocken aus einer Datei in mehrere neue Dateien.

Sie können das CSV -Modul verwenden, um CSV -Dateien zu lesen und zu schreiben. Sie verwenden auch Zeichenfolgen, die mit Python viel schneller und einfacher werden als Excel -Formeln und Makros. Das CSV -Modul ist sowohl in Python 2 als auch in Python 3 -Versionen erhältlich.

Wie trenne ich CSV -Dateien mit Python? Wie teilen Sie einen CSV in Python auf? Teilen Sie eine CSV- oder Comma-getrennte Werte (CSV) auf Basis von Säulenkopfzeilen mit Python-, Datenwissenschafts- und Excel-Formeln, Makros und VBA-Tools über mehrere Arbeitsblätter hinweg. Die Funktion tokenize () kann Ihnen helfen, eine CSV -Zeichenfolge in separate Token aufzuteilen.

Python3 Split CSV -Datei in stücke.py.py

Importieren Sie CSV myFile = open ("list_of_Stücke.csv", "r") reader = csv.reader (myFile, delimiter = "), während true: row = next (leser) # Lesen Sie weiterhin eine Zeile aus der CSV -Datei bis dort ist keine Zeilen mehr. split = row.split ("\ t") # Teilen Sie jede Zeile mit der Funktion tokenize () in eine Liste von Token auf. split = ["", ",", "]. Join (split) # Zerstöre jedes Element der Tokenliste und setzen Sie sie am Ende ein
Für mich in Split: Druck (i) # Drucken Sie jeden Eintrag aus der Liste mit einem Zeilenumbruch aus. myFile.close () # Schließen Sie die Datei so, dass sie erneut geöffnet werden kann

Sie können eine CSV -Datei mit dem CSV -Modul teilen, aber in Python 3 haben sie die Art und Weise geändert, wie eine Liste gespeichert wird. Eine Liste ist ein Objekt in Python 3 anstelle einer Liste, wenn Sie einen anderen Datentyp wie STR aufnehmen, bei dem Sie dies in einen Objekttyp ändern können. Möglicherweise haben Sie ein unerwartetes Verhalten, wenn Sie mit Objekten arbeiten, da Stringwerte von allen Funktionen nicht akzeptiert werden.

FAZIT

Eine CSV -Datei ist eine Datei, deren Werte durch Kommas getrennt werden. Das CSV -Format wird als Textformat angesehen und soll tabellarische Daten bereitstellen.

Der Dateityp mit der CSV -Erweiterung enthält Informationen, die in eine Datenbank importiert werden können, und eine ähnliche Textdatei kann die zum Organisieren von Tabellen erforderlichen Daten tragen.

Wenn Sie eine CSV -Datei haben, die in mehrere Dateien aufgeteilt werden muss, können Sie das CSV -Modul verwenden. Sie können die Datei mit dem CSV -Modul lesen und mit dem Writer -Modul an mehrere Dateien schreiben.

Sie können auch CSV -Dateien mit anderen Programmiersprachen wie Perl, Ruby, Java, JavaScript oder PHP lesen. Verwenden Sie das CSV -Modul und verwenden Sie diese Sprachen, um Ihre Daten zu verarbeiten.





Bemerkungen (0)

Hinterlasse einen Kommentar