Jak rozdělit soubor CSV na kousky s Pythonem?

Jak rozdělit soubor CSV na kousky s Pythonem?


Python rozdělit soubory CSV na kousky

Python je výkonný programovací jazyk, který lze použít pro mnoho různých účelů. Jeden z nich je importovat soubory CSV a zpracovávat je do kousků.

Cílem tohoto tutoriálu je naučit vás, jak importovat soubory CSV a použít na ně funkci Python Split. Naučíte se, jak jej používat se dvěma příklady: Rozdělení souboru na více souborů na základě prvního sloupce a rozdělení souboru na libovolné kousky.

Pokud nejste obeznámeni s tím, co je to věda o údajích, jedná se o proces extrakce znalostí z dat, aby bylo možné použít při rozhodování nebo zdokonalování rozhodnutí o budoucích akcích.

Jak používat programovací jazyk Python k rozdělení souborů CSV do kousků?

Soubory můžete rozdělit pomocí modulu CSV. Tento modul je kompatibilní s Python 2 a Python 3.

Python 3:

Otevřete soubor CSV ve skořápce Python. Budete používat CSV. Reader (soubor, delimiter =), poté jej předejte na CSV. Spisovatel a místo souboru budete používat řetězec, protože v řetězcích Python 3 jsou objekty (stejný stav paměti jako seznamy), takže možná budeme muset změnit způsob ukládání dat (typ změny), což by mělo za následek neočekávané chování.

Otevřete soubor v Python3:

Python3 rozdělit soubor CSV na kusy.py

Jak rozdělit soubory CSV s Pythonem? Jak rozdělit soubor CSV s Pythonem? Rozdělí textový soubor do více menších souborů na základě prvního sloupce v textovém souboru. Je to jednoduchý, snadný a výkonný způsob, jak vytvářet soubory CSV nebo převést soubory CSV/COMMA Demited na jiné.

Takto importujete svůj soubor:

import CSV

Nyní budete používat argument Delimiter = do třídy čtenářů. Je to sada postav, které oddělí pole. V tomto případě je to čárka (,). Takže čtenář (soubor, delimiter = ', rozdělí každou řádek na více částí na základě tohoto sloupce.

Reader = csv.reader (myfile, delimiter = ',')

Další věcí, kterou musíte udělat, je použít třídu spisovatelů k zápisu dat do souboru. Napište data pomocí třídy spisovatele a předejte je na řetězový objekt místo souboru, protože řetězce jsou objekty v Pythonu 3 a možná budete mít neočekávané chování, aniž byste změnili typ. Nastavte atribut režimu jako ', aby začal psát v tomto souboru.

Writer = CSV.Writer (Stringio)

Dalším krokem je instruovat třídu spisovatele, aby použila všechna data ve třídě čtečky k jejímu zadání do souboru. Provedete řádky a napíšete každou z nich do souboru. Posledním krokem je použití spisovatelů, kteří do souboru pomocí spisovatele zapíše řádek (jeden řádek dat). Spisovatelé (řádek).

Pro I, Row in Reader: #This Loop prochází každým řádem z čtenáře a zapíše každý řádek do souboru. Rows.Append (řádek)
Spisovatelé (řádek) #add řádek na konci souboru.
Spisovatelé (řádky) #Add všechny řádky najednou.

Nakonec zavřete soubor a otevřete jej, abyste se ujistili, že je vše správně uloženo. Měl by mít každý kus z vašeho CSV rozděleného do svého vlastního souboru se stejným názvem jako váš původní soubor, ale s rozšířením .csv.

stringio = io.stringio (myfile.read ())
Writer = CSV.Writer (Stringio)
Writer = CSV.Writer (Stringio, Delimiter = ',
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) stringio = io.stringio (myfile.read ()) Writer = CSV.Writer (Stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) stringio = io.stringio (myfile.read ()) Writer = CSV.Writer (Stringio) Writer = CSV.Writer (Stringio, Delimiter = ',’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

Krajta rozdělit soubor CSV na kusy.py

Jak rozdělit CSV pomocí Krajtau? Jak rozdělit CSV v Krajtau? Rozdělte hodnoty CSV nebo čárkami (CSV) na základě záhlaví sloupců pomocí Krajta, Data Science a Excel vzorců, makra a nástrojů VBA napříč více pracovními listy. Funkce Tokenize () vám může pomoci rozdělit řetězec CSV do samostatných tokenů.

Excel je jedním z nejpoužívanějších softwarových nástrojů pro analýzu dat. Dodává se s mnoha funkcemi, které nejsou podporovány Krajtaem a dalšími programovacími jazyky. Vzhledem k tomu, že Excel je jedním z nejpoužívanějších nástrojů pro analýzu dat, je jeho integrace s Krajtaem důležitá, protože mohou existovat někteří uživatelé, kteří jsou s Excelem více obeznámeni než s jakýmkoli jiným programovacím jazykem, včetně Krajtau.

V tomto tutoriálu se naučíte uložit soubor CSV jako více malých souborů v Krajtau. Uložíte soubory jako samostatné kousky dat z jednoho souboru do několika nových souborů.

Modul CSV můžete použít ke čtení a psaní souborů CSV. Budete také používat řetězce, které budou používat pomocí Krajtau mnohem rychlejší a snadnější než použití vzorců Excelu a makra. Modul CSV je k dispozici ve verzích Krajta 2 a Krajta 3.

Jak rozdělit soubory CSV s Krajtaem? Jak rozdělit CSV v Krajtau? Rozdělte hodnoty CSV nebo čárkami (CSV) na základě záhlaví sloupců pomocí Krajta, Data Science a Excel vzorců, makra a nástrojů VBA napříč více pracovními listy. Funkce Tokenize () vám může pomoci rozdělit řetězec CSV do samostatných tokenů.

Krajta3 rozdělit soubor CSV na kusy.py

Import CSV myFile = Open ("List_OF_CHUNKS.CSV", "R") Reader = CSV.Reader (MyFile, DeliMiter = ",") While: Row = next (Reader) # neustále čte řádek ze souboru CSV, dokud tam už nejsou další řádky. split = row.split ("\ t") # Rozdělte každý řádek do seznamu tokenů pomocí funkce tokenize (). split = ["", ","]. Připojte se (split) # Zničte každý prvek seznamu žetonů a na konci je dejte
Pro I In Split: Print (i) # Vytiskněte každou položku ze seznamu s přerušením řádku. myfile.close () # Zavřete soubor tak, aby byl znovu otevřen

Soubor CSV můžete rozdělit pomocí modulu CSV, ale v Krajtau 3 změnili způsob uložení seznamu. Seznam je objekt v Krajtau 3 místo seznamu, pokud vezmete jiný typ dat, jako je STR, kde jej můžete změnit na typ objektu. Při práci s objekty, protože hodnoty řetězců nejsou přijímány všemi funkcemi.

ZÁVĚR

Soubor CSV je soubor, jehož hodnoty budou odděleny čárkami. Formát CSV je považován za textový formát a je určen k poskytování tabulkových dat.

Typ souboru, který má příponu CSV, obsahuje informace, které lze importovat do databáze, a podobný textový soubor může nést data potřebná k uspořádání tabulek.

Pokud máte soubor CSV, který je třeba rozdělit do více souborů, můžete použít modul CSV. Soubor si můžete přečíst pomocí modulu CSV a zapisovat jej do více souborů pomocí modulu Writer.

Můžete také číst soubory CSV pomocí jiných programovacích jazyků, jako jsou Perl, Ruby, Java, Javascript nebo PHP. Použijte modul CSV a použijte tyto jazyky ke zpracování vašich dat.





Komentáře (0)

Zanechat komentář