Как да разделя CSV файл на парчета с Python?

Как да разделя CSV файл на парчета с Python?


Python разделя CSV файлове на парчета

Python е мощен език за програмиране, който може да се използва за много различни цели. Един от тях е импортирането на CSV файлове и обработването им в парчета.

Целта на този урок е да ви научи как да импортирате CSV файлове и да използвате функцията за разделяне на Python върху тях. Ще научите как да го използвате с два примера: Разделяне на файл в множество файлове въз основа на първата колона и разделяне на файл на произволни парчета.

Ако не сте запознати с това каква е науката за данни, това е процесът на извличане на знания от данни, така че да може да се използва при вземане или усъвършенстване на решения относно бъдещите действия.

Как да използвам езика за програмиране на Python за разделяне на CSV файлове на парчета?

Можете да разделите файлове с CSV модула. Този модул е ​​съвместим както с Python 2, така и с Python 3.

Python 3:

Отворете CSV файл в Python Shell. Ще използвате CSV. четец (файл, delimiter =), след това го предайте на CSV. Writer и вие ще използвате низ вместо файла, тъй като в Python 3 низовете са обекти (същият статус на паметта като списъци), така че може да се наложи да променим начина, по който се съхраняват данните (тип промяна), което би довело до неочаквано поведение.

Отворете файл в python3:

Python3 разделен csv файл на chunks.py

Как да разделя CSV файлове с python? Как да разделя CSV файл с Python? Разделете текстов файл на множество по -малки файлове въз основа на първата колона в текстовия файл. Това е прост, лесен и мощен начин за създаване на CSV файлове или конвертиране на CSV/запетая с разграничени файлове в други.

Ето как импортирате файла си:

Импортиране на CSV

Сега ще използвате разделител = аргумент към класа на четеца. Това е набор от знаци, които ще разделят полетата. В този случай това е запетая (,). Така четецът (файл, delimiter = ', ще раздели всеки ред на множество части въз основа на тази колона.

reader = csv.reader (myfile, delimiter = ',')

Следващото нещо, което трябва да направите, е да използвате класа на писателя, за да напишете данните във файл. Напишете данните с помощта на класа Writer и ги предайте на низов обект вместо файла, тъй като низовете са обекти в Python 3 и може да имате неочаквано поведение, без да променяте типа. Задайте своя атрибут на режима като „така че да започне да пише на този файл.

Writer = CSV.Writer (Stringio)

Следващата стъпка е да инструктирате класа на Writer да използва всички данни в класа на Reader, за да го напише във файла. Ще прегледате редовете и ще напишете всеки от тях във файла. Последната стъпка е да използвате писатели, които ще напишат ред (един ред данни) във файл с помощта на писателя. писатели (ред).

За мен, ред в четеца: #Този цикъл преминава през всеки ред от читателя и пише всеки ред във файл. редове.append (ред)
писатели (ред) #add ред в края на файла.
Писатели (редове) #add всички редове наведнъж.

И накрая, затворете файла си и го отворете, за да сте сигурни, че всичко е запазено правилно. Той трябва да има всеки къс от вашия CSV, разделен на свой собствен файл със същото име като оригиналния ви файл, но с разширение на .CSV.

stringio = io.stringio (myfile.read ())
Writer = CSV.Writer (Stringio)
писател = csv.writer (stringio, delimiter = ',
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) stringio = io.stringio (myfile.read ()) Writer = CSV.Writer (Stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) stringio = io.stringio (myfile.read ()) Writer = CSV.Writer (Stringio) писател = csv.writer (stringio, delimiter = ',’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

Python разделен CSV файл на парчета.py

Как да разделя CSV с помощта на python? Как да разделя CSV в Python? Разделете стойностите на CSV или запетая (CSV) въз основа на заглавки на колони, използвайки Python, Data Science и Excel формули, макроси и VBA инструменти в множество работни листове. Функцията tokenize () може да ви помогне да разделите CSV низ на отделни токени.

Excel е един от най -използваните софтуерни инструменти за анализ на данни. Той се предлага с много функции, които не се поддържат от Python и други езици за програмиране. Тъй като Excel е един от най -използваните инструменти за анализ на данни, интегрирането му с Python е важно, тъй като може да има някои потребители, които са по -запознати с Excel, отколкото с всеки друг език за програмиране, включително Python.

В този урок ще научите как да запазите CSV файл като множество малки файлове в Python. Ще запазите файловете като отделни парчета данни от един файл в множество нови файла.

Можете да използвате CSV модула за четене и писане на CSV файлове. Ще използвате и струни, които ще направят използването на Python много по -бързо и по -лесно, отколкото използването на Excel Formulas и макроси. CSV модулът се предлага както в Python 2, така и в Python 3 версии.

Как да разделя CSV файлове с python? Как да разделя CSV в Python? Разделете стойностите на CSV или запетая (CSV) въз основа на заглавки на колони, използвайки Python, Data Science и Excel формули, макроси и VBA инструменти в множество работни листове. Функцията tokenize () може да ви помогне да разделите CSV низ на отделни токени.

Python3 разделен csv файл на парчета.py

Импортиране на csv myfile = open ("list_of_парчета.csv", "r") reader = csv.reader (myfile, delimiter = ","), докато е вярно: row = next (reader) # продължава да чете ред от файла csv, докато там няма повече линии. split = row.split ("\ t") # Разделете всеки ред в списък с токени, като използвате функцията tokenize (). split = ["", ","]. Присъединете се (разделете) # Унищожете всеки елемент от списъка с жетони и ги поставете в края
За i в разделяне: отпечатайте (i) # разпечатайте всеки запис от списъка с прекъсване на реда. myfile.close () # Затворете файла, за да може да бъде отворен отново

Можете да разделите CSV файл с помощта на CSV модула, но в Python 3 те промениха начина, по който се съхранява списък. Списък е обект в Python 3 вместо списък, ако вземете друг тип данни като STR, където можете да го промените на тип обект. Може да имате неочаквано поведение, когато работите с обекти, тъй като стойностите на низовете не се приемат от всички функции.

Заключение

CSV файл е файл, чиито стойности ще бъдат разделени със запетаи. Форматът на CSV се счита за текстов формат и има за цел да предостави таблични данни.

Типът на файла, който има разширение CSV, съдържа информация, която може да бъде импортирана в база данни, а подобен текстов файл може да носи данните, необходими за организиране на таблици.

Ако имате CSV файл, който трябва да бъде разделен на множество файлове, можете да използвате CSV модула. Можете да прочетете файла с помощта на CSV модула и да го напишете в множество файлове с помощта на модула за писане.

Можете също да четете CSV файлове, като използвате други езици за програмиране като Perl, Ruby, Java, JavaScript или PHP. Използвайте CSV модула и използвайте тези езици, за да обработите вашите данни.





Коментари (0)

Оставете коментар