Como dividir o arquivo CSV em pedaços com Python?

O Python é uma poderosa linguagem de programação que pode ser usada para muitos propósitos diferentes. Um deles está importando arquivos CSV e processando -os em pedaços.
Como dividir o arquivo CSV em pedaços com Python?

Python dividir arquivos CSV em pedaços

O Python é uma poderosa linguagem de programação que pode ser usada para muitos propósitos diferentes. Um deles está importando arquivos CSV e processando -os em pedaços.

O objetivo deste tutorial é ensinar como importar arquivos CSV e usar a função Split Python neles. Você aprenderá como usá -lo com dois exemplos: dividindo um arquivo em vários arquivos com base na primeira coluna e dividindo um arquivo em pedaços arbitrários.

Se você não está familiarizado com o que é ciência de dados, é o processo de extrair conhecimento dos dados, para que ele possa ser usado na tomada ou refinar decisões sobre ações futuras.

Como usar a linguagem de programação do Python para dividir os arquivos CSV em pedaços?

Você pode dividir arquivos com o módulo CSV. Este módulo é compatível com o Python 2 e o Python 3.

Python 3:

Abra um arquivo CSV em um shell python. Você usará o CSV. leitor (arquivo, delimiter =) e depois passe para CSV. O Writer e você usarão string em vez do arquivo, porque no Python 3 strings são objetos (o mesmo status da memória que as listas), para que tenhamos que alterar a maneira como os dados são armazenados (tipo de alteração), o que resultaria em comportamento inesperado.

Abra um arquivo no Python3:

Python3 dividiu o arquivo CSV em chunks.py

Como dividir os arquivos CSV com Python? Como dividir um arquivo CSV com Python? Divide um arquivo de texto em vários arquivos menores com base na primeira coluna no arquivo de texto. É uma maneira simples, fácil e poderosa de criar arquivos CSV ou converter arquivos delimitados de CSV/vírgula para outros.

É assim que você importa seu arquivo:

Importar CSV

Agora você vai usar o delimiter = argumento para a classe do leitor. É um conjunto de caracteres que separarão os campos. Nesse caso, é uma vírgula (,). Portanto, o leitor (arquivo, delimiter = ', dividirá cada linha em várias partes com base nessa coluna.

leitor = csv.reader (myfile, delimiter = '' ')

A próxima coisa a fazer é usar a classe Writer para escrever os dados em um arquivo. Escreva os dados usando a classe Writer e passe -os para um objeto String em vez do arquivo, porque as strings são objetos no Python 3 e você pode ter um comportamento inesperado sem alterar o tipo. Defina o atributo de modo como 'para que ele comece a escrever neste arquivo.

Writer = CSV.Writer (Stringio)

A próxima etapa é instruir a classe Writer a usar todos os dados da classe Reader para gravá -los no arquivo. Você percorre as linhas e escreverá cada uma no arquivo. A última etapa é usar escritores, que escreverão uma linha (uma linha de dados) em um arquivo usando o escritor. escritores (linha).

Para i, linha no leitor: #Este loop passa por cada linha do leitor e grava cada linha em um arquivo. linhas.append (linha)
Escritores (linha) #Add uma linha no final do arquivo.
Escritores (linhas) #Add todas as linhas de uma só vez.

Por fim, feche seu arquivo e abra -o para garantir que tudo esteja salvo corretamente. Ele deve ter cada pedaço do seu CSV dividido em seu próprio arquivo com o mesmo nome do seu arquivo original, mas com uma extensão do .csv.

stringio = io.stringio (myfile.read ())
Writer = CSV.Writer (Stringio)
writer = csv.writer (stringio, delimiter = ',
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) stringio = io.stringio (myfile.read ()) Writer = CSV.Writer (Stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) stringio = io.stringio (myfile.read ()) Writer = CSV.Writer (Stringio) writer = csv.writer (stringio, delimiter = ',’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

Pitão Split CSV Arquivo em Chunks.py

Como dividir um CSV usando Pitão? Como dividir um CSV em Pitão? Divida um CSV ou valores separados por vírgula (CSV) com base em cabeçalhos de coluna usando fórmulas Pitão, Ciência de Dados e Excel, macros e VBA em várias planilhas. A função tokenize () pode ajudá -lo a dividir uma sequência CSV em tokens separados.

O Excel é uma das ferramentas de software mais usadas para análise de dados. Ele vem com muitos recursos que não são suportados pelo Pitão e outras linguagens de programação. Como o Excel é uma das ferramentas mais usadas para análise de dados, integrá -lo ao Pitão é importante, pois pode haver alguns usuários mais familiarizados com o Excel do que com qualquer outra linguagem de programação, incluindo o Pitão.

Neste tutorial, você aprenderá como salvar um arquivo CSV como vários arquivos pequenos no Pitão. Você vai salvar os arquivos como pedaços separados de dados de um arquivo em vários novos arquivos.

Você pode usar o módulo CSV para ler e gravar arquivos CSV. Você também usará strings que tornarão o uso do Pitão muito mais rápido e mais fácil do que usar fórmulas e macros do Excel. O módulo CSV está disponível nas versões Pitão 2 e Pitão 3.

Como dividir os arquivos CSV com Pitão? Como dividir um CSV em Pitão? Divida um CSV ou valores separados por vírgula (CSV) com base em cabeçalhos de coluna usando fórmulas Pitão, Ciência de Dados e Excel, macros e VBA em várias planilhas. A função tokenize () pode ajudá -lo a dividir uma sequência CSV em tokens separados.

Pitão3 dividiu o arquivo CSV em pedaços.py

Importuj csv myFile = Open ("List_of_fragmenty.csv", "r") czytnik = csv.reader (myFile, delimiter = ","), a true: row = następny (czytnik) # czyta linię z pliku csv, aż tam tam jest plik CSV, aż tam jest nie ma już linii. split = row.split („\ t”) # Podziel każdy wiersz na listę tokenów za pomocą funkcji tokenize (). split = ["", "]. dołącz (split) # zniszcz każdy element listy tokenów i umieść je na końcu
Para I em Split: Print (i) # Imprima cada entrada da lista com uma quebra de linha. myfile.close () # feche o arquivo para que ele possa ser aberto novamente

Você pode dividir um arquivo CSV usando o módulo CSV, mas no Pitão 3 eles mudaram a maneira como uma lista é armazenada. Uma lista é um objeto no Pitão 3 em vez de uma lista se você pegar outro tipo de dados como o STR, onde pode alterar isso para um tipo de objeto. Você pode ter um comportamento inesperado ao trabalhar com objetos, pois os valores da string não são aceitos por todas as funções.

CONCLUSÃO

Um arquivo CSV é um arquivo cujos valores serão separados por vírgulas. O formato CSV é considerado um formato de texto e destina -se a fornecer dados tabulares.

O tipo de arquivo, que possui a extensão CSV, contém informações que podem ser importadas para um banco de dados, e um arquivo de texto semelhante pode transportar os dados necessários para organizar tabelas.

Se você possui um arquivo CSV que precisa ser dividido em vários arquivos, poderá usar o módulo CSV. Você pode ler o arquivo usando o módulo CSV e escrevê -lo em vários arquivos usando o módulo Writer.

Você também pode ler arquivos CSV usando outras linguagens de programação, como Perl, Ruby, Java, JavaScript ou PHP. Use o módulo CSV e use esses idiomas para processar seus dados.





Comentários (0)

Deixe um comentário