Kaip padalyti CSV failą į gabaliukus su „Python“?

„Python“ yra galinga programavimo kalba, kuri gali būti naudojama daugeliui skirtingų tikslų. Vienas iš jų yra CSV failų importavimas ir apdorojimas juos į gabalus.
Kaip padalyti CSV failą į gabaliukus su „Python“?

„Python“ padalijo CSV failus į gabalus

„Python“ yra galinga programavimo kalba, kuri gali būti naudojama daugeliui skirtingų tikslų. Vienas iš jų yra CSV failų importavimas ir apdorojimas juos į gabalus.

Šio vadovo tikslas yra išmokyti jus importuoti CSV failus ir naudoti jose esančią „Python Split“ funkciją. Sužinosite, kaip jį naudoti dviem pavyzdžiais: failo padalijimą į kelis failus, remiantis pirmuoju stulpeliu, ir failo padalijimą į savavališkus gabaliukus.

Jei nesate susipažinę su tuo, kas yra duomenų mokslas, tai yra žinių išgavimo iš duomenų procesas, kad tai būtų galima naudoti priimant ar tobulinant sprendimus dėl būsimų veiksmų.

Kaip naudoti „Python“ programavimo kalbą, norint padalyti CSV failus į dalis?

Failus galite padalyti naudodami CSV modulį. Šis modulis yra suderinamas tiek su „Python 2“, tiek su „Python 3“.

Python 3:

Atidarykite CSV failą „Python“ apvalkale. Naudosite CSV. Skaitytojas (failas, delimiter =), tada perduokite jį CSV. Rašytojas ir jūs naudosite eilutę, o ne failą, nes „Python 3“ eilutėse yra objektai (tos pačios atminties būsena kaip ir sąrašai), todėl mums gali tekti pakeisti duomenų saugojimo būdą (pakeisti tipą), o tai lems netikėtą elgesį.

Atidarykite failą „Python3“:

Python3 padalyti CSV failą į filks.py

Kaip padalyti CSV failus su „Python“? Kaip padalyti CSV failą su „Python“? Teksto failą padalija į kelis mažesnius failus, remiantis pirmuoju teksto failo stulpeliu. Tai paprastas, lengvas ir galingas būdas sukurti CSV failus arba konvertuoti CSV/kablelio ribotus failus į kitus.

Taip importuojate savo failą:

Importuoti CSV

Dabar jūs ketinate naudoti „Delimiter = Argument“ skaitytojų klasei. Tai simbolių rinkinys, kuris atskirtų laukus. Šiuo atveju tai kablelis (,). Taigi skaitytojas (failas, delimiter = ' - padalins kiekvieną eilutę į kelias dalis pagal tą stulpelį.

skaitytojas = csv.Reader (myFile, delimiter = ',')

Kitas dalykas, kurį reikia padaryti, yra naudoti rašytojų klasę, kad duomenys įrašytų į failą. Parašykite duomenis naudodamiesi rašytojo klase ir perduokite juos į eilutės objektą, o ne failą, nes eilutės yra objektai „Python 3“ ir galbūt turėsite netikėtą elgesį nepakeisdami tipo. Nustatykite savo režimo atributą kaip „kad jis pradėtų rašyti šiame faile.

rašytojas = csv.Writer (Stringio)

Kitas žingsnis yra nurodyti rašytojų klasei naudoti visus skaitytojų klasės duomenis, kad jie būtų įrašyti į failą. Jūs kils per eiles ir parašysite kiekvieną iš failo. Paskutinis žingsnis yra naudoti rašytojus, kurie į failą, naudodamas rašytoją, įrašys eilutę (vieną duomenų eilutę). Rašytojai (eilutė).

Aš, skaitytojui eilutė: #Ši kilpa eina per kiekvieną eilutę iš skaitytojo ir kiekvieną eilutę užrašo į failą. eilutės.Append (eilutė)
Rašytojai (eilutė) #add eilutę failo pabaigoje.
Rašytojai (eilutės) #Add Visos eilutės vienu metu.

Galiausiai uždarykite failą ir atidarykite jį, kad įsitikintumėte, jog viskas išsaugota teisingai. Kiekvienas jūsų CSV dalis turėtų būti padalinta į savo failą tuo pačiu pavadinimu, kaip ir jūsų originalus failas, tačiau su .CSV plėtiniu.

StringIO = io.stringio (myfile.read ())
rašytojas = csv.Writer (Stringio)
rašytojas = csv.Writer (stringio, delimiter = ',
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) StringIO = io.stringio (myfile.read ()) rašytojas = csv.Writer (Stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) StringIO = io.stringio (myfile.read ()) rašytojas = csv.Writer (Stringio) rašytojas = csv.Writer (stringio, delimiter = ',’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

„Python“ padalino CSV failą į fabriką.py

Kaip padalyti CSV naudojant „Python“? Kaip padalyti CSV Python? Padalinkite CSV arba kablelius atskirtas vertes (CSV), pagrįstus stulpelių antraštėmis, naudojant „Python“, duomenų mokslą ir „Excel“ formules, makrokomandas ir VBA įrankius keliuose darbalapiuose. Funkcija „Tokenize ()“ gali padėti padalyti CSV eilutę į atskirus žetonus.

„Excel“ yra viena iš labiausiai naudojamų programinės įrangos įrankių duomenų analizei. Komplekte yra daugybė funkcijų, kurių nepalaiko „Python“ ir kitos programavimo kalbos. Kadangi „Excel“ yra vienas iš labiausiai naudojamų duomenų analizės įrankių, svarbu jį integruoti į „Python“, nes gali būti, kad kai kurie vartotojai, labiau susipažinę su „Excel“, nei su bet kuria kita programavimo kalba, įskaitant „Python“.

Šiame vadove jūs sužinosite, kaip išsaugoti CSV failą kaip kelis mažus failus „Python“. Iš vieno failo iš vieno failo išsaugosite failus kaip atskiras duomenų dalis į kelis naujus failus.

CSV modulį galite naudoti norėdami skaityti ir rašyti CSV failus. Taip pat naudosite eilutes, kurios padarys „Python“ daug greičiau ir lengviau, nei naudojant „Excel“ formules ir makrokomandas. CSV modulis yra tiek „Python 2“, tiek „Python 3“ versijose.

Kaip padalyti CSV failus su „Python“? Kaip padalyti CSV Python? Padalinkite CSV arba kablelius atskirtas vertes (CSV), pagrįstus stulpelių antraštėmis, naudojant „Python“, duomenų mokslą ir „Excel“ formules, makrokomandas ir VBA įrankius keliuose darbalapiuose. Funkcija „Tokenize ()“ gali padėti padalyti CSV eilutę į atskirus žetonus.

Python3 padalyti CSV failą į filks.py

import CSV Myfile = Open ("Lëscht_of_Stéckbeheieren.csv", "R" "RODER = CSV.reader (Myfile, Dajiler =". "" "" ",". "" "", da gëtt eng Zeil vun der CSV CSV MYSPE = OPEN ("LËSCHT_CSVSV", "R") Reader = CSV.reamer (Myfiler = "." ass net méi Linnen. Split = Row.split ("\ t") # opgedeelt all Zeil an eng Lëscht vun Tokens andeems Dir d'Token benotzt () Funktioun. gespléckt = ["" "", "]. Pot (Split) # zerstéieren all Element vun der Lëscht vun Tokens a setzt se um Enn
Aš padalyt: spausdinti (i) # Atspausdinkite kiekvieną įrašą iš sąrašo su eilutės pertrauka. myfile.close () # Uždarykite failą, kad jį vėl būtų galima atidaryti

CSV failą galite padalyti naudodami CSV modulį, tačiau „Python 3“ jie pakeitė sąrašo saugojimo būdą. Sąrašas yra objektas 3 „Python 3“, o ne sąraše, jei paimsite kitą duomenų tipą, pavyzdžiui, STR, kur galite tai pakeisti į objekto tipą. Galite turėti netikėtą elgesį, kai dirbdami su objektais, nes eilutės vertės nepriima visomis funkcijomis.

Išvada

CSV failas yra failas, kurio vertės bus atskirtos kableliais. CSV formatas laikomas teksto formatu ir yra skirtas pateikti lentelės duomenis.

Failo tipas, turintis CSV plėtinį, turi informacijos, kurią galima importuoti į duomenų bazę, ir panašus tekstinis failas gali turėti duomenis, reikalingus lentelėms organizuoti.

Jei turite CSV failą, kurį reikia padalyti į kelis failus, galite naudoti CSV modulį. Failą galite perskaityti naudodami CSV modulį ir parašyti jį į kelis failus naudodami rašytojo modulį.

Taip pat galite perskaityti CSV failus naudodami kitas programavimo kalbas, tokias kaip „Perl“, „Ruby“, „Java“, „JavaScript“ ar PHP. Naudokite CSV modulį ir naudokite šias kalbas savo duomenims apdoroti.





Komentarai (0)

Palikite komentarą