Paano hatiin ang CSV file sa mga chunks na may python?

Ang Python ay isang malakas na wika ng programming na maaaring magamit para sa maraming iba't ibang mga layunin. Ang isa sa mga ito ay ang pag -import ng mga file ng CSV at pagproseso ng mga ito sa mga chunks.
Paano hatiin ang CSV file sa mga chunks na may python?


Python split CSV file sa mga chunks

Ang Python ay isang malakas na wika ng programming na maaaring magamit para sa maraming iba't ibang mga layunin. Ang isa sa mga ito ay ang pag -import ng mga file ng CSV at pagproseso ng mga ito sa mga chunks.

Ang layunin ng tutorial na ito ay magturo sa iyo kung paano mag -import ng mga file ng CSV at gamitin ang function ng Python split sa kanila. Malalaman mo kung paano gamitin ito gamit ang dalawang halimbawa: paghahati ng isang file sa maraming mga file batay sa unang haligi at paghahati ng isang file sa mga di -makatwirang chunks.

Kung hindi ka pamilyar sa kung ano ang agham ng data, ito ang proseso ng pagkuha ng kaalaman mula sa data upang magamit ito sa paggawa o pagpino ng mga pagpapasya tungkol sa mga aksyon sa hinaharap.

Paano gamitin ang wika ng programming ng python upang hatiin ang mga file ng CSV sa mga chunks?

Maaari kang maghiwalay ng mga file gamit ang CSV module. Ang module na ito ay katugma sa parehong Python 2 at Python 3.

Python 3:

Magbukas ng isang CSV file sa isang Python shell. Gagamitin mo ang CSV. mambabasa (file, delimiter =), pagkatapos ay ipasa ito sa CSV. manunulat at gagamitin mo ang string sa halip na ang file dahil sa mga string ng Python 3 ay mga bagay (parehong katayuan ng memorya tulad ng mga listahan) kaya kailangan nating baguhin ang paraan ng pag -imbak ng data (uri ng pagbabago) na magreresulta sa hindi inaasahang pag -uugali.

Magbukas ng isang file sa Python3:

Python3 Split CSV file sa chunks.py

Paano hatiin ang mga file ng CSV na may python? Paano hatiin ang isang CSV file na may Python? Paghahati ng isang text file sa maraming mas maliit na mga file batay sa unang haligi sa text file. Ito ay isang simple, madali, at malakas na paraan upang lumikha ng mga file ng CSV o i -convert ang mga file na CSV/Comma na tinanggal sa iba pa.

Ito ay kung paano mo i -import ang iyong file:

I -import ang CSV

Ngayon gagamitin mo ang delimiter = argumento sa klase ng mambabasa. Ito ay isang hanay ng mga character na maghihiwalay sa mga patlang. Sa kasong ito, ito ay isang kuwit (,). Kaya ang mambabasa (file, delimiter = ', ay hahatiin ang bawat linya sa maraming bahagi batay sa haligi na iyon.

mambabasa = csv.reader (myfile, delimiter = ',')

Ang susunod na bagay na dapat gawin ay ang paggamit ng klase ng manunulat upang isulat ang data sa isang file. Isulat ang data gamit ang klase ng manunulat at ipasa ito sa isang bagay na string sa halip na ang file dahil ang mga string ay mga bagay sa Python 3 at maaaring mayroon kang hindi inaasahang pag -uugali nang hindi binabago ang uri. Itakda ang katangian ng mode nito bilang 'upang simulan ang pagsusulat sa file na ito.

manunulat = csv.writer (stringio)

Ang susunod na hakbang ay upang turuan ang klase ng manunulat na gamitin ang lahat ng data sa klase ng mambabasa upang isulat ito sa file. Mag -loop ka sa mga hilera at isusulat ang bawat isa sa file. Ang huling hakbang ay ang paggamit ng mga manunulat, na magsusulat ng isang hilera (isang linya ng data) sa isang file gamit ang manunulat. Mga manunulat (hilera).

Para sa ako, hilera sa mambabasa: #Ang loop ay dumadaan sa bawat hilera mula sa mambabasa at isinusulat ang bawat linya sa isang file. mga hilera.append (hilera)
Mga manunulat (hilera) #Add isang hilera sa dulo ng file.
Mga manunulat (hilera) #Add lahat ng mga hilera nang sabay -sabay.

Sa wakas, isara ang iyong file at buksan ito upang matiyak na ang lahat ay nai -save nang tama. Dapat itong magkaroon ng bawat tipak mula sa iyong CSV split sa sarili nitong file na may parehong pangalan tulad ng iyong orihinal na file, ngunit may isang extension ng .csv.

stringio = io.stringio (myfile.read ())
manunulat = csv.writer (stringio)
manunulat = csv.writer (stringio, delimiter = ',
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) stringio = io.stringio (myfile.read ()) manunulat = csv.writer (stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) stringio = io.stringio (myfile.read ()) manunulat = csv.writer (stringio) manunulat = csv.writer (stringio, delimiter = ',’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

Python split CSV file sa chunks.py

Paano hatiin ang isang CSV gamit ang Python? Paano hatiin ang isang CSV sa Python? Hatiin ang isang CSV o mga hiwalay na halaga ng comma (CSV) batay sa mga header ng haligi gamit ang Python, Data Science, at Excel formula, macros, at mga tool ng VBA sa maraming mga worksheet. Ang pag -andar ng tokenize () ay makakatulong sa iyo na hatiin ang isang string ng CSV sa magkahiwalay na mga token.

Ang Excel ay isa sa mga pinaka ginagamit na tool ng software para sa pagsusuri ng data. Ito ay may maraming mga tampok na hindi suportado ng Python at iba pang mga wika sa programming. Bilang ang Excel ay isa sa mga pinaka ginagamit na tool para sa pagsusuri ng data, ang pagsasama nito sa Python ay mahalaga dahil maaaring may ilang mga gumagamit na mas pamilyar sa Excel kaysa sa anumang iba pang wika ng programming, kabilang ang Python.

Sa tutorial na ito, matututunan mo kung paano makatipid ng isang CSV file bilang maraming maliliit na file sa Python. I -save mo ang mga file bilang hiwalay na mga chunks ng data mula sa isang file sa maraming mga bagong file.

Maaari mong gamitin ang module ng CSV upang mabasa at isulat ang mga file ng CSV. Gumagamit ka rin ng mga string na gagawa ng paggamit ng Python nang mas mabilis at mas madali kaysa sa paggamit ng mga formula ng Excel at macros. Ang module ng CSV ay magagamit sa parehong mga bersyon ng Python 2 at Python 3.

Paano hatiin ang mga file ng CSV na may python? Paano hatiin ang isang CSV sa Python? Hatiin ang isang CSV o mga hiwalay na halaga ng comma (CSV) batay sa mga header ng haligi gamit ang Python, Data Science, at Excel formula, macros, at mga tool ng VBA sa maraming mga worksheet. Ang pag -andar ng tokenize () ay makakatulong sa iyo na hatiin ang isang string ng CSV sa magkahiwalay na mga token.

Python3 Split CSV file sa chunks.py

Воридшавӣ CSV MyFile = Кушодашуда ("List_ov__ofk_VICHER" дигар хатҳо нест. Split = Revit ("\ t") # ҳар як сатрро бо истифодаи функсияҳои Tokenize () тақсим мекунад. тақсим = ["" "," "].
Para sa I Sa Split: I -print (i) # I -print ang bawat entry mula sa listahan na may isang linya ng pahinga. myfile.close () # isara ang file upang mabuksan ulit ito

Maaari mong hatiin ang isang CSV file gamit ang CSV module ngunit sa Python 3 binago nila ang paraan ng pag -imbak ng isang listahan. Ang isang listahan ay isang bagay sa Python 3 sa halip na isang listahan kung kumuha ka ng isa pang uri ng data tulad ng STR kung saan maaari mong baguhin iyon sa isang uri ng bagay. Maaari kang magkaroon ng hindi inaasahang pag -uugali kapag nagtatrabaho sa mga bagay dahil ang mga halaga ng string ay hindi tinatanggap ng lahat ng mga pag -andar.

Konklusyon

Ang isang CSV file ay isang file na ang mga halaga ay ihiwalay ng mga koma. Ang format na CSV ay itinuturing na isang format ng teksto at inilaan upang magbigay ng data ng tabular.

Ang uri ng file, na mayroong extension ng CSV, ay naglalaman ng impormasyon na maaaring mai -import sa isang database, at ang isang katulad na file ng teksto ay maaaring magdala ng data na kinakailangan upang ayusin ang mga talahanayan.

Kung mayroon kang isang CSV file na kailangang hatiin sa maraming mga file, maaari mong gamitin ang module ng CSV. Maaari mong basahin ang file gamit ang module ng CSV at isulat ito sa maraming mga file gamit ang module ng manunulat.

Maaari mo ring basahin ang mga file ng CSV gamit ang iba pang mga wika sa programming tulad ng Perl, Ruby, Java, JavaScript, o PHP. Gamitin ang module ng CSV at gamitin ang mga wikang iyon upang maproseso ang iyong data.





Mga komento (0)

Mag-iwan ng komento