จะแยกไฟล์ CSV เป็นชิ้นด้วย Python ได้อย่างไร?

จะแยกไฟล์ CSV เป็นชิ้นด้วย Python ได้อย่างไร?


Python แยกไฟล์ CSV เป็นชิ้น

Python เป็นภาษาการเขียนโปรแกรมที่ทรงพลังซึ่งสามารถใช้เพื่อวัตถุประสงค์ที่แตกต่างกันมากมาย หนึ่งในนั้นคือการนำเข้าไฟล์ CSV และประมวลผลเป็นชิ้น

เป้าหมายของการสอนนี้คือการสอนวิธีการนำเข้าไฟล์ CSV และใช้ฟังก์ชั่นการแยก Python กับพวกเขา คุณจะได้เรียนรู้วิธีการใช้งานด้วยสองตัวอย่าง: การแยกไฟล์ออกเป็นหลายไฟล์ตามคอลัมน์แรกและแยกไฟล์ออกเป็นชิ้น ๆ โดยพลการ

หากคุณไม่คุ้นเคยกับวิทยาศาสตร์ข้อมูลคือกระบวนการสกัดความรู้จากข้อมูลเพื่อให้สามารถใช้ในการตัดสินใจหรือกลั่นการตัดสินใจเกี่ยวกับการกระทำในอนาคต

วิธีใช้ภาษาการเขียนโปรแกรม Python เพื่อแยกไฟล์ CSV เป็นชิ้น?

คุณสามารถแยกไฟล์ด้วยโมดูล CSV โมดูลนี้เข้ากันได้กับทั้ง Python 2 และ Python 3

Python 3:

เปิดไฟล์ CSV ในเชลล์ Python คุณจะใช้ CSV Reader (ไฟล์, delimiter =) จากนั้นส่งผ่านไปยัง CSV นักเขียนและคุณจะใช้สตริงแทนไฟล์เพราะในสตริง Python 3 เป็นวัตถุ (สถานะหน่วยความจำเดียวกันเป็นรายการ) ดังนั้นเราอาจต้องเปลี่ยนวิธีการจัดเก็บข้อมูล (ประเภทการเปลี่ยนแปลง) ซึ่งจะส่งผลให้เกิดพฤติกรรมที่ไม่คาดคิด

เปิดไฟล์ใน Python3:

Python3 แยกไฟล์ CSV เป็น chunks.py

จะแยกไฟล์ CSV ด้วย Python ได้อย่างไร? จะแยกไฟล์ CSV ด้วย Python ได้อย่างไร? แยกไฟล์ข้อความออกเป็นไฟล์ขนาดเล็กหลายไฟล์ตามคอลัมน์แรกในไฟล์ข้อความ เป็นวิธีที่ง่ายง่ายและมีประสิทธิภาพในการสร้างไฟล์ CSV หรือแปลงไฟล์ที่คั่นด้วย CSV/Comma เป็นไฟล์อื่น ๆ

นี่คือวิธีที่คุณนำเข้าไฟล์ของคุณ:

นำเข้า CSV

ตอนนี้คุณกำลังจะใช้ตัวคั่น = อาร์กิวเมนต์ไปยังคลาสผู้อ่าน เป็นชุดของอักขระที่จะแยกฟิลด์ ในกรณีนี้มันเป็นเครื่องหมายจุลภาค (,) ดังนั้นผู้อ่าน (ไฟล์ delimiter = ’จะแบ่งแต่ละบรรทัดออกเป็นหลายส่วนตามคอลัมน์นั้น

reader = csv.reader (myfile, delimiter = ’,’)

สิ่งต่อไปที่ต้องทำคือการใช้คลาสนักเขียนเพื่อเขียนข้อมูลลงในไฟล์ เขียนข้อมูลโดยใช้คลาสนักเขียนและส่งผ่านไปยังวัตถุสตริงแทนไฟล์เพราะสตริงเป็นวัตถุใน Python 3 และคุณอาจมีพฤติกรรมที่ไม่คาดคิดโดยไม่ต้องเปลี่ยนประเภท ตั้งค่าแอตทริบิวต์โหมดเป็น ’เพื่อที่จะเริ่มเขียนในไฟล์นี้

writer = csv.writer (Stringio)

ขั้นตอนต่อไปคือการสั่งให้คลาสนักเขียนใช้ข้อมูลทั้งหมดในคลาส Reader เพื่อเขียนลงในไฟล์ คุณจะวนรอบแถวและเขียนแต่ละอันในไฟล์ ขั้นตอนสุดท้ายคือการใช้นักเขียนซึ่งจะเขียนแถว (หนึ่งบรรทัดของข้อมูล) ลงในไฟล์โดยใช้นักเขียน นักเขียน (แถว)

สำหรับ i, Row in Reader: #loop นี้ผ่านแต่ละแถวจากผู้อ่านและเขียนแต่ละบรรทัดลงในไฟล์ ROWS.Append (แถว)
นักเขียน (แถว) #ADD แถวที่ส่วนท้ายของไฟล์
นักเขียน (แถว) #เพิ่มแถวทั้งหมดในครั้งเดียว

ในที่สุดปิดไฟล์ของคุณและเปิดเพื่อให้แน่ใจว่าทุกอย่างถูกบันทึกอย่างถูกต้อง ควรมีชิ้นส่วนแต่ละชิ้นจาก CSV ของคุณแบ่งออกเป็นไฟล์ของตัวเองด้วยชื่อเดียวกับไฟล์ต้นฉบับของคุณ แต่มีส่วนขยายของ. csv

stringio = io.stringio (myfile.read ())
writer = csv.writer (Stringio)
writer = csv.writer (stringio, delimiter = ’,
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) stringio = io.stringio (myfile.read ()) writer = csv.writer (Stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) stringio = io.stringio (myfile.read ()) writer = csv.writer (Stringio) writer = csv.writer (stringio, delimiter = ’,’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

งูหลาม Split CSV ไฟล์เป็น ชิ้น.py

จะแยก CSV โดยใช้ งูหลาม ได้อย่างไร? จะแยก CSV ใน งูหลาม ได้อย่างไร? แยกค่า CSV หรือค่าที่คั่นด้วยเครื่องหมายจุลภาค (CSV) ขึ้นอยู่กับส่วนหัวคอลัมน์โดยใช้ งูหลาม, Data Science และ Excel Formulas, Macros และ VBA เครื่องมือในแผ่นงานหลายแผ่น ฟังก์ชั่น tokenize () สามารถช่วยให้คุณแบ่งสตริง CSV ออกเป็นโทเค็นแยกต่างหาก

Excel เป็นหนึ่งในเครื่องมือซอฟต์แวร์ที่ใช้มากที่สุดสำหรับการวิเคราะห์ข้อมูล มันมาพร้อมกับคุณสมบัติมากมายที่ไม่ได้รับการสนับสนุนจาก งูหลาม และภาษาการเขียนโปรแกรมอื่น ๆ เนื่องจาก Excel เป็นหนึ่งในเครื่องมือที่ใช้มากที่สุดสำหรับการวิเคราะห์ข้อมูลการรวมเข้ากับ งูหลาม เป็นสิ่งสำคัญเนื่องจากอาจมีผู้ใช้บางคนที่คุ้นเคยกับ Excel มากกว่าภาษาการเขียนโปรแกรมอื่น ๆ รวมถึง งูหลาม

ในบทช่วยสอนนี้คุณจะได้เรียนรู้วิธีบันทึกไฟล์ CSV เป็นไฟล์ขนาดเล็กหลายไฟล์ใน งูหลาม คุณจะบันทึกไฟล์เป็นชิ้นข้อมูลแยกต่างหากจากไฟล์หนึ่งไฟล์เป็นไฟล์ใหม่หลายไฟล์

คุณสามารถใช้โมดูล CSV เพื่ออ่านและเขียนไฟล์ CSV นอกจากนี้คุณยังจะใช้สตริงที่จะทำให้การใช้ งูหลาม เร็วขึ้นและง่ายกว่าการใช้สูตร Excel และมาโคร โมดูล CSV มีอยู่ในทั้ง งูหลาม 2 และ งูหลาม 3 เวอร์ชัน

จะแยกไฟล์ CSV ด้วย งูหลาม ได้อย่างไร? จะแยก CSV ใน งูหลาม ได้อย่างไร? แยกค่า CSV หรือค่าที่คั่นด้วยเครื่องหมายจุลภาค (CSV) ขึ้นอยู่กับส่วนหัวคอลัมน์โดยใช้ งูหลาม, Data Science และ Excel Formulas, Macros และ VBA เครื่องมือในแผ่นงานหลายแผ่น ฟังก์ชั่น tokenize () สามารถช่วยให้คุณแบ่งสตริง CSV ออกเป็นโทเค็นแยกต่างหาก

งูหลาม3 แยกไฟล์ CSV เป็น ชิ้น.py

CSV MyFile = Open ("list_of_భాగాలు.csv", "r") reader = csv.reader (myfile, delimiter = " ఇక పంక్తులు లేవు. split = row.split ("\ t") # టోకనైజ్ () ఫంక్షన్ను ఉపయోగించి ప్రతి వరుసను టోకెన్ల జాబితాగా విభజించండి. split = ["", ","]. చేరండి (స్ప్లిట్) # టోకెన్ల జాబితాలోని ప్రతి మూలకాన్ని నాశనం చేసి, చివరిలో ఉంచండి
สำหรับ i in split: print (i) # พิมพ์แต่ละรายการจากรายการด้วยการแบ่งบรรทัด myfile.close () # ปิดไฟล์เพื่อให้สามารถเปิดได้อีกครั้ง

คุณสามารถแยกไฟล์ CSV โดยใช้โมดูล CSV แต่ใน งูหลาม 3 พวกเขาเปลี่ยนวิธีการจัดเก็บรายการ รายการเป็นวัตถุใน งูหลาม 3 แทนที่จะเป็นรายการหากคุณใช้ประเภทข้อมูลอื่นเช่น STR ที่คุณสามารถเปลี่ยนเป็นประเภทวัตถุ คุณอาจมีพฤติกรรมที่ไม่คาดคิดเมื่อทำงานกับวัตถุเนื่องจากค่าสตริงไม่ได้รับการยอมรับจากฟังก์ชั่นทั้งหมด

บทสรุป

ไฟล์ CSV เป็นไฟล์ที่มีค่าคั่นด้วยเครื่องหมายจุลภาค รูปแบบ CSV ถือเป็นรูปแบบข้อความและมีวัตถุประสงค์เพื่อให้ข้อมูลตาราง

ประเภทไฟล์ซึ่งมีส่วนขยาย CSV มีข้อมูลที่สามารถนำเข้าสู่ฐานข้อมูลและไฟล์ข้อความที่คล้ายกันสามารถนำข้อมูลที่จำเป็นในการจัดระเบียบตาราง

หากคุณมีไฟล์ CSV ที่ต้องแบ่งออกเป็นหลายไฟล์คุณสามารถใช้โมดูล CSV ได้ คุณสามารถอ่านไฟล์โดยใช้โมดูล CSV และเขียนลงในหลายไฟล์โดยใช้โมดูลนักเขียน

นอกจากนี้คุณยังสามารถอ่านไฟล์ CSV โดยใช้ภาษาการเขียนโปรแกรมอื่น ๆ เช่น Perl, Ruby, Java, JavaScript หรือ PHP ใช้โมดูล CSV และใช้ภาษาเหล่านั้นเพื่อประมวลผลข้อมูลของคุณ





ความคิดเห็น (0)

ทิ้งข้อความไว้