چگونه پرونده CSV را با پایتون تقسیم کنیم؟

چگونه پرونده CSV را با پایتون تقسیم کنیم؟

پایتون پرونده های CSV را به تکه های تقسیم می کند

پایتون یک زبان برنامه نویسی قدرتمند است که می تواند برای اهداف مختلف مورد استفاده قرار گیرد. یکی از آنها وارد کردن پرونده های CSV و پردازش آنها در تکه ها است.

هدف از این آموزش این است که به شما آموزش نحوه واردات پرونده های CSV و استفاده از عملکرد تقسیم پایتون بر روی آنها بیاموزد. شما یاد می گیرید که چگونه از آن با دو مثال استفاده کنید: تقسیم یک فایل به چندین پرونده بر اساس ستون اول و تقسیم یک پرونده به بخش های دلخواه.

اگر با علوم داده آشنا نیستید ، این روند استخراج دانش از داده ها است تا بتواند در تصمیم گیری یا تصفیه در مورد اقدامات آینده مورد استفاده قرار گیرد.

چگونه می توان از زبان برنامه نویسی پایتون برای تقسیم پرونده های CSV به تکه ها استفاده کرد؟

می توانید پرونده ها را با ماژول CSV تقسیم کنید. این ماژول با پایتون 2 و پایتون 3 سازگار است.

پایتون 3:

یک فایل CSV را در یک پوسته پایتون باز کنید. شما از CSV استفاده خواهید کرد. خواننده (پرونده ، تعیین کننده =) ، سپس آن را به CSV منتقل کنید. نویسنده و شما به جای پرونده از رشته استفاده خواهید کرد زیرا در پایتون 3 رشته اشیاء (همان وضعیت حافظه لیست ها) هستند ، بنابراین ممکن است ما مجبور شویم نحوه ذخیره داده ها (نوع تغییر) را تغییر دهیم که منجر به رفتار غیر منتظره شود.

یک پرونده را در Python3 باز کنید:

Python3 پرونده CSV را به chunks.py تقسیم می کند

چگونه پرونده های CSV را با پایتون تقسیم کنیم؟ چگونه یک فایل CSV را با پایتون تقسیم کنیم؟ یک فایل متنی را بر اساس ستون اول در پرونده متنی به چندین پرونده کوچکتر تقسیم می کند. این یک روش ساده ، آسان و قدرتمند برای ایجاد فایلهای CSV یا تبدیل پرونده های محدود CSV/کاما به موارد دیگر است.

اینگونه است که پرونده خود را وارد می کنید:

واردات CSV

اکنون می خواهید از DELIMITER = استدلال در کلاس خواننده استفاده کنید. این مجموعه ای از شخصیت ها است که زمینه ها را از هم جدا می کند. در این حالت ، این کاما (،) است. بنابراین خواننده (پرونده ، DELIMITER = '، هر خط را بر اساس آن ستون به چند قسمت تقسیم می کند.

خواننده = csv.reader (myFile ، Delimiter = "،")

نکته بعدی که باید انجام شود استفاده از کلاس نویسنده برای نوشتن داده ها در یک پرونده است. داده ها را با استفاده از کلاس نویسنده بنویسید و به جای پرونده آن را به یک شیء رشته منتقل کنید زیرا رشته ها در پایتون 3 اشیاء هستند و ممکن است بدون تغییر نوع رفتار غیر منتظره داشته باشید. ویژگی حالت خود را به عنوان تنظیم کنید تا شروع به نوشتن در این پرونده کند.

نویسنده = csv.writer (stringio)

مرحله بعدی این است که به کلاس نویسنده دستور دهید تا از تمام داده های موجود در کلاس خواننده استفاده کند تا آن را در پرونده بنویسد. شما از طریق ردیف ها حلقه خواهید کرد و هرکدام را در پرونده می نویسید. آخرین مرحله استفاده از نویسندگان است که یک ردیف (یک خط داده) را در یک پرونده با استفاده از نویسنده می نویسند. نویسندگان (ردیف).

برای من ، ردیف در خواننده: #این حلقه از هر سطر از خواننده عبور می کند و هر خط را در یک پرونده می نویسد. Rows.Append (ردیف)
نویسندگان (ROW) ##ADD یک ردیف در انتهای پرونده.
نویسندگان (ردیف) #همه ردیف ها را به طور همزمان.

در آخر ، پرونده خود را ببندید و آن را باز کنید تا مطمئن شوید همه چیز به درستی ذخیره شده است. این باید هر تکه از CSV شما را با همان نام پرونده اصلی خود به پرونده خود تقسیم کند ، اما با گسترش .csv.

stringio = io.stringio (myfile.read ())
نویسنده = csv.writer (stringio)
نویسنده = csv.writer (stringio ، delimiter = '،
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) stringio = io.stringio (myfile.read ()) نویسنده = csv.writer (stringio) writer = csv.writer(stringIO, delimiter=’) writerow(row) stringio = io.stringio (myfile.read ()) نویسنده = csv.writer (stringio) نویسنده = csv.writer (stringio ، delimiter = '،’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

پایتون پرونده CSV را به تکه.py تقسیم کرد

چگونه می توان CSV را با استفاده از پایتون تقسیم کرد؟ چگونه می توان CSV را در پایتون تقسیم کرد؟ مقادیر CSV یا جدا شده از کاما (CSV) را بر اساس هدرهای ستون با استفاده از پایتون ، علوم داده و فرمول های اکسل ، ماکرو و ابزارهای VBA در صفحات مختلف تقسیم کنید. عملکرد Tokenize () می تواند به شما در تقسیم یک رشته CSV در نشانه های جداگانه کمک کند.

اکسل یکی از پرکاربردترین ابزارهای نرم افزاری برای تجزیه و تحلیل داده ها است. این ویژگی ها با ویژگی های زیادی همراه است که توسط پایتون و سایر زبانهای برنامه نویسی پشتیبانی نمی شود. از آنجا که اکسل یکی از ابزارهای مورد استفاده برای تجزیه و تحلیل داده ها است ، ادغام آن با پایتون مهم است زیرا ممکن است برخی از کاربرانی که بیشتر با Excel آشنا هستند نسبت به هر زبان برنامه نویسی دیگر ، از جمله پایتون.

در این آموزش ، شما می خواهید یاد بگیرید که چگونه یک فایل CSV را به عنوان چندین پرونده کوچک در پایتون ذخیره کنید. شما می خواهید پرونده ها را به عنوان بخش های جداگانه از یک پرونده در چندین پرونده جدید ذخیره کنید.

می توانید از ماژول CSV برای خواندن و نوشتن پرونده های CSV استفاده کنید. همچنین از رشته هایی استفاده خواهید کرد که استفاده از پایتون را بسیار سریعتر و آسان تر از استفاده از فرمول های اکسل و ماکروها می کند. ماژول CSV در هر دو نسخه پیتون 2 و پیتون 3 موجود است.

چگونه پرونده های CSV را با پایتون تقسیم کنیم؟ چگونه می توان CSV را در پایتون تقسیم کرد؟ مقادیر CSV یا جدا شده از کاما (CSV) را بر اساس هدرهای ستون با استفاده از پایتون ، علوم داده و فرمول های اکسل ، ماکرو و ابزارهای VBA در صفحات مختلف تقسیم کنید. عملکرد Tokenize () می تواند به شما در تقسیم یک رشته CSV در نشانه های جداگانه کمک کند.

پیتون3 پرونده CSV را به تکه.py تقسیم می کند

import csv myfile = avatud ("list_of_tükid.csv", "r") lugeja = csv.reader (myfile, delimiter = ","), samas kui true: rida = järgmine (lugeja) # jätkab CSV -failist rea lugemist, kuni sinna kuni CSV pole enam read. Split = rida.split ("\ t") # Jagage iga rea ​​märkide loendiks funktsiooni Tokenize () abil. Split = ["", ","]. Liituge (Split) # Hävitage iga märgide loendi elementi ja pange need lõpus
برای من در تقسیم: چاپ (i) # هر ورودی را از لیست با یک خط خط چاپ کنید. myfile.close () # پرونده را ببندید تا دوباره باز شود

شما می توانید یک فایل CSV را با استفاده از ماژول CSV تقسیم کنید اما در پایتون 3 نحوه ذخیره لیست را تغییر دادند. اگر نوع داده دیگری مانند STR را انتخاب کنید ، یک لیست در پیتون 3 به جای لیست است که می توانید آن را به یک نوع شی تغییر دهید. ممکن است هنگام کار با اشیاء رفتار غیر منتظره داشته باشید زیرا مقادیر رشته توسط همه توابع پذیرفته نمی شوند.

نتیجه

پرونده CSV پرونده ای است که مقادیر آن توسط کاما از هم جدا می شود. قالب CSV یک قالب متن در نظر گرفته شده است و در نظر گرفته شده است تا داده های جدولی را ارائه دهد.

نوع پرونده ، که دارای پسوند CSV است ، حاوی اطلاعاتی است که می تواند به یک پایگاه داده وارد شود و یک فایل متنی مشابه می تواند داده های مورد نیاز برای سازماندهی جداول را حمل کند.

اگر یک فایل CSV دارید که باید به چندین پرونده تقسیم شود ، می توانید از ماژول CSV استفاده کنید. می توانید پرونده را با استفاده از ماژول CSV بخوانید و با استفاده از ماژول نویسنده آن را در چندین پرونده بنویسید.

همچنین می توانید پرونده های CSV را با استفاده از سایر زبانهای برنامه نویسی مانند Perl ، Ruby ، ​​Java ، JavaScript یا PHP بخوانید. از ماژول CSV استفاده کنید و از آن زبانها برای پردازش داده های خود استفاده کنید.





نظرات (0)

پیام بگذارید