পাইথনের সাথে সিএসভি ফাইল কীভাবে খণ্ডগুলিতে বিভক্ত করবেন?

পাইথনের সাথে সিএসভি ফাইল কীভাবে খণ্ডগুলিতে বিভক্ত করবেন?

পাইথন সিএসভি ফাইলগুলিকে খণ্ডগুলিতে বিভক্ত করে

পাইথন একটি শক্তিশালী প্রোগ্রামিং ভাষা যা বিভিন্ন উদ্দেশ্যে ব্যবহার করা যেতে পারে। এর মধ্যে একটি হ'ল সিএসভি ফাইল আমদানি করা এবং সেগুলি খণ্ডগুলিতে প্রক্রিয়াজাতকরণ।

এই টিউটোরিয়ালটির লক্ষ্য হ'ল কীভাবে সিএসভি ফাইলগুলি আমদানি করতে এবং তাদের উপর পাইথন স্প্লিট ফাংশনটি ব্যবহার করতে হয় তা শেখানো। আপনি কীভাবে এটি দুটি উদাহরণের সাথে ব্যবহার করবেন তা শিখবেন: প্রথম কলামের উপর ভিত্তি করে একাধিক ফাইলগুলিতে একটি ফাইল বিভক্ত করা এবং স্বেচ্ছাসেবী খণ্ডগুলিতে একটি ফাইল বিভক্ত করা।

আপনি যদি ডেটা সায়েন্সের সাথে পরিচিত না হন তবে এটি ডেটা থেকে জ্ঞান আহরণের প্রক্রিয়া যাতে এটি ভবিষ্যতের ক্রিয়া সম্পর্কে সিদ্ধান্তগুলি তৈরি বা পরিমার্জনে ব্যবহার করা যেতে পারে।

সিএসভি ফাইলগুলিকে খণ্ডগুলিতে বিভক্ত করতে পাইথন প্রোগ্রামিং ভাষা কীভাবে ব্যবহার করবেন?

আপনি সিএসভি মডিউল দিয়ে ফাইলগুলি বিভক্ত করতে পারেন। এই মডিউলটি পাইথন 2 এবং পাইথন 3 উভয়ের সাথে সামঞ্জস্যপূর্ণ।

পাইথন 3:

পাইথন শেলটিতে একটি সিএসভি ফাইল খুলুন। আপনি সিএসভি ব্যবহার করবেন। পাঠক (ফাইল, ডিলিমিটার =), তারপরে এটি সিএসভিতে পাস করুন। লেখক এবং আপনি ফাইলের পরিবর্তে স্ট্রিং ব্যবহার করবেন কারণ পাইথন 3 স্ট্রিংগুলিতে অবজেক্টস (তালিকার মতো একই মেমরির স্থিতি) তাই আমাদের ডেটা সংরক্ষণের (পরিবর্তনের ধরণ) যেভাবে পরিবর্তন করতে হবে যার ফলে অপ্রত্যাশিত আচরণ হতে পারে।

পাইথন 3 এ একটি ফাইল খুলুন:

পাইথন 3 বিভক্ত সিএসভি ফাইলটি Chunks.py এ বিভক্ত

পাইথন দিয়ে সিএসভি ফাইলগুলি কীভাবে বিভক্ত করবেন? পাইথন সহ একটি সিএসভি ফাইল কীভাবে বিভক্ত করবেন? পাঠ্য ফাইলের প্রথম কলামের উপর ভিত্তি করে একাধিক ছোট ফাইলগুলিতে একটি পাঠ্য ফাইল বিভক্ত করুন। এটি সিএসভি ফাইল তৈরি করতে বা সিএসভি/কমা সীমিত ফাইলগুলি অন্যগুলিতে রূপান্তর করার একটি সহজ, সহজ এবং শক্তিশালী উপায়।

এইভাবে আপনি আপনার ফাইলটি আমদানি করেন:

আমদানি সিএসভি

এখন আপনি পাঠক শ্রেণিতে ডিলিমিটার = আর্গুমেন্ট ব্যবহার করতে যাচ্ছেন। এটি চরিত্রগুলির একটি সেট যা ক্ষেত্রগুলি পৃথক করবে। এই ক্ষেত্রে, এটি একটি কমা (,)। সুতরাং পাঠক (ফাইল, ডিলিমিটার = ’, প্রতিটি লাইন সেই কলামের উপর ভিত্তি করে একাধিক অংশে বিভক্ত করবে।

পাঠক = সিএসভি.রিডার (মাইফিল, ডিলিমিটার = ’,’)

পরবর্তী কাজটি হ'ল লেখক শ্রেণিটি কোনও ফাইলের মধ্যে ডেটা লেখার জন্য ব্যবহার করা। লেখক শ্রেণি ব্যবহার করে ডেটা লিখুন এবং এটি ফাইলের পরিবর্তে স্ট্রিং অবজেক্টে প্রেরণ করুন কারণ স্ট্রিংগুলি পাইথন 3 -এ অবজেক্ট এবং আপনার ধরণের পরিবর্তন না করেই অপ্রত্যাশিত আচরণ থাকতে পারে। এর মোড অ্যাট্রিবিউটটি সেট করুন ’যাতে এটি এই ফাইলটিতে লেখা শুরু করে।

লেখক = সিএসভি। রাইটার (স্ট্রিংও)

পরবর্তী পদক্ষেপটি হ'ল লেখক শ্রেণিকে ফাইলটিতে লেখার জন্য পাঠক শ্রেণীর সমস্ত ডেটা ব্যবহার করার নির্দেশ দেওয়া। আপনি সারিগুলি দিয়ে লুপ করবেন এবং প্রতিটি ফাইলটিতে লিখবেন। শেষ পদক্ষেপটি হ'ল লেখক ব্যবহার করা, যা লেখককে ব্যবহার করে একটি ফাইলে একটি সারি (ডেটা এক লাইন) লিখবে। লেখক (সারি)।

আমার জন্য, রিডারে সারি: #এই লুপটি পাঠকের কাছ থেকে প্রতিটি সারির মধ্য দিয়ে যায় এবং প্রতিটি লাইন একটি ফাইলে লেখেন। সারি.পেন্ড (সারি)
লেখক (সারি) #ফাইলের শেষে একটি সারি যুক্ত করুন।
লেখক (সারি) #একবারে সমস্ত সারি যুক্ত করুন।

অবশেষে, আপনার ফাইলটি বন্ধ করুন এবং সবকিছু সঠিকভাবে সংরক্ষণ করা হয়েছে তা নিশ্চিত করার জন্য এটি খুলুন। এটিতে আপনার সিএসভি থেকে প্রতিটি অংশটি আপনার মূল ফাইলের মতো একই নামের সাথে নিজস্ব ফাইলটিতে বিভক্ত হওয়া উচিত, তবে .csv এর এক্সটেনশন সহ।

স্ট্রিংও = io.stringio (myfile.read ())
লেখক = সিএসভি। রাইটার (স্ট্রিংও)
লেখক = সিএসভি। রাইটার (স্ট্রিংও, ডিলিমিটার = ’,
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) স্ট্রিংও = io.stringio (myfile.read ()) লেখক = সিএসভি। রাইটার (স্ট্রিংও) writer = csv.writer(stringIO, delimiter=’) writerow(row) স্ট্রিংও = io.stringio (myfile.read ()) লেখক = সিএসভি। রাইটার (স্ট্রিংও) লেখক = সিএসভি। রাইটার (স্ট্রিংও, ডিলিমিটার = ’,’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

পাইথন সিএসভি ফাইল বিভক্ত করুন ncks.py

পাইথন ব্যবহার করে কীভাবে একটি সিএসভি বিভক্ত করবেন? পাইথনে কীভাবে একটি সিএসভি বিভক্ত করবেন? একাধিক ওয়ার্কশিট জুড়ে পাইথন, ডেটা সায়েন্স এবং এক্সেল সূত্র, ম্যাক্রো এবং ভিবিএ সরঞ্জাম ব্যবহার করে কলাম শিরোনামের উপর ভিত্তি করে একটি সিএসভি বা কমা-বিচ্ছিন্ন মান (সিএসভি) বিভক্ত করুন। টোকেনাইজ () ফাংশন আপনাকে একটি সিএসভি স্ট্রিংকে পৃথক টোকেনে বিভক্ত করতে সহায়তা করতে পারে।

এক্সেল ডেটা বিশ্লেষণের জন্য অন্যতম ব্যবহৃত সফ্টওয়্যার সরঞ্জাম। এটি প্রচুর বৈশিষ্ট্য নিয়ে আসে যা পাইথন এবং অন্যান্য প্রোগ্রামিং ভাষা দ্বারা সমর্থিত নয়। যেহেতু এক্সেল ডেটা বিশ্লেষণের জন্য অন্যতম ব্যবহৃত সরঞ্জাম, এটি পাইথনের সাথে সংহত করা গুরুত্বপূর্ণ কারণ এমন কিছু ব্যবহারকারী থাকতে পারে যারা পাইথন সহ অন্য কোনও প্রোগ্রামিং ভাষার চেয়ে এক্সেলের সাথে বেশি পরিচিত।

এই টিউটোরিয়ালে, আপনি পাইথনে একাধিক ছোট ফাইল হিসাবে কোনও সিএসভি ফাইল কীভাবে সংরক্ষণ করবেন তা শিখতে যাচ্ছেন। আপনি ফাইলগুলি একটি ফাইল থেকে ডেটাগুলির পৃথক অংশ হিসাবে একাধিক নতুন ফাইলগুলিতে সংরক্ষণ করতে যাচ্ছেন।

আপনি সিএসভি ফাইলগুলি পড়তে এবং লিখতে সিএসভি মডিউলটি ব্যবহার করতে পারেন। আপনি স্ট্রিংগুলিও ব্যবহার করবেন যা পাইথনকে এক্সেল সূত্র এবং ম্যাক্রো ব্যবহারের চেয়ে আরও দ্রুত এবং সহজ করে তুলবে। সিএসভি মডিউলটি পাইথন 2 এবং পাইথন 3 সংস্করণ উভয় ক্ষেত্রেই উপলব্ধ।

পাইথন দিয়ে সিএসভি ফাইলগুলি কীভাবে বিভক্ত করবেন? পাইথনে কীভাবে একটি সিএসভি বিভক্ত করবেন? একাধিক ওয়ার্কশিট জুড়ে পাইথন, ডেটা সায়েন্স এবং এক্সেল সূত্র, ম্যাক্রো এবং ভিবিএ সরঞ্জাম ব্যবহার করে কলাম শিরোনামের উপর ভিত্তি করে একটি সিএসভি বা কমা-বিচ্ছিন্ন মান (সিএসভি) বিভক্ত করুন। টোকেনাইজ () ফাংশন আপনাকে একটি সিএসভি স্ট্রিংকে পৃথক টোকেনে বিভক্ত করতে সহায়তা করতে পারে।

পাইথন 3 বিভক্ত সিএসভি ফাইলটি Chunks.py এ বিভক্ত

সিএসভি মাইফাইল আমদানি করুন = ওপেন ("তালিকা_অফ_চঙ্কস.সিএসভি", "আর") রিডার = সিএসভি.রেডার (মাইফাইল, ডিলিমিটার = ",") সত্য: সারি = পরবর্তী (পাঠক) # সেখানে না হওয়া পর্যন্ত সিএসভি ফাইল থেকে একটি লাইন পড়তে রাখে আর কোনও লাইন নেই। বিভক্ত = সারি.স্প্লিট ("\ টি") # টোকেনাইজ () ফাংশনটি ব্যবহার করে প্রতিটি সারি টোকেনের তালিকায় বিভক্ত করুন। বিভক্ত = ["", ","]। যোগ দিন (বিভক্ত) # টোকেনের তালিকার প্রতিটি উপাদানকে ধ্বংস করুন এবং এগুলি শেষে রাখুন
আমি বিভক্ত হওয়ার জন্য: মুদ্রণ করুন (i) # লাইন বিরতি দিয়ে তালিকা থেকে প্রতিটি এন্ট্রি মুদ্রণ করুন। myfile.close () # ফাইলটি বন্ধ করুন যাতে এটি আবার খোলা যায়

আপনি সিএসভি মডিউলটি ব্যবহার করে একটি সিএসভি ফাইল বিভক্ত করতে পারেন তবে পাইথন 3 এ তারা একটি তালিকা সংরক্ষণের পদ্ধতি পরিবর্তন করেছে। একটি তালিকা তালিকার পরিবর্তে পাইথন 3 -এ একটি অবজেক্ট যদি আপনি স্ট্রেশের মতো অন্য কোনও ডেটা টাইপ করেন যেখানে আপনি এটিকে কোনও বস্তুর ধরণে পরিবর্তন করতে পারেন। স্ট্রিং মানগুলি সমস্ত ফাংশন দ্বারা গৃহীত না হওয়ায় অবজেক্টগুলির সাথে কাজ করার সময় আপনার অপ্রত্যাশিত আচরণ থাকতে পারে।

উপসংহার

একটি সিএসভি ফাইল এমন একটি ফাইল যার মানগুলি কমা দ্বারা পৃথক করা হবে। সিএসভি ফর্ম্যাটটি একটি পাঠ্য বিন্যাস হিসাবে বিবেচিত হয় এবং এটি সারণী ডেটা সরবরাহ করার উদ্দেশ্যে।

সিএসভি এক্সটেনশনযুক্ত ফাইলের ধরণটিতে এমন তথ্য রয়েছে যা একটি ডাটাবেসে আমদানি করা যায় এবং অনুরূপ পাঠ্য ফাইল টেবিলগুলি সংগঠিত করার জন্য প্রয়োজনীয় ডেটা বহন করতে পারে।

আপনার যদি এমন একটি সিএসভি ফাইল থাকে যা একাধিক ফাইলে বিভক্ত হওয়া দরকার তবে আপনি সিএসভি মডিউলটি ব্যবহার করতে পারেন। আপনি সিএসভি মডিউলটি ব্যবহার করে ফাইলটি পড়তে পারেন এবং লেখক মডিউলটি ব্যবহার করে এটি একাধিক ফাইলে লিখতে পারেন।

পার্ল, রুবি, জাভা, জাভাস্ক্রিপ্ট বা পিএইচপি -র মতো অন্যান্য প্রোগ্রামিং ভাষা ব্যবহার করে আপনি সিএসভি ফাইলগুলিও পড়তে পারেন। সিএসভি মডিউলটি ব্যবহার করুন এবং আপনার ডেটা প্রক্রিয়া করতে সেই ভাষাগুলি ব্যবহার করুন।





মন্তব্য (0)

মতামত দিন