តើធ្វើដូចម្តេចដើម្បីបំបែកឯកសារ CSV ទៅជាកំណាត់ជាមួយ Python?

តើធ្វើដូចម្តេចដើម្បីបំបែកឯកសារ CSV ទៅជាកំណាត់ជាមួយ Python?


Python បំបែកឯកសារ CSV ទៅជាកំណាត់

Python គឺជាភាសាកម្មវិធីដែលមានអនុភាពដែលអាចត្រូវបានប្រើសម្រាប់គោលបំណងផ្សេងៗគ្នាជាច្រើន។ មួយក្នុងចំណោមពួកគេកំពុងនាំចូលឯកសារ CSV ហើយដំណើរការវាទៅជាកំណាត់។

គោលដៅនៃការបង្រៀននេះគឺដើម្បីបង្រៀនអ្នកពីវិធីនាំចូលឯកសារស៊ីអេសអេសហើយប្រើមុខងារបំបែក Python លើពួកវា។ អ្នកនឹងរៀនពីរបៀបប្រើវាដោយប្រើឧទាហរណ៍ពីរ: បំបែកឯកសារទៅក្នុងឯកសារជាច្រើនដែលមានមូលដ្ឋានលើជួរឈរដំបូងហើយបំបែកឯកសារទៅក្នុងកំណាត់ដែលបំពាន។

ប្រសិនបើអ្នកមិនស៊ាំនឹងអ្វីដែលវិទ្យាសាស្ត្រទិន្នន័យគឺវាជាដំណើរការនៃការទាញយកចំណេះដឹងពីទិន្នន័យដូច្នេះវាអាចត្រូវបានប្រើក្នុងការធ្វើឱ្យមានឬកែលម្អការសម្រេចចិត្តអំពីសកម្មភាពនាពេលអនាគត។

តើធ្វើដូចម្តេចដើម្បីប្រើភាសាសរសេរកម្មវិធី Python ដើម្បីបំបែកឯកសារ CSV ទៅជាកំណាត់?

អ្នកអាចបំបែកឯកសារជាមួយម៉ូឌុល CSV ។ ម៉ូឌុលនេះត្រូវគ្នាទាំងពស់ថ្លាន់ 2 និងពស់ថ្លាន់ 3 ។

Python 3:

បើកឯកសារស៊ីអេសអេសក្នុងសំបកពស់ថ្លាន់។ អ្នកនឹងប្រើ CSV ។ អ្នកអាន (ឯកសារ, ការកំណត់ព្រំដែន =) បន្ទាប់មកបញ្ជូនវាទៅ CSV ។ អ្នកនិពន្ធហើយអ្នកនឹងប្រើខ្សែអក្សរជំនួសឱ្យឯកសារពីព្រោះនៅក្នុងពស់ថ្លាន់ 3 ខ្សែអក្សរគឺជាវត្ថុ (ស្ថានភាពការចងចាំដូចគ្នាជាបញ្ជី) ដូច្នេះយើងប្រហែលជាត្រូវផ្លាស់ប្តូររបៀបដែលទិន្នន័យត្រូវបានរក្សាទុកដោយឥរិយាបថដែលមិនបានរំពឹងទុក។

បើកឯកសារនៅ PYTHON3:

Python3 បំបែកឯកសារ CSV ទៅជា chunks.py

តើធ្វើដូចម្តេចដើម្បីបំបែកឯកសារ CSV ជាមួយ Python? តើធ្វើដូចម្តេចដើម្បីបំបែកឯកសារស៊ីអេសអេសជាមួយពស់ថ្លាន់? បំបែកឯកសារអត្ថបទទៅក្នុងឯកសារតូចៗច្រើនដែលមានមូលដ្ឋានលើជួរឈរដំបូងក្នុងឯកសារអត្ថបទ។ វាជាវិធីសាមញ្ញងាយងាយនិងមានអានុភាពក្នុងការបង្កើតឯកសារស៊ីអេសអេសអេសអេសឬបំលែងឯកសារកំណត់ព្រំដែន CSV / MACA ទៅឯកសារផ្សេងទៀត។

នេះជារបៀបដែលអ្នកនាំចូលឯកសាររបស់អ្នក:

ការនាំចូល CSV

ឥឡូវអ្នកនឹងប្រើអ្នកកំណត់ព្រំដែន = អាគុយម៉ង់ទៅកាន់ថ្នាក់អ្នកអាន។ វាជាសំណុំតួអក្សរដែលនឹងបំបែកវាលស្រែ។ ក្នុងករណីនេះវាជាសញ្ញាក្បៀស (,) ។ ដូច្នេះអ្នកអាន (ឯកសារការកំណត់ព្រំដែន = 'នឹងបំបែកបន្ទាត់នីមួយៗទៅជាផ្នែកជាច្រើនដែលផ្អែកលើជួរឈរនោះ។

អ្នកអាន = CSV.Reader (MyFile, ការកំណត់ព្រំដែន = ',')

រឿងបន្ទាប់ដែលត្រូវធ្វើគឺប្រើថ្នាក់ Writer ដើម្បីសរសេរទិន្នន័យទៅក្នុងឯកសារមួយ។ សរសេរទិន្នន័យដោយប្រើថ្នាក់ Writer ហើយឆ្លងកាត់វាទៅវត្ថុខ្សែអក្សរជំនួសឱ្យឯកសារពីព្រោះខ្សែអក្សរគឺជាវត្ថុនៅក្នុង Python 3 ហើយអ្នកប្រហែលជាមានឥរិយាបទដែលមិនបានរំពឹងទុកដោយមិនចាំបាច់ផ្លាស់ប្ដូរប្រភេទ។ កំណត់គុណលក្ខណៈរបៀបរបស់វាជា 'ដូច្នេះថាវានឹងចាប់ផ្តើមសរសេរនៅលើឯកសារនេះ។

អ្នកនិពន្ធ = ស៊ីអេសវីសឺរ (ខ្សែអក្សរ)

ជំហានបន្ទាប់គឺដើម្បីណែនាំថ្នាក់របស់អ្នកនិពន្ធឱ្យប្រើទិន្នន័យទាំងអស់នៅក្នុងថ្នាក់អ្នកអានដើម្បីសរសេរវាទៅក្នុងឯកសារ។ អ្នកនឹងរង្វិលជុំតាមរយៈជួរដេកហើយសរសេរគ្នានៅក្នុងឯកសារ។ ជំហានចុងក្រោយគឺប្រើអ្នកនិពន្ធដែលនឹងសរសេរជួរដេក (បន្ទាត់ទិន្នន័យមួយ) ទៅក្នុងឯកសារដោយប្រើអ្នកនិពន្ធ។ អ្នកនិពន្ធ (ជួរដេក) ។

សម្រាប់ខ្ញុំជួរដេកនៅក្នុងកម្មវិធីអាន: # # នេះបានឆ្លងកាត់ជួរនីមួយៗពីអ្នកអានហើយសរសេរបន្ទាត់នីមួយៗទៅជាឯកសារ។ rows.append (ជួរដេក)
អ្នកនិពន្ធ (ជួរដេក) #dd ជួរដេកនៅចុងបញ្ចប់នៃឯកសារ។
អ្នកនិពន្ធ (ជួរដេក) #dd ទាំងអស់ជួរដេកក្នុងពេលតែមួយ។

ចុងបញ្ចប់បិទឯកសាររបស់អ្នកហើយបើកវាឱ្យប្រាកដថាអ្វីៗទាំងអស់ត្រូវបានរក្សាទុកយ៉ាងត្រឹមត្រូវ។ វាគួរតែមានកំណាត់នីមួយៗពី CSV របស់អ្នកបានបំបែកទៅក្នុងឯកសាររបស់វាដែលមានឈ្មោះដូចគ្នានឹងឯកសារដើមរបស់អ្នកប៉ុន្តែជាមួយនឹងការពង្រីក .csv ។

stingio = io.sttringio (myfile.read ())
អ្នកនិពន្ធ = ស៊ីអេសវីសឺរ (ខ្សែអក្សរ)
Writer = CSV.Writer (Stingio, ការកំណត់ព្រំដែន = '
reader = csv.reader(myFile, delimiter=’, for i, row in reader: rows.append(row) stingio = io.sttringio (myfile.read ()) អ្នកនិពន្ធ = ស៊ីអេសវីសឺរ (ខ្សែអក្សរ) writer = csv.writer(stringIO, delimiter=’) writerow(row) stingio = io.sttringio (myfile.read ()) អ្នកនិពន្ធ = ស៊ីអេសវីសឺរ (ខ្សែអក្សរ) Writer = CSV.Writer (Stingio, ការកំណត់ព្រំដែន = '’) writerow(rows) myFile.close() #Closes the file so it can be opened again myFile = open('list_of_chunks.csv', 'w') #Open the file as if it was a file. myFile.close() #Closes the file so it can be opened again

ពស់ថ្លាន់ បំបែកឯកសារ CSV ទៅជា កំណាត់.py

តើធ្វើដូចម្តេចដើម្បីបំបែក CSV ដោយប្រើ ពស់ថ្លាន់? តើធ្វើដូចម្តេចដើម្បីបំបែកស៊ីអេសអេសក្នុងពស់ថ្លាន់? បំបែកតម្លៃ CSV ឬ MAV (CSV) ដោយផ្អែកលើក្បាលជួរឈរដោយប្រើ ពស់ថ្លាន់, Plath, Puncation Data និងរូបមន្ត Excelas ម៉ាក្រូនិងឧបករណ៍ VBA ឆ្លងកាត់សន្លឹកកិច្ចការជាច្រើន។ មុខងារថូខឹន () អាចជួយអ្នកបំបែកខ្សែអក្សរស៊ីអេសអេសទៅជាថូខឹនដាច់ដោយឡែក។

Excel គឺជាឧបករណ៍មួយក្នុងចំណោមឧបករណ៍សូហ្វវែរដែលប្រើច្រើនបំផុតសម្រាប់ការវិភាគទិន្នន័យ។ វាភ្ជាប់មកជាមួយលក្ខណៈពិសេសជាច្រើនដែលមិនត្រូវបានគាំទ្រដោយពស់ថ្លាន់និងភាសាសរសេរកម្មវិធីផ្សេងទៀត។ ដូច Excel គឺជាឧបករណ៍មួយក្នុងចំណោមឧបករណ៍ដែលប្រើច្រើនបំផុតសម្រាប់ការវិភាគទិន្នន័យដែលធ្វើឱ្យមានការធ្វើសមាហរណកម្មវាជាមួយ ពស់ថ្លាន់ គឺមានសារៈសំខាន់ណាស់ដែលអាចជាអ្នកប្រើប្រាស់មួយចំនួនដែលធ្លាប់ស្គាល់ពី Excel ជាងភាសាសរសេរកម្មវិធីផ្សេងទៀតរួមទាំងពស់ថ្លាន់។

នៅក្នុងឯកសារបង្រៀននេះអ្នកនឹងរៀនពីរបៀបរក្សាទុកឯកសារ CSV ដែលមានឯកសារតូចៗជាច្រើននៅក្នុង ពស់ថ្លាន់ ។ អ្នកនឹងរក្សាទុកឯកសារជាកំណាត់ទិន្នន័យដាច់ដោយឡែកពីឯកសារមួយទៅក្នុងឯកសារថ្មីជាច្រើន។

អ្នកអាចប្រើម៉ូឌុល CSV ដើម្បីអាននិងសរសេរឯកសារ CSV ។ អ្នកក៏នឹងប្រើខ្សែអក្សរដែលនឹងធ្វើឱ្យការប្រើប្រាស់ ពស់ថ្លាន់ លឿនជាងមុននិងងាយស្រួលជាងការប្រើប្រាស់រូបមន្ត Excelas និងម៉ាក្រូ។ ម៉ូឌុល CSV អាចរកបានទាំង ពស់ថ្លាន់ 2 និង ពស់ថ្លាន់ 3 ជំនាន់ 3 ។

តើធ្វើដូចម្តេចដើម្បីបំបែកឯកសារ CSV ជាមួយ ពស់ថ្លាន់? តើធ្វើដូចម្តេចដើម្បីបំបែកស៊ីអេសអេសក្នុងពស់ថ្លាន់? បំបែកតម្លៃ CSV ឬ MAV (CSV) ដោយផ្អែកលើក្បាលជួរឈរដោយប្រើ ពស់ថ្លាន់, Plath, Puncation Data និងរូបមន្ត Excelas ម៉ាក្រូនិងឧបករណ៍ VBA ឆ្លងកាត់សន្លឹកកិច្ចការជាច្រើន។ មុខងារថូខឹន () អាចជួយអ្នកបំបែកខ្សែអក្សរស៊ីអេសអេសទៅជាថូខឹនដាច់ដោយឡែក។

ពស់ថ្លាន់3 បំបែកឯកសារ CSV ទៅជា កំណាត់.py

იმპორტის csv myfile = გახსენით ("list_of_ნაჭრები.csv", "r") მკითხველი = csv.reader (myfile, delimiter = ",") ხოლო მართალია: row = შემდეგი (მკითხველი) # ინახავს ხაზს CSV ფაილიდან, სანამ იქამდე აღარ არის ხაზები. SPLIT = ROW.SPLIT ("\ T") # თითოეული მწკრივი გაანაწილეთ ნიშნის სიაში, ტოქსენიზაციის () ფუნქციის გამოყენებით. გაყოფა = ["", ","]. გაწევრიანება (გაყოფა) # გაანადგურე ნიშნების ჩამონათვალის თითოეული ელემენტი და განათავსე ისინი ბოლოს
សម្រាប់ខ្ញុំក្នុងការបំបែក: បោះពុម្ព (i) # បោះពុម្ពចេញធាតុនីមួយៗចេញពីបញ្ជីដោយការបំបែកបន្ទាត់។ myfile.close () # បិទឯកសារដូច្នេះវាអាចត្រូវបានបើកម្តងទៀត

អ្នកអាចបំបែកឯកសារ CSV ដោយប្រើម៉ូឌុល CSV ប៉ុន្តែនៅក្នុង ពស់ថ្លាន់ 3 ពួកគេបានផ្លាស់ប្តូររបៀបដែលបញ្ជីត្រូវបានរក្សាទុក។ បញ្ជីគឺជាវត្ថុមួយនៅក្នុង ពស់ថ្លាន់ 3 ជំនួសឱ្យបញ្ជីប្រសិនបើអ្នកយកប្រភេទទិន្នន័យផ្សេងទៀតដូចជា RTR ដែលអ្នកអាចប្តូរបានទៅប្រភេទវត្ថុ។ អ្នកប្រហែលជាមានឥរិយាបទដែលមិនបានរំពឹងទុកនៅពេលធ្វើការជាមួយវត្ថុនៅពេលដែលតម្លៃខ្សែមិនត្រូវបានទទួលយកដោយមុខងារទាំងអស់។

ការបហ្ចប់

ឯកសារ CSV គឺជាឯកសារដែលតម្លៃដែលតម្លៃនឹងត្រូវបានបំបែកដោយសញ្ញាក្បៀស។ ទ្រង់ទ្រាយ CSV ត្រូវបានគេចាត់ទុកថាជាទ្រង់ទ្រាយអត្ថបទហើយមានបំណងផ្តល់ទិន្នន័យតារាង។

ប្រភេទឯកសារដែលមានផ្នែកបន្ថែម CSV មានព័ត៌មានដែលអាចត្រូវបាននាំចូលទៅក្នុងប្រព័ន្ធទិន្នន័យហើយឯកសារអត្ថបទស្រដៀងគ្នាអាចផ្ទុកទិន្នន័យដែលត្រូវការដើម្បីរៀបចំតារាងដែលត្រូវការដើម្បីរៀបចំតារាង។

ប្រសិនបើអ្នកមានឯកសារ CSV ដែលត្រូវការបំបែកទៅជាឯកសារច្រើនអ្នកអាចប្រើម៉ូឌុល CSV ។ អ្នកអាចអានឯកសារដោយប្រើម៉ូឌុល CSV ហើយសរសេរវាទៅឯកសារច្រើនដោយប្រើម៉ូឌុលរបស់ Writer ។

អ្នកក៏អាចអានឯកសារ CSV ដោយប្រើភាសាសរសេរកម្មវិធីផ្សេងទៀតដូចជា Perl, Ruby Java, JavaScript ឬ PHP ។ ប្រើម៉ូឌុល CSV ហើយប្រើភាសាទាំងនោះដើម្បីដំណើរការទិន្នន័យរបស់អ្នក។





យោបល់ (0)

ទុកឱ្យសេចក្តីអធិប្បាយ