跳到主要內容


檔案格式-csv

檔案格式
csv

在rfc4180有詳細的定義跟說明,如果想要了解其定義可以去該網站閱讀,傳送門,如果有天有空或許會翻譯翻譯吧,不過下面講下幾本的定義,以及可能會遇到形式變種。
最標準的定義如下
aaa,bbb,ccc crlf
ddd,eee,ffff crlf
ggg,hhh,iii crlf
觀察上面的格式,會發現重複的字母中間會有用逗號隔開,這是csv檔案很標準的做法,以這樣的方式來隔開資料內容,而crlf是什麼呢?其實就是所謂的\r\n,\r是回車,就是enter,然後常會搭配\n一起使用,這似乎跟打字機的構造有關,換句話說 cr等於\r、lf等於\n,而兩個通常會一起出現所以就會變成crlf,而在windows系統上,必定是crlf一起出現,而linux上,通常都用lf而已,所以csv檔間單定義就是用逗號分開資料且用crlf分行的檔案,之後crlf就一定寫成\r\n,lf就一定寫成\n。
但是在實際狀況上,可能會看到不標準的格式,如只有\n的格式或是資料是用\t(tab鍵)、空白鍵分開的,這也是很常見的形式,另外如果換行的時候有所錯誤,也是需要修正的。
不過大多的csv都是由excel這類型的程式所生成的,只要是這類型的程式生成的,格式基本上就是會固定,但就怕有人用手動生成。
 投影片-slideshare:程式語言概念_變數
 影片-youtube:程式語言蓋面_變數
 程式碼-Github:程式語言概念_變數
下一單元:程式語言概念_常見的檔案格式

留言

這個網誌中的熱門文章

程式語言學習概論(1)

程式語言 介紹

Python-設計模式-共享模式

Python 設計模式 共享模式 class Font:     def __init__(self):        self.Size = 0        self.Type = ''     def printAll(self):        print(self.Size, self.Type)  class FontFacotry:     def Word(self, Size=3, Type='1'):        F = Font()        F.Size = Size        F.Type = Type        return F  FontSize = [1,2,3] FontType = ['1','2','3'] Facotry = FontFacotry()  F1 = Facotry.Word(FontSize[0],FontType[0])  F1.printAll()  F2 = Facotry.Word( FontSize[1],FontType[1] ) F2.printAll()  F3 = Facotry.Word( FontSize[2],FontType[2] ) F3.printAll() 程式碼說明 font 定義類別 fontFacotry物件生成工廠 fontsize用來儲存font大小的外部空間 fonttype用來儲存font種類的外部空間

Python-開啟檔案

Python 開啟檔案 基本概念說明 參考 程式語言概念-常見檔案型態 基本常見檔案類型 二進位檔 文字檔 CSV XML JSON html excel word 圖片 音源 影片 以下是處理該類型檔案對應函式或模組 這邊內建函數的意思是讀取之後能直接處理。 檔案類型 內建函數 標準模組 非標準模組 二進位檔 open() None - 文字檔 open() None - CSV None csv - XML None xml - JSON None json - html None html - excel None None 非 windows excel api windows excel api word None None 非 windows word api windows word api 圖片 None None pypng 音源 None wave - 影片 None None moviepy 二進位檔程式碼範例 二位元的定義在Python官網的資料型態沒有定義,但是還是可以使用的需要用函式轉換才能夠出現,分別用bytes、bytearray兩種,在使用前可以先盡到直譯器上,用help指令查訊該function的功能,以下是其內容。 在前面先講bytes跟bytearray用法,後續再講數字、字串轉成bytes的方法,最後才是進行二進位檔案讀寫。 bytes 再把資料料轉換時輸入內容可分成一下種類 整數 字串 可迭代資料:迭代內容一定要是數字 buffer:這邊不是示範,因為寫python沒用過 bytes(1) bytes(2) bytes(3) bytes(4) bytes('str'.encode('utf8')) bytes('str'.encode('ascii')) bytes([0,1,255]) bytes((2)) bytes((1,2)) bytes({1,2}) 程式碼說明 bytes()中代入數字是告知bytes數量,如:bytes(1)就是一個bytes量 bytes()中代入字串時,附加編...