檔案格式
csv
在rfc4180有詳細的定義跟說明,如果想要了解其定義可以去該網站閱讀,傳送門,如果有天有空或許會翻譯翻譯吧,不過下面講下幾本的定義,以及可能會遇到形式變種。
最標準的定義如下
aaa,bbb,ccc crlf
ddd,eee,ffff crlf
ggg,hhh,iii crlf
觀察上面的格式,會發現重複的字母中間會有用逗號隔開,這是csv檔案很標準的做法,以這樣的方式來隔開資料內容,而crlf是什麼呢?其實就是所謂的\r\n,\r是回車,就是enter,然後常會搭配\n一起使用,這似乎跟打字機的構造有關,換句話說 cr等於\r、lf等於\n,而兩個通常會一起出現所以就會變成crlf,而在windows系統上,必定是crlf一起出現,而linux上,通常都用lf而已,所以csv檔間單定義就是用逗號分開資料且用crlf分行的檔案,之後crlf就一定寫成\r\n,lf就一定寫成\n。
但是在實際狀況上,可能會看到不標準的格式,如只有\n的格式或是資料是用\t(tab鍵)、空白鍵分開的,這也是很常見的形式,另外如果換行的時候有所錯誤,也是需要修正的。
不過大多的csv都是由excel這類型的程式所生成的,只要是這類型的程式生成的,格式基本上就是會固定,但就怕有人用手動生成。
投影片-slideshare:程式語言概念_變數
影片-youtube:程式語言蓋面_變數
留言
張貼留言