跳到主要內容


檔案格式-csv

檔案格式
csv

在rfc4180有詳細的定義跟說明,如果想要了解其定義可以去該網站閱讀,傳送門,如果有天有空或許會翻譯翻譯吧,不過下面講下幾本的定義,以及可能會遇到形式變種。
最標準的定義如下
aaa,bbb,ccc crlf
ddd,eee,ffff crlf
ggg,hhh,iii crlf
觀察上面的格式,會發現重複的字母中間會有用逗號隔開,這是csv檔案很標準的做法,以這樣的方式來隔開資料內容,而crlf是什麼呢?其實就是所謂的\r\n,\r是回車,就是enter,然後常會搭配\n一起使用,這似乎跟打字機的構造有關,換句話說 cr等於\r、lf等於\n,而兩個通常會一起出現所以就會變成crlf,而在windows系統上,必定是crlf一起出現,而linux上,通常都用lf而已,所以csv檔間單定義就是用逗號分開資料且用crlf分行的檔案,之後crlf就一定寫成\r\n,lf就一定寫成\n。
但是在實際狀況上,可能會看到不標準的格式,如只有\n的格式或是資料是用\t(tab鍵)、空白鍵分開的,這也是很常見的形式,另外如果換行的時候有所錯誤,也是需要修正的。
不過大多的csv都是由excel這類型的程式所生成的,只要是這類型的程式生成的,格式基本上就是會固定,但就怕有人用手動生成。
 投影片-slideshare:程式語言概念_變數
 影片-youtube:程式語言蓋面_變數
 程式碼-Github:程式語言概念_變數
下一單元:程式語言概念_常見的檔案格式

留言

這個網誌中的熱門文章

程式語言學習概論(1)

程式語言 介紹

Python-設計模式-共享模式

Python 設計模式 共享模式 class Font:     def __init__(self):        self.Size = 0        self.Type = ''     def printAll(self):        print(self.Size, self.Type)  class FontFacotry:     def Word(self, Size=3, Type='1'):        F = Font()        F.Size = Size        F.Type = Type        return F  FontSize = [1,2,3] FontType = ['1','2','3'] Facotry = FontFacotry()  F1 = Facotry.Word(FontSize[0],FontType[0])  F1.printAll()  F2 = Facotry.Word( FontSize[1],FontType[1] ) F2.printAll()  F3 = Facotry.Word( FontSize[2],FontType[2] ) F3.printAll() 程式碼說明 font 定義類別 fontFacotry物件生成工廠 fontsize用來儲存font大小的外部空間 fonttype用來儲存font種類的外部空間

Python-資料庫

Python 資料庫 基本概念說明 參考程式語言概念- 資料庫內容 。 對於這邊的介紹其實,主要是對基本語法、資料庫的基本操作進行說明,所以大多只會看到語法指令,而不會深究內容,因為其內容會在SQL跟noSQL的文章內容進行說明,這邊說明會讓篇幅太多。 常見的資料庫 SQL:MySQL NoSQL:Mongodb 以下是處理該類型檔案對應函式或模組 資料庫名稱 模組 MySql MySQLdb mysqlclient PyMySQL mysql.connector peewee SQLAlchemy Mongodb pymongo PyMySQL 用python全實作的model,需要下SQL語法。 範例- 連結 SQLAlchemy 用ORM的概念做出來,支援各種SQL資料庫。 範例- 連結 pymongo 專門用來連結mongodb的module 範例- 連結