跳到主要內容


檔案格式-xml

檔案格式
xml

xml詳細內容參考RFC7303,詳細的定義在那裡面,如果有空我會翻譯成中文。
xml又稱可擴展標籤是語言,顧名思義它有標籤,並且可以擴展標籤定義,也就是可以自己定義標編意義,以下是基本的標籤構成:
<tag></tag>
<tag/>
第一種是標籤開始、標籤結束,第二種是標籤內結尾的形式,另外可以增加標籤的屬性,而在xml開頭需要聲明其xml版本,第一種情形兩個標籤之間的內容可以稱為元素。

<?xml version="1.0"?>
2  <小纸条 id="1">
3    <收件人>大元</收件人>
4    <發件人>小張</發件人>
5    <主題>問候</主題>
6    <具體內容>早啊,飯吃了沒?<newline/></具體內容>
7  </小纸条>
在實際上的應用來看,像是word、pdf、html、json等都是應用的例子,簡單說要自定義資料格式、檔案內容、檔案排版,可以使用xml,不過不建議發展新的格式,除非有什麼特別的理由。
在這邊要特別提一下,parser這個東西,這個東西的概念就是去解開xml的檔案,讓資料用xml定義的格式讀到程式中,主流方法有兩種分別為DOM Parser、SAX Parser。

DOM Parser的做法是將整個檔案的結構跟內容一次讀進程式中,比較花時間跟空間,對於檔案較大或是硬體設備不夠強的情況,不適合。

SAX Parser的做法是讀取部分的內容,不一次做到,這種方法是由JAVA提出實作,原因在於android手機上在讀取這種內容的時候,可能會不夠資源或是很慢,故發展出此種方法。

 投影片-slideshare:程式語言概念_變數
 影片-youtube:程式語言蓋面_變數
 程式碼-Github:程式語言概念_變數
下一單元:程式語言概念_常見的資料格式

留言

這個網誌中的熱門文章

程式語言學習概論(1)

程式語言 介紹

Python-設計模式-共享模式

Python 設計模式 共享模式 class Font:     def __init__(self):        self.Size = 0        self.Type = ''     def printAll(self):        print(self.Size, self.Type)  class FontFacotry:     def Word(self, Size=3, Type='1'):        F = Font()        F.Size = Size        F.Type = Type        return F  FontSize = [1,2,3] FontType = ['1','2','3'] Facotry = FontFacotry()  F1 = Facotry.Word(FontSize[0],FontType[0])  F1.printAll()  F2 = Facotry.Word( FontSize[1],FontType[1] ) F2.printAll()  F3 = Facotry.Word( FontSize[2],FontType[2] ) F3.printAll() 程式碼說明 font 定義類別 fontFacotry物件生成工廠 fontsize用來儲存font大小的外部空間 fonttype用來儲存font種類的外部空間

Python-開啟檔案

Python 開啟檔案 基本概念說明 參考 程式語言概念-常見檔案型態 基本常見檔案類型 二進位檔 文字檔 CSV XML JSON html excel word 圖片 音源 影片 以下是處理該類型檔案對應函式或模組 這邊內建函數的意思是讀取之後能直接處理。 檔案類型 內建函數 標準模組 非標準模組 二進位檔 open() None - 文字檔 open() None - CSV None csv - XML None xml - JSON None json - html None html - excel None None 非 windows excel api windows excel api word None None 非 windows word api windows word api 圖片 None None pypng 音源 None wave - 影片 None None moviepy 二進位檔程式碼範例 二位元的定義在Python官網的資料型態沒有定義,但是還是可以使用的需要用函式轉換才能夠出現,分別用bytes、bytearray兩種,在使用前可以先盡到直譯器上,用help指令查訊該function的功能,以下是其內容。 在前面先講bytes跟bytearray用法,後續再講數字、字串轉成bytes的方法,最後才是進行二進位檔案讀寫。 bytes 再把資料料轉換時輸入內容可分成一下種類 整數 字串 可迭代資料:迭代內容一定要是數字 buffer:這邊不是示範,因為寫python沒用過 bytes(1) bytes(2) bytes(3) bytes(4) bytes('str'.encode('utf8')) bytes('str'.encode('ascii')) bytes([0,1,255]) bytes((2)) bytes((1,2)) bytes({1,2}) 程式碼說明 bytes()中代入數字是告知bytes數量,如:bytes(1)就是一個bytes量 bytes()中代入字串時,附加編...