跳到主要內容


檔案格式-xml

檔案格式
xml

xml詳細內容參考RFC7303,詳細的定義在那裡面,如果有空我會翻譯成中文。
xml又稱可擴展標籤是語言,顧名思義它有標籤,並且可以擴展標籤定義,也就是可以自己定義標編意義,以下是基本的標籤構成:
<tag></tag>
<tag/>
第一種是標籤開始、標籤結束,第二種是標籤內結尾的形式,另外可以增加標籤的屬性,而在xml開頭需要聲明其xml版本,第一種情形兩個標籤之間的內容可以稱為元素。

<?xml version="1.0"?>
2  <小纸条 id="1">
3    <收件人>大元</收件人>
4    <發件人>小張</發件人>
5    <主題>問候</主題>
6    <具體內容>早啊,飯吃了沒?<newline/></具體內容>
7  </小纸条>
在實際上的應用來看,像是word、pdf、html、json等都是應用的例子,簡單說要自定義資料格式、檔案內容、檔案排版,可以使用xml,不過不建議發展新的格式,除非有什麼特別的理由。
在這邊要特別提一下,parser這個東西,這個東西的概念就是去解開xml的檔案,讓資料用xml定義的格式讀到程式中,主流方法有兩種分別為DOM Parser、SAX Parser。

DOM Parser的做法是將整個檔案的結構跟內容一次讀進程式中,比較花時間跟空間,對於檔案較大或是硬體設備不夠強的情況,不適合。

SAX Parser的做法是讀取部分的內容,不一次做到,這種方法是由JAVA提出實作,原因在於android手機上在讀取這種內容的時候,可能會不夠資源或是很慢,故發展出此種方法。

 投影片-slideshare:程式語言概念_變數
 影片-youtube:程式語言蓋面_變數
 程式碼-Github:程式語言概念_變數
下一單元:程式語言概念_常見的資料格式

留言

這個網誌中的熱門文章

Python-資料庫-mongodb-pymongo

Python 資料庫 mongodb-pymongo 安裝: linux、mac:pip3 install pymongo windows: import pymongo client = pymongo.MongoClient("mongodb://localhost:27017/") db = client['demo_db'] col = db['demo_col'] dict1 = { "name": "ab123ab456g", "day": "1890-04-05" } result = col.insert_one(dict1)  dict2 = [   { "name": "ki", "day": "1666-1-1"},   { "name": "aa", "day": "1222-11-11"},   { "name": "gg-gg", "day": "1333-02-22"},   { "name": "T-T", "day": "1444-03-02"},   { "name": "f-f", "day": "1555-01-01"} ] result = col.insert_many(dict2) result = col.find_one() print(result) results = col.find() for result in col.find(): print(result) results = col.find() query = {'

程式語言概念-條件敘述

程式語言概念 條件敘述 上一篇的比較運算就是用來描述條件的,如變數a跟變數b,範例如下。 a>b a=>b a==b a<=b a<b a!=b 上一篇的邏輯運算可以連接不同條件,如:a>b and c>b。 在寫程式的時候,可以使用條件式加上需要的條件敘述,進行流程控制,達到程式結構化的目的,常見的條件式if-else、if-else if- else、switch。 條件式可以進行選擇流程,選擇流程種類如下。 單一選擇 雙向選擇 多向選擇 單一選擇: 用於當某些條件達成之後,就執行,如:下雨了嗎?沒有,沒事,有,帶傘。 流程圖 雙向選擇: 用於當某些條件達成之後,執行A,不然執行B,如:請問數字是奇數嗎?是,奇數,不是,偶數。 流程圖 多向選擇: 用於判斷某變數是否為A、B、C、...、其他,如:請問現在是什麼季節?春天、夏天、秋天、冬天。 流程圖  投影片-slideshare:程式語言概念_變數  影片-youtube:程式語言蓋面_變數  程式碼-Github:程式語言概念_變數 下一單元:程式語言概念_ 迴圈

Python-開啟檔案

Python 開啟檔案 基本概念說明 參考 程式語言概念-常見檔案型態 基本常見檔案類型 二進位檔 文字檔 CSV XML JSON html excel word 圖片 音源 影片 以下是處理該類型檔案對應函式或模組 這邊內建函數的意思是讀取之後能直接處理。 檔案類型 內建函數 標準模組 非標準模組 二進位檔 open() None - 文字檔 open() None - CSV None csv - XML None xml - JSON None json - html None html - excel None None 非 windows excel api windows excel api word None None 非 windows word api windows word api 圖片 None None pypng 音源 None wave - 影片 None None moviepy 二進位檔程式碼範例 二位元的定義在Python官網的資料型態沒有定義,但是還是可以使用的需要用函式轉換才能夠出現,分別用bytes、bytearray兩種,在使用前可以先盡到直譯器上,用help指令查訊該function的功能,以下是其內容。 在前面先講bytes跟bytearray用法,後續再講數字、字串轉成bytes的方法,最後才是進行二進位檔案讀寫。 bytes 再把資料料轉換時輸入內容可分成一下種類 整數 字串 可迭代資料:迭代內容一定要是數字 buffer:這邊不是示範,因為寫python沒用過 bytes(1) bytes(2) bytes(3) bytes(4) bytes('str'.encode('utf8')) bytes('str'.encode('ascii')) bytes([0,1,255]) bytes((2)) bytes((1,2)) bytes({1,2}) 程式碼說明 bytes()中代入數字是告知bytes數量,如:bytes(1)就是一個bytes量 bytes()中代入字串時,附加編