資料數位化之原理與方法-文字數位化
資料數位化
實作1-資料數位化概念
文字數位化(Coding編碼)
1.碼(code)是甚麼?
提問-在你的日常生活在哪邊可以應用到Code(碼)的概念與技術?
實作2-摩斯密碼翻譯器
文字數位化(編碼)原理
說明:
1.文字資料轉換到螢幕
2.文字編碼系統:
文字編碼系統囉! 主要又分為3種
1.英文: ASCII、 ASCII-8 、EBCDIC
2.中文: BIG-5(繁體) 、 GB(簡體)、 HZ(簡體)
3.萬國碼: Unicode 、 UTF-8 、ISO standard
說明
ASCII使用7位元表示128個字元,ASCII-8則是在ASCII字元前增加一個最高有效位元
EBCDIC是IBM於1963年所推出的編碼系統。
不論是ASCII、 ASCII-8 、EBCDIC都無法顯示中文!!!
Unicode的誕生是為了涵蓋電腦所使用的各個語系。如日文、中文、希臘文。
不必針對不同語系設計編碼系統,共有2^16個字元,它幾乎涵蓋了所有語系,故稱為萬國碼。
參考網站
文字編碼與檔案格式
說明
TXT--純文字檔,只能修改文字,無法變換字體顏色。
DOC--Word文件檔,可以修改文字,也可以變換字體顏色及各種編輯。
PDF--PDF(Portable Document Format的簡稱,意思「便攜式文件格式」)它的優點在於跨平臺、能保留文件原有格式(Layout)。 PDF是一個開放標準
常見文字編輯軟體
實作3-攔截密碼闖關遊戲
文字檔建立(記事本)
1.桌面按右鍵/新增文字文件
2.打開你的TXT檔案,點另存新檔,正下方就有一個編碼系統讓你選
3.檔案名稱存為code.txt 編碼系統為UTF8
第1關:你能解碼二進位密碼語嗎?請記住,每個字符為八個1和0的組合
01000011 01101111 01100100 01100101 01101001 01110011 01010000 01101111 01100101 01110100 01110010 01111001 |
參考步驟
1將上述的二進位010000000...............的碼複製.貼到線上二進位轉ASCII網的二進位輸入區域.點Convert(轉換).得到ASCII碼
2.將得到ASCII碼.複製貼到code.txt內
3.再利用Google翻譯.將此句子翻譯(注意英文句子每隔單字要按空白建) .完成第一關
第2關:decode (解碼) 請問這件衣服的密語?
1將上述的衣服上的二進位的碼輸入到線上二進位轉ASCII網的二進位輸入區域.點Convert(轉換).得到ASCII碼
2.將得到ASCII碼.複製貼到code.txt內
3.再利用Google翻譯.將此單字翻譯並利用維基百科 解釋此單字的意義..完成第二關
資料來源
參考網站
http://csenet.ice.ntnu.edu.tw/
http://cshistory.ice.ntnu.edu.tw/material.html
http://web2.fg.tp.edu.tw/~anny/moodle/course/view.php?id=46
http://www.csie.ntnu.edu.tw/~u91029/Code.html