第五次資料處理概念與方法1-資料整理與整合


資料科學(Data Science)

範例-ChatGPT(自然語言模型LLM)

實作1:資料與資訊的判讀

(1)資料

部落格

新聞報導

(2)資訊

思考問題:由上述資料及資訊你看到了甚麼?

說明:國內學生升學與家中社經地位之資訊分析

2'40

 

小結:

資料科學的本質是搜集、理解、分析、處理以及視覺化數據,並從中萃取有用價值

參考資料

揭開資料科學的神秘面紗

https://leemeng.tw/demystify-the-hype-of-data-science-and-its-value.html


開放資料(Open Data)

(1)定義

(2)目的

(3)政府開放資料與政府資訊公開

參考資料:https://ithelp.ithome.com.tw/m/articles/10291150

(4)資料儲存方式(格式)

A.JSON(JavaScript Object Notation)是一種開放的標準文件格式和資料交換格式

B.資料表格(Data sheet)

C.CSV(Comma-Separated Values,CSV,逗號分隔值,有時也稱為字元分隔值)

資料引用:108課綱高中資科科友出版社

實作2-開放資料收集與讀取

(1)CSV資料格式

思考問題:由上述資料表中你看到了甚麼?

(2)JSON資料格式

行政院環境保護署/ 空氣品質指標(AQI)

https://data.epa.gov.tw/api/v2/aqx_p_432?api_key=e8dd42e6-9b8b-43f8-991e-b3dee723a52d&limit=1000&sort=ImportDate desc&format=json

行政院環境保護署/ 紫外線

https://data.epa.gov.tw/api/v2/uv_s_01?offset=0&limit=33&api_key=da156bd2-ff2b-478e-a03b-5c3c0205c184


實作3-資料(數據)視覺化

新北市教育儀表板(Dashboard)

思考問題:為什麼要資料視覺化?

1. 吸引人 (Eye-Catching)

2. 快速辨識、快速進入情境脈絡 (Identify、Context)

3. 相對具體 (Specific)

4. 好記憶 (Memorize)

5. 好分享 (Shareable)

資料引用

https://reurl.cc/EG1Gmm


會考相關資料與資訊

(1)會考前的資料(4次模考成績單)

(2)會考成績單資料(202306**)

(3)會考後填志願的優先評估指標(20220610-2*)

A.交通

北北基學校捷運地圖

B.升學率

高中篇

111年台灣公私立高中錄取台灣頂大人數統計

高職篇

高職五專群科分布圖

臺北市立某高級工業職業學校110學年度科大甄選入學錄取榜單

臺北市立某高級工業職業學校110學年度科技校院登記分發錄取榜單

110學年度四技二專日間部聯合登記分發入學招生-各校系科組學程錄取總成績統計表

C.大學的價值(經濟獨立.企業用人)

D.歷屆會考積分預測資料

結論

1.會考成績差一分…差一級…差一校…,真的不算什麼, 念書是靠自己,自己想通了肯唸書才有用.有跌倒的經驗,不一定是壞事,人沒一輩子順利的.先摔一跤往往比一帆風順出社會才摔一大跤好 一時的挫敗 反而是往後謹慎努力精進的基石

2.重新洗牌後的三年, 其實高中進去後都重新洗牌了。第一名進去不是第一名,最後一名進去的也不見得都最後一名。除了課業本身,還會加入很多社團、聯誼...等變數

找到自己的興趣與才能.堅持努力.有自律.有恆毅力.朝目標及方向前進.才會是人生的贏家。

「才能」是指你做一件事,很輕鬆地就能做得比別人做10小時還好的成果;「興趣」就是指你努力做10小時,成果只等於別人做1小時

3.天賦自由(天生我材必有用)

輕鬆一下