使用大數據與機器學習辨識信用卡盜刷(實作工作坊) 二
(MATLAB20210113)

開課時間:110.01.13(三)下午13:30~16:30
開課地點資訊技術服務中心電腦教室2
開課時數:3
授課對象全校教職員生

課程大綱
隨著人類技術進步,過去實體紙本的資料逐漸電子化、數位化。跳脫實體框架的資料大幅增加其流通性與產生速度,我們對於相同時間內能儲存的資料量也顯著的成長,但連帶而來的是後續處理的負擔。
過往紙本資料須經由人力進行抄寫與調閱,而如今透過電腦,相對人力所能處理的資訊量也今非昔比,但就算如此,仍會局限於所擁有的硬體資源,當資料龐大到一定程度時,一些平常的作業程式就無法再提供相對應的功能。
本次工作坊將介紹,在MATLAB中有什麼樣的解決方案能夠讓您處理大量的資料並有限度的更改既有的程式碼來處理不同量級的資料。

課程內容
此課程含括五大主題,分別說明如下:

1. 大數據從何處來?
2. MATLAB變數 – Table
3. MATLAB處理大數據的基礎 – Datastore
如何處理遺漏值
如何選擇欄
Exercise: 從信用卡資料中擷取盜刷資料
4. 當Datastore遇到平行運算 – Tall
Exercise: 使用Tall 與 Datastore 有什麼差別?
5. 如何應用機器學習來判斷盜刷紀錄
處理Unbalance Data
特徵選取對於模型精準度的提升

主辦單位:資訊技術服務中心
聯絡窗口:尤淑芬
校內分機:31728

email
sophi@g2.nctu.edu.tw

Available places: 46