距離4/18學期結束差不多過了半個月,是時候來分享春季modB的課程心得了。這學期的課程也很少,加上Capstone只有三堂,如果還有修其他選修課的同學可能就更多。
1.Big Data Platform
這堂課和上學期的Business Intelligence是同個教授,是一堂偏Tech的課,教的內容是圍繞大數據等不同主題,比如從第一堂課介紹大數據(資料倉儲、NoSQL、Hadoop),第二堂介紹Spark RDD、雲端倉儲,第三堂介紹Weblog,RegEx規則運算式、HTML網路爬蟲,第四堂介紹JSON、Spark流式系統,第五堂機器學習以及MLoperations,最後一堂則介紹機器學習圖形分類系統以及深度學習的神經元網絡、反向傳播算法、DNN,因為教的東西太多了,很難一句話概括,所以把每堂課的主題條列出來,教授上課的時候大多是帶過PPT的理論,實際操作則是讓同學在Data bricks上import教學檔案,直接在上面看著教授的文字跟code學習,個人覺得這堂課難的地方是作業,每堂課看完lab會有一個作業單元,通常是結合前面所講的各種理論要我們寫出答案,有些code或方式前面沒有提到,所以有時候光一個作業可能因為怎麼寫都寫不出來就花了一個禮拜才完成QQ 不過這堂算是BA全部課下來最tech的課吧,很多東西不只理論要懂還要會操作,覺得這些內容對未來工作都很有幫助。
2.Predictive Modeling
這堂課雖然叫做Predictive modeling, 但個人認為應該叫做Web Analytics比較合適。課程前半段都圍繞在操作Google Analytics,教授也會要求學生考證照當作一次作業的成績,如果不想考可以選擇寫報告,如果對未來想做SEO網頁優化或網路行銷的人應該會是很有用的課,課程後半段在介紹Network Analytics跟text Analytics,像是分析哪些客群的客人節點跟節點之間關連性大小,針對公司決策是希望重視CLV還是CIV有不同行銷方式,文本探勘則是介紹如何從大量文字之中瞭解內文情緒偏負面 中立 或正面,比如從女性網購評價得出女性消費者可能較注重衣服材質 價格,評價也偏正向等等,文本探勘對於以產品銷售為主的公司很重要,因為從客戶評價中能得到很多產品可以改善或做得不錯的地方。
3.Capstone
這堂課應該是吸引我當初選擇SMU的原因吧,既能強化課堂上學到的理論知識,還能了解業界導入資料分析所需了解的實務專業,所以入學前就對Capstone抱有很大期待。其實如果在秋季學期有找到實習的話,就可以選擇實習而不參加Capstone,但實習內容要跟BA有關。參加Capstone的話,系主任在12月底給了同學合作公司的專案介紹及所需技能,每位同學依照自己的背景與興趣選填前五志願並填寫動機,最後我選到的是排在第二志願的信用卡服務公司--Aperia,信用卡產業有不同的角色,有商家 信用卡發卡商 信用卡處理商 客戶等等。這個產業有許多信用卡處理商決定是否核准交易並先支付款項給商家,這個產業相當競爭的原因是商家在選擇處理商時可能會優先選擇費用較低或優惠較高的處理商而很容易有跳槽的情況,就像我們買車險或保險常因為其他保險公司的保費算下來更低而取消原本的合約改去別家,所以Aperia這間公司就是提供客戶(信用卡處理商)各種分析及諮詢服務,而我們這次專案的目標就是透過機器學習建模幫某信用卡處理商分析商家流失率、什麼特徵導致流失以及未來30 60 90天流失的可能性。
因為簽了保密條款的原因,不能透漏太多關於專案的內容,但總體下來,學到最多的應該是如何真正將機器學習的技術導入到業界,專案開始之前並非直接一股腦地清理資料 分析資料,而是先了解專案目標 客戶要求 概念設計 時程規劃等等,有了詳細的規劃之後才能動手實作,否則開始時做之後發現很多地方有問題就得花更多成本及時間完成。當時遇到的問題是客戶在兩次開會之後要求我們須預測未來60 90天的流失率,所以我們的模型需重新處理已帶入時間序列模型,好在找到一篇github上有人分享的教學文,才成功重新定義目標變數,並得出每位商家的流失可能性及比率。個人認為Capstone可以學到的是未來進入職場與團隊合作的協調互動以及如何精準將查到的資料實際帶入專案並消化吸收,還有如何透過簡單易懂的表達方式將複雜的理論計算講解給非技術背景的主管聽,這都是值得研究的內容。很高興能在3個月學到這麼多,也為這9個月的課程畫下句點。
▲今年剛好遇到Cox 100周年,足球場布置地相當華麗
留言列表