top of page
城市天際線

​暑期實習 學習內容

(一) 短期的團隊配合
(二) 預測及分析後數據資料運用
            (1) 預測後資料運用
            (2) 分析後資料運用
(三) 公司業務內容及條件

(一) 短期的團隊配合

          剛開始進行暑期實習時就知道暑假會與政大的實習生共同完成一份專案,而這也是開始實習到現在第一次與他人合作,也因為這次的合作讓我學習到更多數據分析相關的知識和團隊合作過程中需要注意的問題。

          在專案剛開始的那段時間我認為我有點緊張,因為這是第一次與完全不認識的人共同合作一份專案再加上心裡會恐懼自己在這次合作的過程中是否會拖累團隊的進度,但隨著合作的時間慢慢增加這份緊張的感覺慢慢的消去同時也瞭解到自己並不會拖累團隊的進度,所以我在專案的進行過程中開始用些大膽的想法進行數據資料的分析和預警,雖然這些大膽的數據分析方法在最後都是以錯誤的分析結果收場,不過我在這段過程中學到更多進階的Power BI用法和條件設定。

          除了學習到進階的Power BI用法和條件設定之外,我也在這次的團隊合作中學習到許多在合作過程中需要特別注意的事情,因為在剛得到專案需要的數據資料時,我們小組還沒開會討論這份專案主要的數據資料分析和預測方向,因此所有人都先嘗試利用自己熟悉的工具尋找自己認為合適的數據資料分析方向進行數據資料的分析,不過卻發現所有人的數據分析結果都是利用不同分析角度的觀察點但最終的分析結果卻與公司提出的分析目標相差不遠,這時我才體會到短期的團隊配合是如此的困難,因為彼此進行數據分析時得分析角度不同與利用的數據分析工具也有差異而導致分析結果符合公司條件但分析觀點的不同導致無法將最終的分析結果整合,幸好經過每週五的討論會議將最終的數據分析方向進行討論與修改才能將所有人數據分析、預測和預警的結果進行整合。

          而在這次短時間的團隊配合後,我發現困難的地方除了組員之間的討論方式和積極度之外,整個過程中最困難的是在專案的一開始就需要討論並確定未來的數據分析方向和整體組員的分工,因為討論後的數據分析方向是整份專案未來的數據分析結果,因此需要事先確認來減少錯誤的分析結果進行誤導和避免最終的數據分析結果無法進行整合。

(三) 公司業務內容及條件

          這次暑期實習取得的數據資料與1082期間實習取得的數據資料類型和主題並不相同,因為1082實習期間所取得的資料是健康關懷表,而健康關懷表的資料欄位數值只有“是”和“否”,因此在進行數據清洗時可以輕易的將數據資料進行數值的區分,同時也可以依照自己的主觀判斷來設立數值的基準點進行數據的分析。

          而在暑期實習中取得的數據資料欄位類型是數值,因此在進行數據分析前需要進行DAX Function的計算,因此在進行數值的區分時需要藉由數值的平均數或四分位數來進行分類,除此之外在設立資料數值的基準點也需要依照公司內部的條件設定以減少與公司設定的分析目標差異過大。

          我認為將數據資料加入公司內部規定進行篩選條件的設定讓這次的暑期專案困難度大幅提升,因為在進行資料清洗的過程中除了需要觀察該欄位是否適合這次數據資料分析所需還要注意進行數據資料數值區分時需要配合公司內部的規定進行區分。

(二) 預測及分析後數據資料運用

          這次暑期實習的專案我主要是負責將數據資料進行資料的分析和預警,而數據資料的預測則是由政大實習生的進行並提供預測後數據資料,所以在這次的專案中我會利用預測後及分析後數據資料進行Power BI數據資料的視覺化,而預測後數據資料的分析方向是將數據資料的數值進行比較和判斷數據欄位對業務造成的風險機率,分析後數據資料的分析方向是進行篩選條件的預警和相關數據資料的比較。

          這次得到的數據資料對我來說充滿挑戰性,因為從1082開始實習到現在只接觸未加工的數據資料並進行簡易的數據分析,但這次的暑期專案需要將加工後的數據資料進行數據分析和Power BI數據資料的視覺化,因此在進行專案的過程中可以讓我學習到更多數據分析的技巧、Power BI報表的設計和全新條件的DAX Function設定。

(A) 預測後數據資料的運用

          得到的預測後數據資料是由政大的實習生利用Python2017~2019年的歷史數據資料進行資料預測,而最終的預測結果是判斷該數據資料是否對業務有異常的影響,為了減少數據欄位過多導致分析結果產生誤差,因此先將數據資料進行資料清理再進行數據資料的分析。

          而使用預測後數據資料進行數據分析是我第一次在實習過程中使用,因為暑期實習前的數據分析方式都是利用歷史數據資料進行數據分析,所以數據分析的一開始並沒有任何想法進行數據資料分析,但在仔細觀察數據資料後發現預測後數據資料與歷史數據資料大同小異,但預測後數據資料會多「預測是否逾期」的資料欄位,最後就決定以「預測是否逾期」為報表的分析觀點進行數據資料的分析。

(B) 分析後數據資料的運用

          在進行分析後數據資料的數據比較前需要先觀察數據資料,因為該數據資料已經進行加工可能有些數據欄位的含意有改變,所以在進行數據資料比較前需要詳細的觀察並適時的提出對數據觀點的問題來減少未來進行資料預警時出現錯誤的預警結果,而在進行數據資料預警的過程中我會將分析後數據資料設定為基準值來觀察分析結果是否準確在進行數據資料的比較。

bottom of page