top of page
Above the Clouds

​暑期實習進度與成果

(一) 工作目標
(二) 工作規範
(三) 工作進度
(四) 專案報告與成果
        (1)  專案特色與介紹
        (2)  專案結論與未來發展

(一) 工作目標

          在暑期實習的過程中我認為主要的實習目標是在進行專案的過程中學習更多數據分析相關的技巧,因為這次的專案是我在遠東新世紀實習期間第一次與政大的實習生們合作一份專案,所以可以藉由這次的專案合作機會學習政大的實習生在數據分析過程中的分析觀點、分析技巧以及分析使用的工具,雖然在專案進行的過程中可能會有些意見分期的時刻,但是在最後能夠成功完成這次的專案並且學習到更多數據分析相關的技巧。

          這次專案的主要目標是利用公司提供2017~2020年的歷史數據資料進行資料分析、預測和預警,而專案的主要方向是利用歷史數據資料的數據欄位進行預測、數據資料欄位的分析和數據資料進行公司內部條件的預警。

          而這幾個主要的分析方向中,我認為最困難的部份是進行數據資料分析和預測,因為Power BI是將數據資料利用圖表和基本數值計算進行視覺化的工具,所以要進行數據分析就必須利用自己對數據資料的觀點進行,而數據資料的預測只能利用圖表進行資料預測,因此數據資料的分析和預測結果並不符合實際的數據資料分析結果,所以最後我只利用Power BI對歷史數據資料進行公司內部條件的預警和基礎的數據圖形化分析,而數據資料的預測和進階的歷史數據資料欄位分析則是由政大實習生進行。

工作目標(圖片).jpg

(二) 工作規範

         在暑假實習的期間一樣是依照正常的時間上下班,但是受到疫情影響公司將上班時間進行分流,而到了辦公室後我會先察看數據資料是否進行更新,因為數據資料的更新會使進行中的數據分析和預警出現誤差,因此必須將更新後的數據資料導入Power BI減少分析和預測出現誤差,而在下班前會利用Google的雲端Excel填寫今日工作狀況同時也會利用便條紙紀錄明日的工作進度。

          此外在這次的專案中,我們小組會在週五下午開工作內容相關的討論會,而討論會的內容主要是組員分享目前的分析狀況、遭遇到的分析問題與困難和未來專案主要的分析和預測方向,這方面就與之前實習過程中所完成的專案有很大的差異,因為在暑期實習前完成的專案都只有利用電話進行討論,此外小組內的所有人都在不同的地方實習,因此討論會都會利用Line、WeChat、Zoom等視訊通話軟體進行討論與分享。

          這次暑期專案的共識是不能將得到的數據資料外流,因為這些資料都是公司內部的資料,因此在進行專案前需要特別注意取得的數據資料不能隨意外流以減少公司不必要的麻煩。

(三) 工作進度

          這次的暑期實習所有組員實習的地點並不相同,另外組員也是利用不同的工具軟體進行數據資料的分析和預測,因此為了方便所有人報告目前數據資料的分析以及預測進度同時也讓組員瞭解對方的數據分析方向與進度,所以組長利用Google的雲端Excel表單讓組員紀錄當天完成的實習工作內容。

          為了能夠讓這次的專案順利完成,所以我將自計在專案需要負責的部份分成三大部份來方便我在實習過程中掌握自己的時間和進度。

          最開始是七月初拿到歷史數據資料時,這段時間主要是將數據資料進行欄位數值的篩選、評估欄位是否需要新增與刪除和制定數據資料的分群標準來減少DAX Function計算的問題與錯誤以和避免影響數據資料進行視覺化的準確度。

          下個階段是七月底,這時已經將歷史數據資料進行完整的資料清洗和欄位篩選,這時我們小組也討論部份資料欄位需要進行指定的欄位篩選,因此花費一段時間進行篩選條件的更新與修正,

          最後是確認歷史數據資料的篩選條件和DAX Function設定完成後開始進行,而這也是整個專案進度中最複雜的階段,因為視覺化圖表的欄位設定有許多種但不是每種都適合目前的數據分析方向,不過我還是利用暑期實習前視覺化圖表設計的經驗與技巧完成Power BI的使用者介面設計。

          最後在暑期實習的尾聲,我們將各自的數據分析成果進行展現並將所有的數據分析、預測和預警結果結合成一份數據分析結果文件和簡報。

工作進度表.jpg
△暑期工作進度表

(四) 專案報告與成果

逾期帳款分析.JPG
Power BI逾期帳款分析報表

(1)專案介紹與特色

          這次的暑期專案是將公司2017~2020年的歷史逾期帳款數據進行數據資料的分析、預測和預警,而整體專案的主要分析方向是藉由過去的逾期帳款數據找出產生逾期帳款的主要數據資料欄位,但是Power BI無法單純藉由數據資料進行逾期帳款的數據預測,因此整體專案分成三個部份,一部份是政大實習生利用Python進行預測模型的程式撰寫、統計學統計相關數據資料和演算法預測逾期帳款逾期狀況,另一部份是我利用Python預測模型進行計算的預測逾期帳款資料進行數據資料的視覺化和利用視覺化後資料進行數據分析,最後是利用歷史逾期帳款數據資料來尋找造成逾期帳款的主要數據欄位特徵並利用預測後的數據資料進行資料比較與分析,最後再將預測數據資料與歷史數據資料進行資料的比較完成最終的分析結果文件。

          而最大的特色是在Power BI的數據視覺化和利用Python撰寫的數據預測模型同時進行數據資料的分析和預測,並利用Python進行預測後的結果進行Power BI的數據視覺化,因為在1082的實習過程中我只單純使用未加工的數據資料進行Power BI的數據視覺化與利用DAX Function計算的數値及數值區間進行數據分析,但這次除了利用Python預測出的資料進行數據資料的比較、預測前和預測後的數據分析結果以及歷史數據資料進行數據視覺化後的結果進行分析。

(2) 專案結論與未來發展

          這次暑期實習的專案,我主要是負責利用Power BI進行歷史數據資料的數據分析和公司內部條件的資料預警,在進行分析的過程中我利用公司提供的數據條件進行數據資料的分類再進行DAX Function的設計,而DAX Function的設計方向主要是先計算數據資料總數在計算各個數據欄位條件下的百分比數值進行數據分析和成為分析過程中的基準量,最後再以數據資料的分析方向為中心進行數據視覺化的圖表設計。

          而最後的結論可以發現到每月都會有固定分類族群的數值超過DAX Function計算的百分比基準值,因此需要對該分類族群進行更深入的數據資料分析和探討,而歷史數據資料的預警則是將公司內部規定設定為基準值並在Power BI介面顯示快超過設定的基準值數據進行提醒。

         而目前的Power BI圖表只有利用各種歷史數據資料進行數據分析和預警尚未套入影響數據資料發生的數據欄位機率,所以未來在DAX Function的設計方向可以加入歷史數據資料進階分析的數據加強Power BI報表的功能與實用性,此外也希望可以搭配預測後數據資料進行數據視覺化的呈現讓客戶能對預測後的數據更加瞭解並有效的做為客戶篩選上的參考數據資料。

逾期帳款預警.JPG
Power BI逾期帳款預警報表
bottom of page