空間與時間資訊在保險科技上的應用

發佈日期 / 2023-04-10葉向原 教授-東吳大學
210870 34820
空間與時間資訊在保險科技上的應用

〈本專區由Yahoo邀約採訪編輯〉

目前當紅的新興科技如人工智慧與機器學習等技術,在全球不斷地應用在金融保險行業上,逐步透過資料分析的模式提供個人化與自動化的服務。舉例而言,國外企業名為Lemonade開發官方APP,讓使用者透過手機輸入租屋的地點,以聊天機器人的對話方式申購房屋保險。將過往動輒數週的申請程序,僅需幾秒鐘便能在手機上完成(https://www.youtube.com/watch?v=flSLI2JmWVE)。這樣的服務乃是萃取和分析空間感知的相關資訊來進行模型設計,將繁複的保險費用估算流程簡單化,不僅可以大大節省保險公司與消費者的時間,也獲得使用者的青睞與喜愛。從這樣的案例當中,讓我們了解到如果能將使用者所提供的資訊,以新穎的方式讓時間與空間的資訊整合性描述與呈現特徵,進而創作更多有效的商業服務模式。

現今在台灣的企業不斷的將資料數位化,其中地址與日期時間的欄位資訊時常會出現,但卻常被分析人員忽略其潛在的語意與意涵。這些欄位若不強化說明,對電腦而言,就可能只是單純的文字符號。因此利用人類所具備的領域知識或常識(common sense)來描述,對該欄位進行特徵轉換,藉以強化其理解世界的方式,更能理解欄位資料的特性。例如: 我們可從日期時間數據中提取相對應的語意資訊,從日期擷取出星期幾、是否為周末、一年的第幾周或是第幾季等延伸的語意訊息,如圖一。這樣從原始數據中創造與提取特徵的過程,我們稱之為「特徵工程」,讓這些特徵可用來提高後續機器學習算法的性能與解釋性。透過以上簡略的說明,對於時間(::)的資料,你()是不是可以將其劃分為不同時段分類(:早上、下午等)新的特徵欄位來說明,甚至還可以利用地支時辰來進行時間的劃分喔!

企業以客戶所提供的資訊(:職業別、年收入或是教育程度)或利用前線人員的深入訪談,以經驗來感受或評估客戶的狀態。然而企業對於客戶所提供的居住地址,常只將其當成一個參考欄位或是便利前線人員進行實地拜訪,並沒有將地址這樣的文字內容擷取出可用且有效的資訊來進行運用。隨著統計地理資訊系統(Geospatial Information System)以及開放資料的發展,我們可利用地址空間資訊獲取其周遭的資訊,進而整合各類型統計資料。我們仍可以利用特徵工程的方式來解讀,我們首先可用地址來獲取其在地圖上的座標(:經緯度、台灣橫麥卡托二度分帶投影座標系統TM2的座標),再透過政府所提供的社會經濟資料服務平台(https://segis.moi.gov.tw/STAT/Web/Portal/STAT_PortalHome.aspx)或內政部資源供需衡量指標查詢系統(https://semap.moi.gov.tw/RCI/)等開放資料,來獲取地址的所在位置,與其方圓固定範圍內區域的人口資訊、地址資源供需衡量之指標,將所有人、事、地、物整合在一起,連接客戶與生活事物的相互關係,如圖二。透過這些延伸的特徵直接與間接的了解客戶的社會經濟地位,並且綜合衡量其家庭或生活社群對周遭資源獲取與需求的關鍵指標,在此我們列舉可能的指標與其衡量方式如下:
1.便利性所在地區的生活機能(如百貨超市、便利商店、電影院、運動場、公園等)設施的數量,或與交通工具(如公車站、捷運站、火車站、高鐵站)的距離遠近。

2.安全性所在地區的犯罪率、車禍率,或是該區域警察局、醫院、消防局等數量與距離。

3.環境之負面程度:所在地區的之聲色場所、墓園、網咖、變電所、垃圾場、核電廠、高速公路旁、鐵路旁等嫌惡設施的數量與距離。

4.人口組成程度該區域人口密度、平均年齡、年齡眾數、年齡四分位數、性別比、新生兒比例、老年人口比例等來表達區域的人口老化程度。

5.房價狀態該區域之房價平均數、四分位數、眾數等,來表達該區域之人均收入、貧富差距等。

以上只是簡略的說明可能的指標,透過圖資工具的輔助來獲取來自於不同資料來源,並對地址以不同角度面向來描述,藉以充分表達了大數據中「多樣性(Variety)」的特性,未來可依據不同的保單型式與需求,由保險公司自行定義的風險。

過往已有多家金融業結合地理資訊系統和內部管理數據來設計與開發地理圖資平臺,將原有的文字與數據轉換為地圖視覺化的方式來表達,藉以協助改善企業內部風險控管之流程及便利承辦人員分析之用,進而強化了產業的進階應用。雖然結合地理資訊的視覺化工具可整合多樣性的資料,但始終需要承辦人員手動查找的過程,並透過查找比對的結果來評估客戶的風險。如今,我們可以將圖資工具從視覺化的角色轉換為自動化的特徵工程,以利後續機器學習的建模與預測,進而降低承辦人員在操作上的繁雜性,與面對多樣性資料的解讀困難。然而,要做出上述的特徵工程其實還是具有其困難度,人們的居住地與戶籍地可能不相同,而導致地址分析的結果不具代表性;消費者在撰寫地址時,由於撰寫的不同型式與詳細程度都會影響到後續座標系統定位的準確程度;圖資的多樣性資訊目前仍仰賴政府公部門的開放資料,資料的更新與正確程度仍需受到檢視,種種因素也都反應著資料分析流程中前處理與清整的重要性。

在資料越趨數位化的情況下,台灣保險科技的服務以客戶為導向發展,透過自動化與智慧化技術的引領下,預期未來將有更多圖資相關的創新應用,藉以減少人力成本、改善作業流程,進而翻轉金融保險業的風險評估方式。

圖一   日期時間的特徵工程表達


圖二   地址空間資訊與開放資料的多樣性整合

葉向原 教授-東吳大學
現任東吳大學巨量資料管理學院資料科學系教授;專長為人工智慧、機器學習、深度學習創新應用。

全新功能

立即訂閱Yahoo!E保網推播通知,隨時掌握各種保險知識及各項最新活動&優惠訊息!