總覽
本頁面概述洗錢防範 AI 處理程序,並介紹相關重要概念,方便客戶瞭解相關資訊。這項服務主要針對將使用 AML AI 訓練、測試及部署模型的團隊。
銀行可透過 AML AI 自動訓練、測試及部署偵測洗錢的模型。AML AI 指南分為五個左側導覽部分,對應下列五個步驟。
步驟 | 說明 |
---|---|
1. 設定 AML AI | 確認 Google Cloud 專案已準備好使用 AML AI。啟用必要的 Google Cloud 服務,並設定記錄和配額。 建立一或多個 AML AI 執行個體。 |
2. 為 AML AI 準備資料 | 查看資料模型和結構定義。決定要納入哪些資料。 收集及轉換必要的核心銀行資料、風險調查資料,以及您需要的任何其他資料。建立及驗證資料集。 |
3. 產生模型並評估成效 | 瞭解 AML AI 引擎、模型和回測。
|
4. 產生風險分數和可解釋性 | 註冊零售和商業銀行客戶。使用模型為下列項目產生個別風險分數和可解釋性:
|
5. 準備模型和風險管理 | 將經過微調、訓練、評估和預測的 AML AI 輸出內容,與 AML 概念和產品文件結合,以符合模型風險治理程序的要求。 |
建立、測試及部署模型的核心反詐欺 AI 技術作業如下所示。這些支援步驟對應上表中的步驟 2 至 4。
- 建立 AML AI 資料集:為 AML AI 建立一組結構化的 BigQuery 輸入資料表
- 引擎設定:針對 AML AI 資料集調整 AML AI 引擎,包括超參數調整
- 模型訓練:使用引擎設定和資料集訓練 AML AI 模型
- 回測:根據資料集的歷來資料測試 AML AI 模型,並匯總成效
- 註冊各方:註冊各方 (銀行的客戶,擁有銀行產品並傳送或接收交易),以便在預測中評分
- 預測:產生可用於實際工作環境的派對分數和可解釋性
引擎設定、模型訓練、模型回測和模型預測都需要 AML AI 資料集做為輸入內容,並傳回其他作業中使用的相應構件。舉例來說,模型訓練會傳回經過訓練的 AML AI 模型參照,可用於回測或預測。如需作業的技術詳細資料,請參閱 REST 參考資料總覽。
反洗錢 AI 程序的依附元件樹狀結構
使用反洗錢 AI 時的重要考量
本節旨在向客戶介紹反洗錢 AI 的關鍵概念,並提供一些最佳做法。如要進一步瞭解這些主題,請參閱專屬指南和提供的連結。
日期一致性
AML AI 會根據不同的作業使用不同的時間範圍。請謹慎選取每項作業的日期,確保可靠的結果。特別是為了避免結果出現偏差,請務必確保用於訓練反洗錢 AI 模型的月份,與用於回測的月份不重疊。
由於 AML AI 資料集包含多個月的資料,因此資料集可用於多項作業,但必須依據這些正確的日期選項。下圖說明使用 AML AI 的開發週期,其中單一資料集內的不同時間範圍 (跨越 42 個月) 用於設定引擎 (超參數調整)、訓練和回測。所有這些程序都會使用回溯期,為模型提供背景資訊,並可安全地與用於其他作業的資料重疊。
如要進一步瞭解 AML AI 資料集和不同作業的時限,請參閱「瞭解資料範圍和時間長度」。
如要確保正確記錄資料隨時間的變化,請參閱「資料隨時間的變化」。
製作批次頻率
在預測時,AML AI 會根據每個日曆月的資料產生 AML 風險分數。客戶通常會在每月批次處理程序中使用 AML AI,建議您盡可能在有完整交易資料的月份執行預測作業。
欄位一致性
如同任何機器學習程序,訓練資料和測試資料之間的資料應盡可能一致。如果欄位未一致填入資料,變更可能會導致結果不準確。強烈建議您採取必要步驟,確保在開發週期中,每個作業的欄位都能一致填入資料,尤其是在每個作業使用不同資料集的情況下。詳情請參閱「資料集一致性」。
引擎設定
建立引擎設定後,通常不需要為每個新資料集或每個開發週期重新建立引擎設定。在引擎設定中為某個資料集選擇的超參數,通常在類似的資料集上也能發揮良好的效能。
下圖說明迭代式開發週期,而上圖則是使用單一資料集進行模型訓練和回測作業。
詳情請參閱「何時應調整或繼承」。
資料歷程
大多數模型治理政策都會定義追蹤資料系譜的必要條件,這些資料系譜會用於引擎設定、訓練、評估和預測等所有機器學習作業。客戶有責任追蹤這類資料沿革。
建議您在所有輸入資料、AML AI 資源和輸出資料的名稱中使用專屬 ID,以便追蹤各階段的沿革。這有助於確保在特定執行作業中,資源之間的連結強度。客戶也可以為所有反洗錢 AI 資源加上標籤,以符合血統規定。
此外,建議您在 API 要求中使用 BigQuery 快照,確保資料階層正確無誤。
這項設定可協助您回答「這個引擎設定來自何處?」和「這個模型來自何處?」等問題,同時協助調查及解決事件。
如要進一步瞭解如何建立及管理反詐欺 AI 資源,請參閱 REST API 頁面。