流程總覽

總覽

本頁面概述洗錢防範 AI 處理程序,並介紹相關重要概念,方便客戶瞭解相關資訊。這項服務主要針對將使用 AML AI 訓練、測試及部署模型的團隊。

銀行可透過 AML AI 自動訓練、測試及部署偵測洗錢的模型。AML AI 指南分為五個左側導覽部分,對應下列五個步驟。

步驟說明
1. 設定 AML AI 確認 Google Cloud 專案已準備好使用 AML AI。啟用必要的 Google Cloud 服務,並設定記錄和配額。 建立一或多個 AML AI 執行個體。
2. 為 AML AI 準備資料 查看資料模型和結構定義。決定要納入哪些資料。 收集及轉換必要的核心銀行資料、風險調查資料,以及您需要的任何其他資料。建立及驗證資料集。
3. 產生模型並評估成效 瞭解 AML AI 引擎、模型和回測。
  1. 設定引擎
  2. 訓練模型
  3. 評估模型效能
4. 產生風險分數和可解釋性 註冊零售和商業銀行客戶。使用模型為下列項目產生個別風險分數和可解釋性:
  • 風險治理分析與測試
  • 前製和正式版使用
5. 準備模型和風險管理 將經過微調、訓練、評估和預測的 AML AI 輸出內容,與 AML 概念和產品文件結合,以符合模型風險治理程序的要求。

建立、測試及部署模型的核心反詐欺 AI 技術作業如下所示。這些支援步驟對應上表中的步驟 2 至 4。

  1. 建立 AML AI 資料集:為 AML AI 建立一組結構化的 BigQuery 輸入資料表
  2. 引擎設定:針對 AML AI 資料集調整 AML AI 引擎,包括超參數調整
  3. 模型訓練:使用引擎設定和資料集訓練 AML AI 模型
  4. 回測:根據資料集的歷來資料測試 AML AI 模型,並匯總成效
  5. 註冊各方:註冊各方 (銀行的客戶,擁有銀行產品並傳送或接收交易),以便在預測中評分
  6. 預測:產生可用於實際工作環境的派對分數和可解釋性

引擎設定、模型訓練、模型回測和模型預測都需要 AML AI 資料集做為輸入內容,並傳回其他作業中使用的相應構件。舉例來說,模型訓練會傳回經過訓練的 AML AI 模型參照,可用於回測或預測。如需作業的技術詳細資料,請參閱 REST 參考資料總覽

反洗錢 AI 程序的依附元件樹狀結構

反洗錢 AI 程序的依附元件樹狀結構

使用反洗錢 AI 時的重要考量

本節旨在向客戶介紹反洗錢 AI 的關鍵概念,並提供一些最佳做法。如要進一步瞭解這些主題,請參閱專屬指南和提供的連結。

日期一致性

AML AI 會根據不同的作業使用不同的時間範圍。請謹慎選取每項作業的日期,確保可靠的結果。特別是為了避免結果出現偏差,請務必確保用於訓練反洗錢 AI 模型的月份,與用於回測的月份不重疊。

由於 AML AI 資料集包含多個月的資料,因此資料集可用於多項作業,但必須依據這些正確的日期選項。下圖說明使用 AML AI 的開發週期,其中單一資料集內的不同時間範圍 (跨越 42 個月) 用於設定引擎 (超參數調整)、訓練和回測。所有這些程序都會使用回溯期,為模型提供背景資訊,並可安全地與用於其他作業的資料重疊。

如要進一步瞭解 AML AI 資料集和不同作業的時限,請參閱「瞭解資料範圍和時間長度」。

如要確保正確記錄資料隨時間的變化,請參閱「資料隨時間的變化」。

建立 AML AI 資料集 - 步驟 1-4

製作批次頻率

在預測時,AML AI 會根據每個日曆月的資料產生 AML 風險分數。客戶通常會在每月批次處理程序中使用 AML AI,建議您盡可能在有完整交易資料的月份執行預測作業。

欄位一致性

如同任何機器學習程序,訓練資料和測試資料之間的資料應盡可能一致。如果欄位未一致填入資料,變更可能會導致結果不準確。強烈建議您採取必要步驟,確保在開發週期中,每個作業的欄位都能一致填入資料,尤其是在每個作業使用不同資料集的情況下。詳情請參閱「資料集一致性」。

引擎設定

建立引擎設定後,通常不需要為每個新資料集或每個開發週期重新建立引擎設定。在引擎設定中為某個資料集選擇的超參數,通常在類似的資料集上也能發揮良好的效能。

下圖說明迭代式開發週期,而上圖則是使用單一資料集進行模型訓練和回測作業。

詳情請參閱「何時應調整或繼承」。

建立 AML AI 資料集 - 步驟 3-4

資料歷程

大多數模型治理政策都會定義追蹤資料系譜的必要條件,這些資料系譜會用於引擎設定、訓練、評估和預測等所有機器學習作業。客戶有責任追蹤這類資料沿革。

建議您在所有輸入資料、AML AI 資源和輸出資料的名稱中使用專屬 ID,以便追蹤各階段的沿革。這有助於確保在特定執行作業中,資源之間的連結強度。客戶也可以為所有反洗錢 AI 資源加上標籤,以符合血統規定。

此外,建議您在 API 要求中使用 BigQuery 快照,確保資料階層正確無誤。

這項設定可協助您回答「這個引擎設定來自何處?」和「這個模型來自何處?」等問題,同時協助調查及解決事件。

如要進一步瞭解如何建立及管理反詐欺 AI 資源,請參閱 REST API 頁面。

建立 AML AI 資料集 - 步驟 3-4