기계 학습을 사용하여 금융 서비스의 데이터 조정 문제 해결

금융 서비스에서 승리하는 것은 데이터 정규화 및 조정의 속도와 정확성에 관한 것입니다. 은행,자산 관리자,관리인,브로커-딜러,포트폴리오 관리자,시장 유틸리티 등 모두 기본적으로 데이터 중심입니다. 수천 명의 직원이 비즈니스의 모든 부분에서 매일 방대한 양의 데이터를 탑재,일치,계산 및 보고합니다.

데이터를 집계,분석 및보고 할 수 있도록 조정하는 것은 금융 서비스에서 끝없는 활동입니다. 이러한 조정 작업의 대부분은 전통적인 데이터 툴을 사용하는 데이터 팀이 수행하지만 스프레드시트와 수동 프로세스가 만연합니다. 특히 새로운 데이터 소스를 온보딩할 때 비효율성과 비용이 많이 듭니다.

데이터 조정 비효율은 기본 기계 학습이 해결할 수있는”낮은 교수형 과일”유형입니다. 주요 데이터 조정 지점에서 기계 학습을 사용함으로써 시간,운영 비용 및 규제 처벌 방지의 가치 배수를 잠금 해제 할 수 있습니다.

데이터 조정 비효율은 다음과 같은 비즈니스의 어느 부분에서나 발생할 수 있습니다:

  • 새 데이터 소스는 내부 또는 외부 레코드(고객,보안 마스터,위치,레이 등)와 일치해야 합니다.6060>
  • 여러 데이터 소스/유형이 비교 또는 집계됩니다(시장 위험,신용 위험,리스크,유동성 스트레스 테스트,노출 한도,239 등).
  • 내부 데이터는 외부 기록 데이터베이스와 일치해야 합니다.)
  • 수동 제어 및 승인 프로세스가 존재합니다(고객 온 보딩,거래 관리,대출 관리,미지급금 등
  • 시스템 또는 데이터 마이그레이션 프로젝트(여러 시스템을 하나로 통합,새로운 시스템 온보딩,새로운 대출 포트폴리오 또는 고객 계정 획득 등)가 있습니다.)
  • 규제 보고 의무화(도드-프랭크,MiFiD II/MiFiR,OFAC,GDPR,etc.2015 년 11 월 13 일~2015 년 12 월 15 일,2015 년 12 월 15 일,2015 년 12 월 15 일,2015 년 12 월 15 일,2015 년 12 월 15 일,2015 년 12 월 15 일
  • 다수의 1 대 1 화해는 여러 부분으로 구성된 화해(담보망,은행 지주회사 보고 등)로 집계됩니다.6060>
  • 시장 요구 사항이 빠르게 발전했습니다(다중 거래소,시장 구조,클라우드 컴퓨팅,대상 2 정착,유틸리티 등).)

복잡한 데이터를 신속하게 처리,조정 및 집계하는 데 의존하는 광범위한 새로운 비즈니스 및 규제 요구 사항이 금융 서비스에서”새로운 표준”이되었습니다. 불행히도,전통적인 고정 데이터 모델/데이터 접근 방식은 이러한 복잡한 새로운 요구 사항에 잘 적응하지 못합니다.

기존 모델에서 비즈니스 분석가와 데이터 전문가는 기술 요구 사항을 작성하고,새로운 데이터 소스를 내장하고,데이터를 분석하고,고정 데이터 모델과 일치하는 데이터 프로세스를 다운스트림에 적용해야 합니다. 이것은 매우 복잡하고 상당한 시간이 소요되며 종종 프로젝트의 범위를 비즈니스의 여러 부분으로 확장해야합니다.

이러한 제한은 비즈니스에 네 가지 영향을 줄 수 있습니다:

  1. 새로운 데이터 소스 수집에 대한 엄격한 제약으로 인해 미션 크리티컬 목표를 달성하기 위해 속도가 필요한 경우 심각한 지연이 발생할 수 있습니다. 짧은 일정에 대규모 새 프로젝트를 처리하기 위해 바우 수준의 워크로드 및 데이터 볼륨에서 점프하면 데이터 및 기술 팀이 혼란에 빠질 수 있습니다.
  2. 과거는 미래를 정의합니다:오래된 요구 사항을 충족하도록 설계된 시스템은 새로운 데이터를 수집 할 수있는 방법과 데이터 다운 스트림으로 수행 할 수있는 작업을 크게 제한 할 수 있습니다.
  3. 새로운 데이터 유형 및 소스는 상당한 프로세스 재 엔지니어링,교육 및 고용을 필요로 할 수 있습니다. 이는 비즈니스 또는 규제 기관이 정의한”하드 스톱”날짜를지나 프로젝트 시간 프레임을 푸시 할 수 있습니다.

두 가지 더(매우 부정적인)일이 발생할 수도 있습니다:

  • 새로운 비즈니스 또는 규제 프로젝트는 일정에 뒤쳐지고 사용 가능한 예산을 초과 할 수 있습니다.
  • 비즈니스 사용자는 데이터 팀의 참여를 피하고 자신의 스프레드 시트 기반 프로세스를 개발하여 데이터를 온보드 및 조정합니다. 이로 인해 높은 비용,낮은 투명성/감사 가능성 및 높은 오류율이 발생합니다.

기계 학습이 효율성을 높이고 데이터 조정 비용을 절감하는 방법

기본 기계 학습을 구현하여 온보딩 및 새 데이터 소스 조정의 속도 및 비용 문제를 해결할 수 있습니다.

구조화된 데이터 접근 방식의 주된 문제점은 새로운 데이터를 취하고 일치하는 속도가 느린다는 것이다. 가장 큰”벅에 대한 강타”는 초기 데이터 온 보딩 단계에서 느린 인간 기반 프로세스를 제거하고 새로운 데이터를 처리하는 방법을 분석하고 가르치는 기계로 대체함으로써 달성 할 수 있습니다.

이 목적을 위한 이상적인 시스템:

  • 대부분의/모든 데이터 소스에 연결(새 소스뿐만 아니라 일치하는 기존 소스,플러스 기존의 구조화 된 데이터 소스 및 계층)
  • 데이터 소스 및 패턴을 자동으로”학습”하고,여러 데이터 집합에서 일치 가능성이 있는지 분석하고,조정 예외/불일치를 강조 표시하고,데이터 문제를 해결하기 위해 실행 가능한”해야 할 일”목록을 제공하는 내장 데이터 엔진이 있습니다.
  • 분석가가 중앙 위치에서 데이터 제어 규칙을 신속하게 구축 할 수 있도록 도와주는 사용하기 쉬운 인터페이스를 갖추고 있습니다.
  • 감사 가능한 형식으로 모든 활동을 기록

세 대규모 조정 프로젝트에서의 기계 학습 사례 연구

사례#1:200 명 이상의 재무 고문에서 미국에 기반을 둔 자산 관리 회사에 대한 수수료,가격 및 거래 데이터

기계 학습 기능을 갖춘 조정 플랫폼은 미국의 주요 자산 관리 회사에서 구현되었습니다. 이 시스템을 구현하기 전에 운영 팀은 회사의 재무 고문이 제출 한 220 개 이상의 웹 사이트와 매일 수백 개의 데이터 소스를 수동으로 조정해야했습니다. 이 프로세스에는 제어,자동화 및 감독 검토/승인이 부족했습니다.

새 시스템을 구현하면 데이터 소스를 가리키고 기계 학습 및 조정 엔진이 메모리의 데이터를 처리 할 수 있습니다. 확률 기반 알고리즘이 적용되었고 잠재적 불일치/예외가 보고서에서 생성되었습니다. 그런 다음 운영 팀은 이러한 작업을 처리하여 중앙 위치에서 재사용 가능한 일치 규칙 및 승인/컨트롤을 신속하게 개발할 수있었습니다. 규칙이 구축되면 시스템은 지정된 허용 오차 내에서 데이터 품질을 자동으로 확인하고 예외 보고서를 생성하며 회사의 회계 시스템에서 수집 할 파일을 출력 할 수 있습니다. 이를 통해 데이터를 수동으로 절단 및 붙여 넣기로 인한 운영 위험을 없애고 감독 검토를 구현하고 회계 시스템과 자동으로 통합했습니다. 연간 수백만 달러의 효율성 향상이 달성되었습니다.

사례#2: 4611>

글로벌 운영의 대형 브로커-딜러는 80 개 이상의 서로 다른 거래소에서 거래합니다. 여러 내부 시스템은 증권,거래,가격,위치 및 고객 데이터를 캡처하고 처리하는 데 사용됩니다. 때문에 화해와 정규화 된 제어 프레임 워크의 부족과 함께 높은 복잡성 수준 및 성능 요구 사항에,회사는 새로운 시장으로 확장 할 점점 더 수 없습니다. 이 회사는 새로운 거래소에 탑승하는 데 200 일 이상이 걸렸다고 추정했습니다.

이 회사는 기계 학습 및 메모리 내 매칭 기능을 갖춘 조정 시스템을 구현했습니다. 이 시스템은 80 개 이상의 교환기에서 데이터를 수집하고 고정 된 데이터 구조를 가진 다양한 내부 시스템과 정규화/조정했습니다. 학습 엔진은 수백만 건의 과거 트랜잭션을 신속하게 처리하고 예외 및 불일치를 표시하며 일치하는 규칙을 제안 할 수있었습니다. 이 회사는 온보드 할 수 있었다 2 하루에 교환,보다는 2 달마다.

예#3: 다른 대출 기관으로부터 새로운 기업 대출 포트폴리오 취득

지역 은행은 경쟁 업체로부터 수천 개의 기업 대출 포트폴리오를 인수했습니다. 이러한 대출에 대한 온보딩 프로세스에는 고객 온보딩,재무,한도,기술,프로젝트 관리,미수금,판매 은행의 대출 운영 팀 및 잠재적으로 차용자의 금융 팀이 필요합니다.

이 데이터는 다른 시스템과 형식으로 판매 은행에 보관되었으며 다른 고객 및 신용 기록에 연결되었습니다. 대출 데이터를 온보딩하려면 데이터를 분석하고,은행의 내부 임금과 일치하고,불일치 및 격차를 식별하고,조정 규칙을 만들고,내부 고객 레코드와 일치해야 했습니다. 이 대출 관리,피&에 포함 될 수 있습니다 전에 수행 했다 리스크 계산 및 청구. 은행의 내부 팀은 모든 대출이 필요한 분석과 함께 기존 시스템에 5-6 개월이 필요한 대출 포트폴리오를 온 보딩 할 것으로 추정했습니다.

은행은 기계 학습 기능을 갖춘 클라우드 기반 조정 시스템을 구현하기로 결정했습니다. 대출 포트폴리오 및 관련 고객 및 지불 기록이 시스템에 로드되어 은행의 내부 대출 금액 및 회계 기록과 일치했습니다. 이 시스템은 1 일 이내에 데이터의 약 65%를 내부 레코드와 일치시킬 수 있었고 나머지 데이터는 해결을 위해 중앙 대시 보드에 표시했습니다. 전체 포트폴리오는 새로운 매칭 규칙 및 기록,통제 및 회사 임대에 대한 수입을 포함하여 2 주 만에 온보드 화되었습니다.

간단히 말해서

이러한 예에서 볼 수 있듯이 기본 기계 학습 기능을 활용하여 전통적인 구조화 된 데이터 접근 방식이 실패하는 비즈니스 및 규제 요구 사항을 빠르게 충족시킬 수 있습니다. 금융 서비스의 변화 속도가 빨라짐에 따라 회사에서 데이터 조정에 기계 학습을 사용하는 방법을 조사하면 상당한 이점이 발생할 수 있습니다.

답글 남기기

이메일 주소는 공개되지 않습니다.