brug af maskinlæring til at løse Dataafstemningsudfordringer i finansielle tjenester

at vinde i finansielle tjenester handler i stigende grad om hastigheden og nøjagtigheden af datanormalisering og afstemning. Banker, kapitalforvaltere, depotforvaltere, mæglerforhandlere, porteføljeforvaltere, markedsværktøjer mv. de er alle grundlæggende datadrevne. Tusinder af medarbejdere ombord, match, beregne og rapportere enorme mængder data hver dag på tværs af alle dele af virksomheden.

afstemning af data, så de kan aggregeres, analyseres og rapporteres, er en uendelig aktivitet inden for finansielle tjenester. Meget af dette afstemningsarbejde udføres af datateam med traditionelle ETL-værktøjer, men regneark og manuelle processer er voldsomme. Ineffektivitet og omkostninger bugner, især når man går ombord på nye datakilder.

dataafstemningsineffektiviteter er nøjagtigt den type “lavt hængende frugt” grundlæggende maskinindlæring kan løse. Multipla af værdi med hensyn til tid, driftsomkostninger og undgåelse af lovgivningsmæssige sanktioner kan låses op ved at anvende maskinindlæring på vigtige dataafstemningspunkter.

dataafstemningsineffektiviteter kan forekomme i enhver del af virksomheden, hvor:

  • nye datakilder skal matches med interne eller eksterne poster (kunde, sikkerhedsmaster, position, LEI osv.)
  • flere datakilder / typer sammenlignes eller aggregeres (markedsrisiko, kreditrisiko, risikovurdering, likviditetsstresstest, eksponeringsgrænser, BCBS 239 osv.)
  • interne data skal matche en ekstern database med post (transaktionsregister, regulatordatabase, 3.parts kreditrapporter, AML / KYC / CFT osv.)
  • der findes manuelle kontroller og godkendelsesprocesser (kunde onboarding, transaktionskontrol, lånekontrol, kreditorer osv.)
  • der er et system-eller datamigrationsprojekt (aggregering af flere systemer til et, ombordstigning af et nyt system, erhvervelse af en ny låneportefølje eller kundekonti osv.)
  • regulatorisk rapportering er mandat (Dodd-Frank, MiFiD II / MiFiR, OFAC, GDPR osv.)
  • revisionsspor produceres og analyseres (interne revisioner, regulatoriske revisioner, CAT 613, OATS, IFRS 9, SMR, sok osv.)
  • flere 1-til-1-afstemninger aggregeres i afstemninger i flere dele (sikkerhedsstillelse, rapportering af bankholdingselskaber osv.)
  • markedskrav har udviklet sig hurtigt (flere udvekslinger, markedsstruktur, cloud computing, TARGET2-bosættelser, forsyningsselskaber osv.)

den” nye normale “— hvorfor traditionelle ETL og faste datastrukturer mislykkes

vidtrækkende nye forretnings-og lovgivningsmæssige krav, der afhænger af hurtig håndtering, afstemning og aggregering af komplekse data, er blevet den” nye normale ” inden for finansielle tjenester. Desværre tilpasser traditionelle faste datamodel / ETL-tilgange sig dårligt til disse komplekse nye krav.

under den traditionelle model skal forretningsanalytikere og ETL / data-specialister oprette tekniske krav, ombord på nye datakilder, analysere dataene og anvende ETL-processer, der matcher en fast datamodel nedstrøms. Dette er meget komplekst, tager betydelig tid og kræver ofte at udvide projektomfanget til flere dele af virksomheden.

disse begrænsninger kan forårsage fire effekter på virksomheden:

  1. strenge begrænsninger for indtagelse af nye datakilder kan forårsage kritiske forsinkelser, når der kræves hastighed for at opfylde et missionskritisk mål (M& a, lovgivningsmæssig / overholdelse)
  2. det skaleres ikke godt. Hoppe fra Bau-niveau arbejdsbyrder og datamængder til at håndtere store nye projekter på korte tidslinjer kan kaste data og teknologi teams i kaos.
  3. fortiden definerer fremtiden: systemer designet til at imødekomme gamle krav kan i væsentlig grad begrænse, hvordan nye data kan indtages, og hvad der kan gøres med dataene nedstrøms.
  4. nye datatyper og kilder kan kræve betydelig procesteknik, uddannelse og ansættelse. Dette kan skubbe projektets tidsrammer forbi” hard stop ” – datoer defineret af virksomheden eller regulatorerne.

to yderligere (meget negative) ting kan også forekomme:

  • nye forretnings-eller reguleringsprojekter kan falde bagud og overstige de tilgængelige budgetter.
  • erhvervsbrugere undgår at involvere datateamet og udvikler deres egne regnearksbaserede processer til ombord og afstemning af data. Dette medfører høje omkostninger, lav gennemsigtighed / auditabilitet og høje fejlfrekvenser.

hvordan maskinlæring kan øge effektiviteten og reducere Dataafstemningsomkostninger

grundlæggende maskinlæring kan implementeres for at hjælpe med at løse problemer med hastighed og omkostninger ved ombordstigning og afstemning af nye datakilder.

hovedproblemet med strukturerede data / ETL-tilgange er den langsomme hastighed ved at påtage sig nye data og matche. Det største” bang for the buck ” kan opnås ved at tage langsomme menneskebaserede processer ud i den indledende data onboarding-fase og erstatte dem med en maskine, der analyserer og lærer sig selv, hvordan man håndterer de nye data.

det ideelle system til dette formål:

  • forbinder til de fleste / alle datakilder (den nye kilde samt eksisterende kilder til at matche, plus eksisterende strukturerede datakilder og ETL lag)
  • indtager data i en bred vifte af formater (csv, )
  • behandler dataene i hukommelsen for at maksimere hastighed og kapacitet
  • har en indbygget datamotor, der automatisk “lærer” datakilderne og mønstrene, analyserer dem for sandsynlige matches på tværs af flere datasæt, fremhæver afstemningsundtagelser / uoverensstemmelser og præsenterer handlingsmæssige “to do”-lister for at løse dataproblemer
  • har en brugervenlig grænseflade, der hjælper analytikere hurtigt med at opbygge datakontrolregler på et centralt sted med evnen til at implementere automatiserede godkendelsesprocesser
  • registrerer alle aktiviteter i et auditabelt format

tre Case Studies of Machine Learning in large scale Reconciliation Projects

Case #1: gebyrer, priser og transaktionsdata fra 200+ finansielle rådgivere til et amerikansk baseret Formueforvaltningsfirma

en forsoningsplatform med maskinindlæringsmuligheder blev implementeret hos et større amerikansk baseret Formueforvaltningsfirma. Før implementeringen af systemet skulle operationsholdet manuelt forene hundredvis af datakilder på daglig basis fra PDF, e-mails og 220+ hjemmesider indsendt af firmaets finansielle rådgivere. Processen manglede kontrol, automatisering og tilsynskontrol/godkendelse.

implementering af det nye system involverede at pege det på datakilderne og derefter lade maskinindlærings-og afstemningsmotoren behandle dataene i hukommelsen. Sandsynlighedsbaserede algoritmer blev anvendt, og potentielle uoverensstemmelser / undtagelser blev genereret i en rapport. Operationsteamet behandlede derefter disse og var i stand til hurtigt at udvikle genanvendelige matchningsregler og godkendelser / kontroller på et centralt sted. Når reglerne blev opbygget, kunne systemet automatisk kontrollere datakvaliteten inden for specificerede tolerancer, generere undtagelsesrapporter og udsende en fil, der skal indtages af firmaets regnskabssystem. Dette eliminerede den operationelle risiko ved manuelt at skære og indsætte data, implementerede tilsynskontrol og integrerede dem automatisk med regnskabssystemet. Effektivitetsgevinster på flere millioner dollars om året blev opnået.

sag #2: Mægler-forhandler afstemning af flere børser til flere interne systemer til ETD ‘er

en stor mægler-forhandler med global operations handler ETD’ er på tværs af 80+ forskellige børser. Flere interne systemer bruges til at indsamle og behandle værdipapirer, handel, pris, position og kundedata. På grund af det høje kompleksitetsniveau og ydelseskrav kombineret med manglende forsoning og normaliseret kontrolramme var virksomheden i stigende grad ude af stand til at ekspandere til nye markeder. Virksomheden anslog, at det tog over 200 mandedage at ombord på en ny udveksling.

firmaet implementerede et afstemningssystem med maskinindlæring og matchende funktioner i hukommelsen. Systemet indtog data fra 80 + udvekslinger og normaliserede / afstemte det med de forskellige interne systemer med deres faste datastrukturer. Læringsmotoren var i stand til hurtigt at behandle millioner af historiske transaktioner, vise undtagelser og uoverensstemmelser, og foreslå matchende regler. Firmaet var i stand til at ombord 2 udvekslinger om dagen, snarere end 2 om måneden.

eksempel # 3: Erhvervelse af en ny virksomhed låneportefølje fra en anden långiver

en regional bank erhvervet en portefølje af flere tusinde business lån fra en konkurrent. Onboarding processen for disse lån ville kræve klient Onboarding, KYC / AML, Treasury, grænser, teknologi, Projektledelse, tilgodehavender, den sælgende banks lån operationer team, og potentielt låntagernes Finance teams.

dataene blev anbragt i den sælgende bank i forskellige systemer og formater og var bundet til forskellige kunde-og kreditoptegnelser. Ombordstigning af lånedataene krævede analyse af dataene, matchning med bankens interne LMS, identifikation af uoverensstemmelser og huller, oprettelse af afstemningsregler og matchning af dem til interne kundeposter. Dette skulle gøres, før lånene kan forvaltes, inkluderet i p&L og risikoberegninger og faktureret. Bankens interne team estimerede, at ombordstigning af låneporteføljen ville kræve 5-6 måneder med deres eksisterende systemer, med analyse af hvert lån, der kræves.

banken valgte at implementere et skybaseret afstemningssystem med maskinlæringsfunktioner. Låneporteføljen og tilhørende kunde-og betalingsoptegnelser blev indlæst i systemet og tilpasset bankens interne LMS-og regnskabsposter. 65% af dataene til interne poster inden for 1 dag og præsenterede de resterende data i et centralt dashboard til opløsning. Hele porteføljen blev ombord på 2 uger, herunder nye matchende regler og optegnelser, kontroller og import til firmaets LMS.

kort sagt

som disse eksempler viser, kan grundlæggende maskinlæringsfunktioner udnyttes til hurtigt at imødekomme forretnings-og lovkrav, hvor traditionelle strukturerede datametoder mislykkes. Med hastigheden af ændringer i finansielle tjenester kan undersøgelse af, hvordan maskinlæring kan bruges til dataafstemning i din virksomhed, resultere i betydelige fordele.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.