använda maskininlärning för att lösa Dataavstämningsutmaningar i finansiella tjänster

att vinna i finansiella tjänster handlar alltmer om hastigheten och noggrannheten i data normalisering och avstämning. Banker, kapitalförvaltare, vårdnadshavare, mäklare-återförsäljare, portföljförvaltare, marknadsverktyg etc. alla är i grunden datadrivna. Tusentals anställda ombord, matchar, beräknar och rapporterar stora mängder data varje dag över alla delar av verksamheten.

att förena data så att de kan aggregeras, analyseras och rapporteras är en oändlig aktivitet inom finansiella tjänster. Mycket av detta avstämningsarbete utförs av datateam med traditionella ETL-verktyg, men kalkylblad och manuella processer är frodas. Ineffektivitet och kostnader finns i överflöd, särskilt vid ombordstigning av nya datakällor.

dataavstämning ineffektivitet är exakt den typ av ”lågt hängande frukt” grundläggande maskininlärning kan lösa. Multiplar av värde i form av tid, driftskostnad och undvikande av lagstadgade påföljder kan låsas upp genom att använda maskininlärning vid viktiga dataavstämningspunkter.

ineffektivitet i dataavstämning kan förekomma i någon del av verksamheten där:

  • nya datakällor måste matchas med interna eller externa poster (kund, säkerhetsmästare, position, LEI, etc.)
  • flera datakällor / typer jämförs eller aggregeras (marknadsrisk, kreditrisk, riskvägda tillgångar, likviditetsstresstestning, exponeringsgränser, BCBS 239, etc.)
  • interna data måste matcha en extern databas med rekord (transaktionsregister, regulatordatabas, 3: e parts kreditrapporter, AML / KYC / CFT, etc.)
  • manuella kontroller och godkännandeprocesser finns (kund onboarding, transaktionskontroll, lånekontroll, leverantörsskulder etc.)
  • det finns ett system-eller datamigreringsprojekt (aggregering av flera system till ett, ombord på ett nytt system, förvärv av en ny låneportfölj eller kundkonton etc.)
  • regulatorisk rapportering är mandat (Dodd-Frank, MiFiD II / MiFiR, OFAC, GDPR, etc.)
  • revisionsspår produceras och analyseras (interna revisioner, regulatoriska revisioner, CAT 613, OATS, IFRS 9, SMR, SOX, etc.)
  • Flera 1-till-1-avstämningar aggregeras i flera delar avstämningar (säkerheter nettning, bank holdingbolag rapportering, etc.)
  • marknadskraven har utvecklats snabbt (flera börser, marknadsstruktur, cloud computing, TARGET2 bosättningar, verktyg, etc.)

den” nya normala ” — varför traditionella ETL och fasta datastrukturer misslyckas

långtgående nya affärs-och regelkrav som är beroende av snabb hantering, avstämning och aggregering av komplexa data har blivit ”nya normala” inom finansiella tjänster. Tyvärr anpassar sig traditionella fasta datamodeller / ETL-metoder dåligt till dessa komplexa nya krav.

enligt den traditionella modellen måste affärsanalytiker och ETL / dataspecialister skapa tekniska krav, ombord på nya datakällor, analysera data och tillämpa ETL-processer som matchar en fast datamodell nedströms. Detta är mycket komplext, tar betydande tid och kräver ofta att projektets omfattning utvidgas till flera delar av verksamheten.

dessa begränsningar kan orsaka fyra effekter på verksamheten:

  1. stränga begränsningar för intag av nya datakällor kan orsaka kritiska förseningar när hastighet krävs för att uppfylla ett uppdragskritiskt mål (M&a, regelverk / efterlevnad)
  2. det skalar inte bra. Att hoppa från arbetsbelastningar på BAU-nivå och datavolymer för att hantera stora nya projekt på korta tidslinjer kan kasta data-och teknikteamen i kaos.
  3. det förflutna definierar framtiden: system som är utformade för att uppfylla gamla krav kan väsentligt begränsa hur nya data kan intas och vad som kan göras med data nedströms.
  4. nya datatyper och källor kan kräva betydande processrekonstruktion, utbildning och anställning. Detta kan driva projekt tidsramar förbi” hårt stopp ” datum som definieras av verksamheten eller tillsynsmyndigheter.

ytterligare två (mycket negativa) saker kan också uppstå:

  • nya affärs-eller regleringsprojekt kan falla bakom schemat och överstiga de tillgängliga budgetarna.
  • företagsanvändare undviker att få datateamet involverat och utveckla sina egna kalkylarkbaserade processer för att ombord och förena data. Detta medför höga kostnader, låg transparens / granskbarhet och höga felfrekvenser.

hur maskininlärning kan öka effektiviteten och minska kostnaderna för Dataavstämning

grundläggande maskininlärning kan implementeras för att hjälpa till att lösa hastighets-och kostnadsproblemen för ombordstigning och avstämning av nya datakällor.

huvudproblemet med strukturerad data / ETL-tillvägagångssätt är den långsamma hastigheten att ta på sig nya data och matchning. Den största ”bang for the buck” kan uppnås genom att ta ut långsamma mänskliga baserade processer i det initiala data ombord och ersätta dem med en maskin som analyserar och lär sig hur man hanterar de nya uppgifterna.

det perfekta systemet för detta ändamål:

  • ansluter till de flesta / alla datakällor (den nya källan samt befintliga källor för att matcha, plus befintliga strukturerade datakällor och ETL lager)
  • intar data i ett brett spektrum av format (csv, XML, feed, SQL, NoSQL, etc.)
  • bearbetar data i minnet för att maximera hastighet och kapacitet
  • har en inbyggd datamotor som automatiskt ”lär sig” datakällor och mönster, analyserar den för sannolika matchningar över flera datamängder, belyser avstämningsundantag / missmatchningar och presenterar handlingsbara ”att göra”-listor för att lösa dataproblem
  • har ett lättanvänt gränssnitt som hjälper analytiker att snabbt bygga datakontrollregler på en central plats med möjlighet att implementera automatiserade godkännandeprocesser
  • registrerar alla aktiviteter i ett granskningsbart format

tre Fallstudier av maskininlärning i storskaliga Avstämningsprojekt

Case # 1: avgifter, prissättning och transaktionsdata från 200+ finansiella rådgivare till ett USA-baserat förmögenhetsförvaltningsföretag

en avstämningsplattform med maskininlärningsfunktioner implementerades vid ett stort USA-baserat förmögenhetsförvaltningsföretag. Innan systemet implementerades måste operationsteamet manuellt förena hundratals datakällor dagligen från Excel, PDF, e-post och 220+ webbplatser som lämnats in av företagets finansiella rådgivare. Processen saknade kontroll, automatisering och tillsynsgranskning/godkännande.

implementering av det nya systemet involverade att peka det på datakällorna och sedan låta maskininlärnings-och avstämningsmotorn bearbeta data i minnet. Sannolikhetsbaserade algoritmer tillämpades och potentiella felmatchningar / undantag genererades i en rapport. Operationsteamet behandlade sedan dessa och kunde snabbt utveckla återanvändbara matchningsregler och godkännanden / kontroller på en central plats. När reglerna byggdes upp kunde systemet automatiskt kontrollera datakvaliteten inom angivna toleranser, generera undantagsrapporter och mata ut en fil som ska intas av företagets redovisningssystem. Detta eliminerade den operativa risken genom att manuellt klippa och klistra in data, genomföra tillsynsgranskning och automatiskt integrera den med redovisningssystemet. Effektivitetsvinster på flera miljoner dollar per år uppnåddes.

Fall # 2: Broker-dealer avstämning av flera börser till flera interna system för ETD

en stor mäklare-återförsäljare med global verksamhet trades ETD över 80 + olika börser. Flera interna system används för att fånga och bearbeta värdepapper, handel, pris, position och kunddata. På grund av den höga komplexitetsnivån och prestandakraven, i kombination med brist på avstämning och normaliserad kontrollram, kunde företaget alltmer inte expandera till nya marknader. Företaget uppskattade att det tog över 200 man-dagar att ombord på en ny utbyte.

företaget implementerade ett avstämningssystem med maskininlärning och matchande funktioner i minnet. Systemet intog data från 80 + utbyten och normaliserade / försonade det med de olika interna systemen med sina fasta datastrukturer. Inlärningsmotorn kunde snabbt bearbeta miljontals historiska transaktioner, Visa undantag och felaktigheter och föreslå matchningsregler. Företaget kunde ombord 2 utbyten per dag, snarare än 2 per månad.

exempel # 3: Förvärv av en ny företagslåneportfölj från en annan långivare

en regionbank förvärvade en portfölj på flera tusen företagslån från en konkurrent. Onboarding-processen för dessa lån skulle kräva kund Onboarding, KYC / AML, Treasury, gränser, teknik, Projektledning, kundfordringar, säljbankens Låneoperationsteam och eventuellt låntagarnas Finansteam.

uppgifterna hölls i försäljningsbanken i olika system och format och var knutna till olika kund-och kreditposter. Ombordstigning av lånedata krävde analys av data, matchning med bankens interna LMS, identifiering av felmatchningar och luckor, skapande av avstämningsregler och matchning till interna kundregister. Detta måste göras innan lånen kan hanteras, ingår i P& L och riskberäkningar, och faktureras. Bankens interna team uppskattade ombordstigning av låneportföljen skulle kräva 5-6 månader med sina befintliga system, med analys varje lån som krävs.

banken valde att implementera ett molnbaserat avstämningssystem med maskininlärning. Låneportföljen och tillhörande kund-och betalningsposter laddades in i systemet och matchades med bankens interna LMS och bokföring. Systemet kunde matcha cirka 65% av data till interna poster inom 1 dag och presenterade återstående data i en central instrumentpanel för upplösning. Hela portföljen var ombord på 2 veckor, inklusive nya matchningsregler och register, kontroller och import till företagets LMS.

i ett nötskal

som dessa exempel visar kan grundläggande maskininlärningsfunktioner utnyttjas för att snabbt uppfylla affärs-och myndighetskrav där traditionella strukturerade datametoder misslyckas. Med den snabba förändringen i finansiella tjänster kan det leda till betydande fördelar att undersöka hur maskininlärning kan användas för dataavstämning i ditt företag.

Lämna ett svar

Din e-postadress kommer inte publiceras.