Invatare automata pentru activitati bancare: caz de utilizare a aprobarii imprumuturilor

Modelul de afaceri fundamental al bancilor se bazeaza pe intermedierea financiara prin cresterea finantarii si imprumuturilor (credite ipotecare, imobiliare, de consum si companii). porno lesbien français acesta din urma este sursa majora de risc de credit compus din 2 puncte principale de aprobare si frauda a creditului. astrid nelsia porno in aceasta postare ne vom concentra pe aprobarea imprumutului utilizand modele de invatare automata. porno etranger

Acordarea de credite atat clientilor cu amanuntul, cat si celor corporative pe baza punctajului de credit este un instrument cheie de evaluare a riscurilor care permite gestionarea, intelegerea si cuantificarea optima a riscului de credit al unui potential debitor prin „scorul de solvabilitate”, care reprezinta o tehnica de evaluare mai robusta si mai consistenta in comparatie cu punctajul de evaluare. film porno ado

Scorarea creditului in portofoliile de vanzare cu amanuntul reflecta riscul implicit al unui client in momentul solicitarii imprumutului, ajuta la decizia de a accepta sau a respinge cererea de credit pe baza a 4 date de intrare principale:

· Informatii despre clienti: varsta, sex, stare civila, loc de munca, venituri / salariu, locuinta (chirie, proprie, gratuit), geografica (urbana / rurala), stare rezidentiala, client existent (DA / N), numarul de ani ca client , datoria totala, soldul contului. porno tcheque

· Informatii despre credit: Suma totala, scopul, valoarea platii lunare, rata dobanzii, . film porno trio . porno jeune gay . film porno japonais

· Istoricul creditului: Istoricul platilor si intarzierile (intarzierile platii), Suma datoriei curente, numarul de luni restante la plata, Durata istoricului creditului, perioada de la ultimul credit, Tipurile de credit utilizate. reportage porno

· Comportamentul contului bancar: suma medie lunara a economiilor, nivelurile maxime si minime ale soldului, cifra de afaceri a creditului, tendinta platilor, tendinta soldului, numarul de plati ratate, limita de credit depasita, schimbarea de ori a domiciliului

Invatarea automata creste intelegerea, aratand care sunt factorii care afecteaza cel mai mult rezultatele specifice: matricea de corelatie ajuta la eliminarea variabilelor corelate si metodele de selectare a caracteristicilor (in special corelatiile multivariate), cum ar fi regresia in trepte, sunt utilizate pentru a filtra predictori irelevanti; adauga cea mai buna caracteristica (sau sterge cea mai proasta caracteristica) la fiecare runda si evalueaza eroarea modelului in fiecare iteratie folosind validarea incrucisata pentru a pastra in cele din urma subsetul celor mai buni predictori (subiectul „selectia caracteristicii” va fi abordat intr-un post separat)

Regresia logistica si arborii de decizie sunt ambele tehnici populare de clasificare (invatare supravegheata) utilizate pentru a construi tabele de scor comportamentale, sunt metode statistice care analizeaza un set de date pentru a scoate in evidenta relatia dintre „predictori” (sau explicatii) care sunt variabile independente si un „raspuns” (sau variabila Rezultat) care este o variabila dependenta. porno cuisine In cazul nostru, incercam sa estimam probabilitatea acordarii unui imprumut, avand in vedere valoarea variabilei de intrare vazuta mai sus. ladyboy porno Pentru simplificare, vom restrange numarul de variabile la 4 urmatori predictori „varsta, venit, suma medie lunara a economiilor, durata creditului”. film porno homo

In regresia logistica, tinta y este binara ( Acordat p = 1 / Nu este acordat p = 0) si probabilitatea p de acordare a creditului. shakira porno Scopul este de a gasi coeficienti αi cu formula de mai jos pentru a prezice o transformare a logit P . porno string

Logit ( p ) = log ( p / [p-1] ) = α0 + α1 . porno italien vintage varsta + α2 . africa porno



  • porno gay fr
  • dream porno movies
  • porno gay jeune
  • porno turc
  • video porno pussy
  • porno culotte
  • danse porno
  • porno italian
  • cheval porno
  • film porno ancien
  • porno guadeloupe
  • jeune gay porno
  • porno douche
  • porno de dingue
  • porno chatte
  • sauna porno
  • thai porno
  • telecharger porno
  • dalila porno
  • petite fille porno




venit + α3 . porno entre hommes suma de economii + α4 . actrice porno asiatique durata creditului

Pentru a gasi coeficientii αi , pregatim modelul de clasificare cu un istoric de date etichetat, unde decizia „acordata” / „neacordata” este deja cunoscuta, folosind entropia incrucisata ca functie de pierdere pentru a compara predictiile ^ y

vs etichete y :

Valorile lui αi sunt cele care minimizeaza L (α0, . porno gay amateur . video porno perfect , α4) folosind prima sa derivata si un algoritm de optimizare, cum ar fi descendenta in gradient:

In Arborele deciziilor (cum ar fi CRT, QUAID, QUEST, C5. 0) construim un model de clasificare care invata reguli de decizie deduse din caracteristicile datelor pentru a face predictii, generand o structura arborescenta cu noduri de decizie corespunzatoare atributelor (variabile de intrare).

· Pasul 1: utilizati criteriul de impartire (cum ar fi castigul informatiei, raportul de castig, indicele Gini) pentru a selecta atributul cu cel mai bun scor care va fi ales pentru a produce cel mai pur nod referitor la variabila tinta (in cazul nostru, atributul care separa cel mai bine „Acordat” din „Neacordat”).

· Pasul 2: creati nodul divizat radacina cu subseturile aferente, apoi repetati pasul 1 pentru fiecare subset reutilizand criteriul de divizare pentru a selecta urmatorul atribut cel mai bun pentru a produce sub-nodurile cele mai pure referitoare la variabila tinta.

· Pasul 3: repetati pasul 2 pana cand ajungeti la un criteriu de oprire, de exemplu: Puritatea nodului> limita pre-specificata sau Adancimea nodului> limita pre-specificata sau pur si simplu valorile predictorului pentru toate inregistrarile sunt identice (nu ar putea fi mai multa regula generat)

· Pasul 4: aplicati Tunderea pentru a evita supradezionarea, utilizand un criteriu pentru a elimina sectiunile arborelui care ofera putina putere de clasificare si determinare a dimensiunii optime a arborelui. Pentru a face acest lucru, cream seturi de date distincte „set de antrenament” si „set de validare”, pentru a evalua efectul taierii si folosim testul statistic (cum ar fi Chi-patrat pentru CHAID) pentru a estima daca taierea sau extinderea unui anumit nod produc o imbunatatire. Avem doua tipuri de taiere:

o Pre-taierea nu mai creste copacul mai devreme, inainte ca acesta sa clasifice perfect setul de antrenament.

o Post-taierea permite copacului sa creasca si apoi sa-l taie inapoi.

Regresia logistica este populara pentru modelarea scorecard-urilor care au o gama continua de scoruri intre 0 si 1, spre deosebire de arborii de decizie care au doar un set limitat de valori ale scorului (fiecare nod frunza = scor particular), prin urmare, este posibil sa nu fie suficient sa sa ofere o buna distinctie intre debitori in ceea ce priveste riscul de neplata.

In plus, putem folosi alte modele precum analiza discriminanta, retelele neuronale si masinile vectoriale de suport (SVM); sau le putem combina folosind metode de ansamblu, cum ar fi pungi pentru mai multa stabilitate si cresterea pentru mai multa precizie (metodele de ansamblu vor fi abordate intr-un post separat).