Show simple item record

2022-06-03Kumulative Dissertation DOI: 10.18452/24444
Machine Learning for Credit Risk Analytics
dc.contributor.authorKozodoi, Nikita
dc.date.accessioned2022-06-03T12:51:47Z
dc.date.available2022-06-03T12:51:47Z
dc.date.issued2022-06-03none
dc.identifier.urihttp://edoc.hu-berlin.de/18452/25386
dc.description.abstractDer Aufstieg des maschinellen Lernens (ML) und die rasante Digitalisierung der Wirtschaft haben die Entscheidungsprozesse in der Finanzbranche erheblich verändert. Finanzinstitute setzen zunehmend auf ML, um die Entscheidungsfindung zu unterstützen. Kreditscoring ist eine der wichtigsten ML-Anwendungen im Finanzbereich. Die Aufgabe von Kreditscoring ist die Unterscheidung ob ein Antragsteller einen Kredit zurückzahlen wird. Finanzinstitute verwenden ML, um Scorecards zu entwickeln, die die Ausfallwahrscheinlichkeit eines Kreditnehmers einschätzen und Genehmigungsentscheidungen automatisieren. Diese Dissertation konzentriert sich auf drei große Herausforderungen, die mit dem Aufbau von ML-basierten Scorekarten für die Bewertung von Verbraucherkrediten verbunden sind: (i) Optimierung von Datenerfassungs- und -speicherkosten bei hochdimensionalen Daten von Kreditantragstellern; (ii) Bewältigung der negativen Auswirkungen von Stichprobenverzerrungen auf das Training und die Bewertung von Scorekarten; (iii) Messung und Sicherstellung der Fairness von Instrumenten bei gleichzeitig hoher Rentabilität. Die Arbeit bietet und testet eine Reihe von Instrumenten, um jede dieser Herausforderungen zu lösen und die Entscheidungsfindung in Finanzinstituten zu verbessern. Erstens entwickeln wir Strategien zur Auswahl von Merkmalen, die mehrere unternehmensbezogene Zielfunktionen optimieren. Unsere Vorschläge reduzieren die Kosten der Datenerfassung und verbessern die Rentabilität der Modelle. Zweitens schlagen wir Methoden zur Abschwächung der negativen Auswirkungen von Stichprobenverzerrungen vor. Unsere Vorschläge gleichen die Verluste aufgrund von Verzerrungen teilweise aus und liefern zuverlässigere Schätzungen der künftigen Scorecard-Leistung. Drittens untersucht die Arbeit faire ML-Praktiken in Kreditscoring. Wir katalogisieren geeignete algorithmische Optionen für die Einbeziehung von Fairness-Zielen und verdeutlichen den Kompromiss zwischen Gewinn und Fairness.ger
dc.description.abstractThe rise of machine learning (ML) and the rapid digitization of the economy has substantially changed decision processes in the financial industry. Financial institutions increasingly rely on ML to support decision-making. Credit scoring is one of the prominent ML applications in finance. The task of credit scoring is to distinguish between applicants who will pay back the loan or default. Financial institutions use ML to develop scoring models to estimate a borrower's probability of default and automate approval decisions. This dissertation focuses on three major challenges associated with building ML-based scorecards in consumer credit scoring: (i) optimizing data acquisition and storage costs when dealing with high-dimensional data of loan applicants; (ii) addressing the adverse effects of sampling bias on training and evaluation of scoring models; (iii) measuring and ensuring the scorecard fairness while maintaining high profitability. The thesis offers a set of tools to remedy each of these challenges and improve decision-making practices in financial institutions. First, we develop feature selection strategies that optimize multiple business-inspired objectives. Our propositions reduce data acquisition costs and improve model profitability and interpretability. Second, the thesis illustrates the adverse effects of sampling bias on model training and evaluation and suggests novel bias correction frameworks. The proposed methods partly recover the loss due to bias, provide more reliable estimates of the future scorecard performance and increase the resulting model profitability. Third, the thesis investigates fair ML practices in consumer credit scoring. We catalog algorithmic options for incorporating fairness goals in the model development pipeline and perform empirical experiments to clarify the profit-fairness trade-off in lending decisions and identify suitable options to implement fair credit scoring and measure the scorecard fairness.eng
dc.language.isoengnone
dc.publisherHumboldt-Universität zu Berlin
dc.relation.hasparthttps://doi.org/10.1016/j.ejor.2021.06.023
dc.relation.hasparthttps://doi.org/10.1007/978-3-030-66981-2_6
dc.relation.hasparthttps://doi.org/10.1016/j.dss.2019.03.011
dc.relation.hasparthttps://doi.org/10.1007/978-3-030-18500-8_9
dc.relation.hasparthttps://link.springer.com/chapter/10.1007/978-3-030-46133-1_31
dc.rights.urihttp://rightsstatements.org/vocab/InC/1.0/
dc.subjectKreditscoringger
dc.subjectmaschinelles Lernenger
dc.subjectMerkmalsauswahlger
dc.subjectStichprobenverzerrungger
dc.subjectFairnessger
dc.subjectcredit scoringeng
dc.subjectmachine learningeng
dc.subjectfeature selectioneng
dc.subjectsampling biaseng
dc.subjectfairnesseng
dc.subject.ddc000 Informatik, Informationswissenschaft, allgemeine Werkenone
dc.titleMachine Learning for Credit Risk Analyticsnone
dc.typedoctoralThesis
dc.identifier.urnurn:nbn:de:kobv:11-110-18452/25386-6
dc.identifier.doihttp://dx.doi.org/10.18452/24444
dc.date.accepted2022-03-24
dc.contributor.refereeLessmann, Stefan
dc.contributor.refereeKlein, Nadja
dc.subject.rvkQK 320
local.edoc.pages194none
local.edoc.type-nameKumulative Dissertation
local.edoc.institutionWirtschaftswissenschaftliche Fakultätnone

Show simple item record