From 5a6a00f212a9c35df0046662e8b4ce530db52c05 Mon Sep 17 00:00:00 2001 From: Variet Main Worker Date: Wed, 11 Mar 2026 01:17:15 +0000 Subject: [PATCH] Update "Methodology" --- Methodology.md | 133 ++++++++++++++++++++++++++++++++++++++++++++----- 1 file changed, 121 insertions(+), 12 deletions(-) diff --git a/Methodology.md b/Methodology.md index d64d1d5..a13b48c 100644 --- a/Methodology.md +++ b/Methodology.md @@ -7,12 +7,16 @@ ## 1. 전체 논리 흐름 ``` -[한국 3사 전이행렬 (2000-2025)] +[한국 3사 PDF (한국기업평가/NICE/한신평)] ↓ -[TTC 전이행렬 산출 (전 기간 평균)] +[전처리: WR 제거 → B이하→B 매핑 → PD 플로어 적용 → 7×7 (AAA~B+D)] + ↓ +[TTC 전이행렬 산출 (전 기간 평균, 7×7)] ↓ [Belkin & Suchower: Zt 추정 (WLS)] ← [TTC 임계값 (Φ⁻¹)] ↓ +[CCC 행/열 보간 (B↔D 사이 PD 보간) → 8×8 완성] + ↓ [Zt ~ 거시변수 회귀모형 (OLS + Stepwise)] ← [BOK ECOS 거시경제변수] ↓ [미래 시나리오 (호황/중립/불황)] → [Zt 경로 + Mean-Reversion] @@ -30,6 +34,92 @@ ## 2. 단계별 상세 이론 +### 2.0 3사 전이행렬 전처리 파이프라인 + +한국 3사 PDF에서 추출된 원시 전이행렬은 그대로 사용할 수 없습니다. 아래 6단계 전처리를 거쳐 모형에 투입합니다. + +#### 원시 데이터 구조 + +3사(한국기업평가, NICE, 한신평)의 PDF 전이행렬은 다음 형태입니다: + +``` +6행(AAA, AA, A, BBB, BB, B이하) × 8열(AAA, AA, A, BBB, BB, B이하, D, WR) +``` + +- **CCC 등급**은 한국 시장에서 발행체 수가 극소하여 별도 행이 존재하지 않음 +- **WR(등급취소)** 열이 포함되어 있어 행 합이 100%가 되지 않을 수 있음 + +#### Step 1: PDF 파싱 → 6×8 추출 + +`data/parse_pdf_matrices.py`에서 pdfplumber를 사용하여 3사 PDF에서 연도별 6×8 행렬을 추출합니다. +- 각 기관별 파서 사용 (KR: 텍스트 기반, NICE: 텍스트 기반, SCI: 테이블 기반) +- 추출된 행렬의 행합 유효성 검증 (30~110% 범위) + +#### Step 2: WR 열 제거 → 비례 재배분 + +WR(Withdrawn Rating, 등급취소)은 부도도 유지도 아닌 상태이므로 모형에서 제거해야 합니다. + +``` +재배분 후 p_{ij} = p_{ij}^{원본} / (1 - p_{i,WR}) +``` + +즉, WR을 제외한 나머지 전이확률을 비례적으로 확대하여 행 합 = 1을 복원합니다. + +**주의**: WR로 빠진 기업 중 일부는 부도 직전 등급 취소일 수 있어, 부도율이 과소추정될 가능성이 있습니다. 이를 보완하기 위해 Step 5의 PD 플로어를 적용합니다. + +#### Step 3: B이하 → B 매핑 + +3사 원본에서 "B이하" 범주를 모형의 B등급에 매핑합니다. +결과: 6×7 (AAA, AA, A, BBB, BB, B × AAA~D) + +#### Step 4: D행 추가 → 7×7 + +D(부도)는 흡수상태로 고정합니다: + +``` +D행 = [0, 0, 0, 0, 0, 0, 1] +``` + +결과: **7×7 (AAA, AA, A, BBB, BB, B, D)** — 이 행렬로 Zt 추정을 수행합니다. + +#### Step 5: PD 플로어 적용 + +한국 시장에서 AAA~A 등급의 관측 부도율이 0%인 경우가 대부분입니다. 이는 모집단이 작아 극소확률 이벤트가 관측되지 않은 것일 뿐, 부도 위험이 0이라는 의미가 아닙니다. + +**Basel III CRE30.4** 및 글로벌 장기 평균에 근거하여 PD 플로어를 적용합니다: + +| 등급 | S&P 장기평균 (1981-2023) | Moody's 장기평균 (1920-2023) | Basel III 플로어 | **적용 PD 플로어** | +|------|:---:|:---:|:---:|:---:| +| AAA | 0bp | 0bp | 5bp | **5bp** | +| AA | 2bp | 5bp | 5bp | **5bp** | +| A | 5bp | 9bp | 5bp | **7bp** | +| BBB | 14~16bp | 26bp | 5bp | **20bp** | +| BB 이하 | ≥56bp | ≥72bp | 5bp | 관측치 사용 | + +출처: docs/pd_floor_reference.md 참조 + +관측 PD가 플로어 미만인 경우, 부도열(D) 확률을 플로어 값으로 올리고, 대각 원소(잔류확률)에서 해당 차이만큼 차감하여 행 합 = 1을 유지합니다. + +#### Step 6: CCC 행/열 보간 → 8×8 완성 + +Zt 추정 완료 후, B등급과 D등급 사이를 보간하여 CCC 행/열을 생성합니다: + +``` +PD_CCC = interpolate(PD_B, PD_D=1.0) +``` + +- CCC의 PD는 B의 PD와 D의 PD(=100%) 사이에서 보간 +- CCC의 전이확률 분포도 B행과 D행의 패턴에서 보간 +- 이렇게 생성된 8×8 행렬이 최종 조건부 전이행렬 산출에 사용됩니다 + +#### 왜 CCC 없이 Zt를 추정하는가? + +1. **통계적 신뢰도**: 한국 시장에서 CCC 등급 발행체가 극소수이므로 관측 전이확률의 표본오차가 매우 큼 +2. **순환 논리 방지**: fabricated CCC 데이터로 Zt를 추정하면, 가짜 데이터가 모형 파라미터에 영향 +3. **파이프라인 정합성**: 관측 데이터(7×7)로 Zt 추정 → 모형 기반 보간(CCC)으로 확장하는 것이 이론-실무 분리 원칙에 부합 + +--- + ### 2.1 Through-The-Cycle (TTC) 전이행렬 **왜 TTC가 필요한가?** @@ -42,7 +132,7 @@ TTC_{ij} = (1/T) × Σ_{t=1}^{T} TM_{ij}(t) ``` -T개 연도의 단순 산술평균 후 행 합이 1이 되도록 재정규화합니다. +T개 연도의 단순 산술평균 후 행 합이 1이 되도록 재정규화합니다. §2.0의 전처리를 거친 7×7 행렬에 대해 TTC를 산출합니다. **논리적 근거:** - Basel II IRB 프레임워크: PD 추정은 "경기 사이클 전체를 포괄하는 장기 평균"이어야 함 (BCBS §452) @@ -85,14 +175,17 @@ d_{i,j} = Φ⁻¹( Σ_{k≤j} TTC_{i,k} ) **Z-조건부 전이확률:** -체계적 요인 Z가 주어진 상태에서의 전이확률: +체계적 요인 Z가 주어진 상태에서의 전이확률 (Belkin convention: Z>0 = 호황): ``` -p_{ij}(Z) = Φ( (d_{i,j} - √ρ × Z) / √(1-ρ) ) - Φ( (d_{i,j-1} - √ρ × Z) / √(1-ρ) ) +p_{ij}(Z) = Φ( (d_{i,j} + √ρ × Z) / √(1-ρ) ) - Φ( (d_{i,j-1} + √ρ × Z) / √(1-ρ) ) ``` -- Z > 0 (호황): 높은 등급 쪽으로 확률 이동 → 부도율 감소 -- Z < 0 (불황): 낮은 등급 쪽으로 확률 이동 → 부도율 증가 +**부호 규약 주의**: 본 프로젝트는 Belkin convention(Z>0=호황)을 사용하여 `d + √ρ·Z`입니다. +Basel/Vasicek convention(Z>0=불황)에서는 `d - √ρ·Z`이며, 두 규약은 Z의 부호만 다릅니다. + +- Z > 0 (호황): 누적확률 증가 → 높은 등급 쪽으로 확률 이동 → 부도율 감소 +- Z < 0 (불황): 누적확률 감소 → 낮은 등급 쪽으로 확률 이동 → 부도율 증가 - Z = 0: TTC 전이확률 복원 (무조건부 = 조건부의 기대값) **Zt 추정 (가중최소자승법, WLS):** @@ -147,10 +240,11 @@ NLS(비선형최소자승법)으로 ρ와 Zt를 동시 추정할 수 있습니 Vasicek 공식은 Belkin & Suchower의 특수한 경우로, 부도율만을 집중적으로 다룹니다: ``` -PD_PIT(Z) = Φ( (Φ⁻¹(PD_TTC) - √ρ × Z) / √(1-ρ) ) +PD_PIT(Z) = Φ( (Φ⁻¹(PD_TTC) + √ρ × Z) / √(1-ρ) ) [Belkin: Z>0=호황] +PD_PIT(Z) = Φ( (Φ⁻¹(PD_TTC) - √ρ × Z) / √(1-ρ) ) [Basel: Z>0=불황] ``` -이 공식은 다음을 의미합니다: +본 프로젝트에서는 Belkin convention(`+√ρ·Z`)을 주로 사용합니다. 이 공식은 다음을 의미합니다: 1. PD_TTC: 장기 평균 부도율 — 경기 중립(Z=0)에서의 부도율 2. Φ⁻¹(PD_TTC): 부도 임계값을 표준정규 공간으로 변환 3. √ρ × Z: 경기 요인이 임계값을 이동시킴 @@ -356,6 +450,10 @@ PD_weighted(t) = Σ_s w_s × PD_s(t) | 7 | ECB (2019). "Macro-financial scenarios for IFRS 9 ECL estimation" | 시나리오 가중치 | | 8 | Federal Reserve (2023). "Dodd-Frank Act Stress Test Methodology" | 불황 시나리오 설계 | | 9 | Greene, W.H. (2018). "Econometric Analysis" 8th ed. | OLS 진단, 변수 선택 | +| 10 | Basel Committee (2017). CRE30.4 "Minimum requirements — PD input floors" | PD 플로어 5bp | +| 11 | S&P Global (2024). "2023 Annual Global Corporate Default And Rating Transition Study" | 등급별 장기 평균 부도율 | +| 12 | Moody's (2024). "Annual Default Study — Corporate Default and Recovery Rates" | 등급별 장기 평균 부도율 | +| 13 | EBA/CRR3 (2025). "Capital Requirements Regulation III — IRB Input Floors" | EU PD floor 5bp 법제화 | --- @@ -363,11 +461,22 @@ PD_weighted(t) = Σ_s w_s × PD_s(t) | 모듈 | 이론 단계 | 핵심 함수 | |------|----------|----------| -| `data/transition_matrices.py` | §2.1 TTC 산출 | `compute_ttc_matrix()` | -| `data/macro_data.py` | §2.5 거시데이터 | `collect_macro_data()` | +| `data/parse_pdf_matrices.py` | §2.0 PDF 파싱·전처리 | `parse_kr()`, `parse_nice()`, `postprocess_matrix()` | +| `data/transition_matrices.py` | §2.0-2.1 TTC 산출 | `load_transition_matrices()`, `compute_ttc_matrix()` | +| `data/macro_data.py` | §2.5 거시데이터 | `load_macro_data()` | +| `data/ecos_fetcher.py` | §2.5 ECOS API | `EcosFetcher.fetch_all()` | | `models/credit_cycle.py` | §2.2 Zt 추정 | `estimate_zt_series()` | -| `models/vasicek.py` | §2.4 조건부 PD | `conditional_pd()`, `conditional_transition_matrix()` | +| `models/vasicek.py` | §2.4 조건부 PD/TM | `conditional_pd()`, `conditional_transition_matrix()` | | `models/macro_model.py` | §2.5 거시연계 | `MacroZtModel.fit()` | | `scenarios/scenario_engine.py` | §2.7-2.8 시나리오 | `generate_z_paths()` | | `projection/lifetime_pd.py` | §2.9 PD 산출 | `compute_all_scenarios()` | | `validation/statistical_tests.py` | §2.6 검증 | `run_full_validation()` | + +## 5. 부호 규약 참고 + +| 규약 | Z>0 의미 | 수식 | 사용 위치 | +|------|---------|------|----------| +| **Belkin convention** | 호황 (PD↓) | `d + √ρ·Z` | `credit_cycle.py`, `vasicek.conditional_transition_matrix()` | +| **Basel/Vasicek convention** | 불황 (PD↑) | `d - √ρ·Z` | `vasicek.conditional_pd()`, `vasicek.worst_case_pd()` | + +두 규약이 코드에 공존하며, 각 함수의 docstring에 사용 규약이 명시되어 있습니다.