LifetimePD/reports/generate_report.py

"""
Lifetime PD 분석 보고서 생성기 (Excel)

사용법:
    python reports/generate_report.py
    python reports/generate_report.py --config config.yaml --output results/report.xlsx

다중 시트 구성:
    1. 요약 (Summary)         — 모형 개요, 핵심 파라미터, 결론
    2. 원시데이터_전이행렬     — 연도별 전이행렬, TTC 행렬
    3. 원시데이터_거시변수     — ECOS 거시경제변수 시계열
    4. Zt_추정               — Belkin & Suchower Zt 역산 결과
    5. AR1_모형              — AR(1)+Macro 회귀 결과, 계수, 진단
    6. 시나리오_Z경로         — 3 시나리오별 50년 Zt 경로
    7. Lifetime_PD           — 시나리오별 누적 PD term structure
    8. 가중평균_PD            — 확률가중 최종 PD
    9. 검증결과               — 통계 검정 결과
"""

import sys, io, os, argparse, math
sys.path.insert(0, os.path.join(os.path.dirname(__file__), '..'))
if sys.stdout.encoding != 'utf-8':
    sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8', errors='replace')

import numpy as np
import pandas as pd
import yaml
from datetime import datetime
from openpyxl import Workbook
from openpyxl.styles import Font, PatternFill, Alignment, Border, Side
from openpyxl.utils import get_column_letter

from data.transition_matrices import (
    load_transition_matrices, compute_ttc_matrix,
    RATING_GRADES, RATING_GRADES_8
)
from data.ccc_interpolator import expand_to_8x8
from data.macro_data import _fallback_macro_data, compute_derived_features
from data.ecos_fetcher import load_macro_data as load_ecos_macro
from models.credit_cycle import estimate_zt_series
from models.macro_model import build_macro_zt_model
from scenarios.scenario_engine import ScenarioEngine
from projection.lifetime_pd import LifetimePDEngine
from validation.statistical_tests import run_full_validation

# ================================================================
# 스타일 정의
# ================================================================
NAVY = "1F3864"
DARK_BLUE = "2B5797"
LIGHT_BLUE = "D6E4F0"
LIGHTER_BLUE = "EDF2F9"
WHITE = "FFFFFF"
BORDER_CLR = "B4C6E7"

TITLE_FONT = Font(name="맑은 고딕", size=16, bold=True, color=WHITE)
HEADER_FONT = Font(name="맑은 고딕", size=10, bold=True, color=WHITE)
SUBHEADER_FONT = Font(name="맑은 고딕", size=10, bold=True, color=NAVY)
BODY_FONT = Font(name="맑은 고딕", size=9)
BODY_BOLD = Font(name="맑은 고딕", size=9, bold=True)
SMALL_FONT = Font(name="맑은 고딕", size=8, color="666666")
NUM_FONT = Font(name="Consolas", size=9)
PASS_FONT = Font(name="맑은 고딕", size=9, bold=True, color="2E7D32")
FAIL_FONT = Font(name="맑은 고딕", size=9, bold=True, color="C62828")

TITLE_FILL = PatternFill("solid", fgColor=NAVY)
HEADER_FILL = PatternFill("solid", fgColor=DARK_BLUE)
SUBHEADER_FILL = PatternFill("solid", fgColor=LIGHT_BLUE)
ALT_FILL = PatternFill("solid", fgColor=LIGHTER_BLUE)
PASS_FILL = PatternFill("solid", fgColor="E2EFDA")
FAIL_FILL = PatternFill("solid", fgColor="FCE4EC")

THIN_BORDER = Border(
    left=Side(style='thin', color=BORDER_CLR),
    right=Side(style='thin', color=BORDER_CLR),
    top=Side(style='thin', color=BORDER_CLR),
    bottom=Side(style='thin', color=BORDER_CLR)
)
CENTER = Alignment(horizontal='center', vertical='center', wrap_text=True)
LEFT = Alignment(horizontal='left', vertical='center', wrap_text=True)
RIGHT = Alignment(horizontal='right', vertical='center')

NUM4 = '0.0000'
NUM2 = '0.00'


def _widths(ws, widths):
    for i, w in enumerate(widths, 1):
        ws.column_dimensions[get_column_letter(i)].width = w


def _title(ws, row, text, ncols=10):
    ws.merge_cells(start_row=row, start_column=1, end_row=row, end_column=ncols)
    c = ws.cell(row=row, column=1, value=text)
    c.font = TITLE_FONT; c.fill = TITLE_FILL; c.alignment = LEFT
    ws.row_dimensions[row].height = 35


def _section(ws, row, text, ncols=10):
    ws.merge_cells(start_row=row, start_column=1, end_row=row, end_column=ncols)
    c = ws.cell(row=row, column=1, value=text)
    c.font = SUBHEADER_FONT; c.fill = SUBHEADER_FILL; c.alignment = LEFT
    ws.row_dimensions[row].height = 22
    return row + 1


def _headers(ws, row, hdrs):
    for j, h in enumerate(hdrs, 1):
        c = ws.cell(row=row, column=j, value=h)
        c.font = HEADER_FONT; c.fill = HEADER_FILL; c.alignment = CENTER; c.border = THIN_BORDER
    return row + 1


def _row(ws, row, vals, alt=False, fmt=None):
    fill = ALT_FILL if alt else PatternFill()
    for j, v in enumerate(vals, 1):
        c = ws.cell(row=row, column=j, value=v)
        c.font = NUM_FONT if isinstance(v, (int, float, np.floating, np.integer)) else BODY_FONT
        c.fill = fill; c.border = THIN_BORDER
        c.alignment = RIGHT if isinstance(v, (int, float, np.floating, np.integer)) else LEFT
        if fmt and isinstance(v, (float, np.floating)):
            c.number_format = fmt
    return row + 1


def _kv(ws, row, key, value, col=2, fmt=None):
    ws.cell(row=row, column=col, value=key).font = BODY_BOLD
    cell = ws.cell(row=row, column=col+1, value=value)
    cell.font = NUM_FONT if isinstance(value, (int, float, np.floating)) else BODY_FONT
    if fmt and isinstance(value, (float, np.floating)):
        cell.number_format = fmt
    return row + 1


# ================================================================
# 시트 생성
# ================================================================

def sheet_summary(wb, config, model, zt_dict, diag, z_paths, val_df, pd_engine, pd_results, grades):
    ws = wb.active; ws.title = "요약"
    _widths(ws, [3,25,18,18,18,18,12,12,12,12])
    r = 1; _title(ws, r, "  Lifetime PD 분석 보고서", 10)
    r = 2; ws.cell(row=r, column=2, value=f"생성일시: {datetime.now().strftime('%Y-%m-%d %H:%M')}").font = SMALL_FONT
    r = 4
    # 1. 모형 개요
    r = _section(ws, r, "  1. 모형 개요", 10)
    r = _kv(ws, r, "모형 구조", "Z(t) = c + φ·Z(t-1) + β₁·X₁_std + β₂·X₂_std + β₃·X₃_std + ε")
    r = _kv(ws, r, "모형 유형", "AR(1) + Macro (Vasicek Single-Factor)")
    r = _kv(ws, r, "적용 기준", "IFRS 9 (2018, 2024 개정)")
    r = _kv(ws, r, "변수 선택", ", ".join(model.selected_vars))
    r += 1
    # 2. AR(1) 파라미터
    r = _section(ws, r, "  2. AR(1) 모형 파라미터", 10)
    r = _kv(ws, r, "자기회귀 계수 (φ)", model.ar1_phi, fmt=NUM4)
    phi = model.ar1_phi
    hl = math.log(2)/abs(math.log(abs(phi))) if 0<abs(phi)<1 else float('inf')
    r = _kv(ws, r, "반감기", f"{hl:.1f}년")
    r = _kv(ws, r, "절편 (c)", model.ar1_const, fmt=NUM4)
    for var, beta in model.ar1_beta.items():
        r = _kv(ws, r, f"β({var})", beta, fmt=NUM4)
    r = _kv(ws, r, "잔차 σ", model.ar1_sigma_eps, fmt=NUM4)
    lr = model.ar1_const / (1 - model.ar1_phi) if abs(model.ar1_phi) < 1 else 0
    r = _kv(ws, r, "장기 균형 Z", lr, fmt=NUM4)
    r += 1
    # 3. 적합도
    r = _section(ws, r, "  3. 모형 적합도", 10)
    r = _kv(ws, r, "R²", diag.get("r_squared",0), fmt=NUM4)
    r = _kv(ws, r, "Adj. R²", diag.get("adj_r_squared",0), fmt=NUM4)
    r = _kv(ws, r, "F p-value", diag.get("f_pvalue",0), fmt=NUM4)
    r = _kv(ws, r, "AIC", diag.get("aic",0), fmt=NUM2)
    r = _kv(ws, r, "DW", diag.get("durbin_watson",0), fmt=NUM4)
    r += 1
    # 4. 시나리오
    r = _section(ws, r, "  4. 시나리오 설정", 10)
    hdrs = ["", "시나리오", "가중치"]
    for v in model.selected_vars:
        hdrs.append(f"{v} (σ)")
    hdrs.append("Z(t+1)")
    r = _headers(ws, r, hdrs)
    for sname, scfg in config.get("scenarios", {}).items():
        vals = [None, scfg.get("name", sname), scfg.get("weight", 0)]
        for v in model.selected_vars:
            vals.append(scfg.get("macro_shocks", {}).get(v, 0))
        z1 = z_paths.get(sname, [0])[0] if z_paths else 0
        vals.append(float(z1))
        r = _row(ws, r, vals, alt=(sname=="base"), fmt=NUM4)
    r += 1
    # 5. 1년차 가중 PD
    r = _section(ws, r, "  5. 1년차 확률가중 PD (%)", 10)
    r = _headers(ws, r, ["", ""] + list(grades[:-1]))
    by_sc = pd_results.get("by_scenario", pd_results)
    wcpd = pd_results.get("weighted_cumulative_pd", None)
    if wcpd is not None and wcpd.shape[0] > 0:
        wpd = wcpd[0, :len(grades)-1] * 100
    else:
        wpd = np.zeros(len(grades)-1)
    vals = [None, "가중PD(1Y)"] + list(wpd)
    r = _row(ws, r, vals, fmt=NUM4)


def sheet_tm(wb, tm_raw, tm_floor, ttc, pd_floors, config):
    ws = wb.create_sheet("원시데이터_전이행렬")
    grades = config.get("model",{}).get("rating_grades", RATING_GRADES)
    ng = len(grades)
    _widths(ws, [3,12]+[12]*ng)
    nc = 2+ng; r=1
    _title(ws, r, "  전이행렬 파이프라인: Original → PD Floor → TTC", nc)
    r=3
    # KAP 채권 YTM 기반 PD Floor 산출 과정
    from data.ytm_fetcher import get_ytm_data, compute_spreads, compute_broad_grade_spreads
    from data.pd_floor import compute_market_implied_pd
    ytm_data = get_ytm_data()
    notch_spreads = compute_spreads(ytm_data)
    broad_spreads = compute_broad_grade_spreads(notch_spreads)
    lgd = 0.60
    rf = ytm_data.get('rf', 0)
    r = _section(ws, r, "  KAP 채권 YTM → 신용스프레드 → 시장내재 PD (Floor 산출 근거)", nc)
    hdr_ytm = ["", "등급", "KAP YTM(%)", "스프레드(bp)", "내재PD(bp)", "Basel III(bp)", "적용Floor(bp)"]
    while len(hdr_ytm) < 2 + ng:
        hdr_ytm.append("")
    r = _headers(ws, r, hdr_ytm[:2 + ng])
    floor_grades = ["AAA", "AA", "A", "BBB", "BB", "B"]
    for fg in floor_grades:
        ytm_val = None
        for notch in [fg, fg + '+', fg + '-']:
            if notch in ytm_data:
                ytm_val = ytm_data[notch]
                break
        if ytm_val is None:
            ytm_val = rf
        sp = broad_spreads.get(fg, 0)
        implied_pd = compute_market_implied_pd(sp, lgd) * 10000
        applied = pd_floors.get(fg, 0) * 10000
        v = [None, fg, ytm_val, sp, implied_pd, 5, applied]
        while len(v) < 2 + ng:
            v.append(None)
        r = _row(ws, r, v[:2 + ng], fmt=NUM2)
    ws.cell(row=r, column=2,
            value=f"기준일: 2025-12-31, 국고1Y: {rf}%, LGD: 60%, 출처: KAP(한국자산평가)").font = SMALL_FONT
    r += 1
    ws.cell(row=r, column=2,
            value="산식: Implied PD = 1 - exp(-spread_bp / (LGD×10000)), Floor = max(Implied PD, Basel 5bp)").font = SMALL_FONT
    r += 2
    # TTC 전이행렬
    r = _section(ws, r, f"  TTC 전이행렬 (PD Floor 적용 후, {min(tm_floor.keys())}~{max(tm_floor.keys())} 평균)", nc)
    r = _headers(ws, r, ["","From\\To"]+grades)
    for i,g in enumerate(grades):
        vals = [None,g]+[ttc[i,j] for j in range(min(ng,ttc.shape[1]))]
        r = _row(ws, r, vals, alt=i%2==1, fmt=NUM4)
    r += 1
    # 전체 연도별 전이행렬 (Floor 적용 후)
    for year in sorted(tm_floor.keys()):
        r = _section(ws, r, f"  {year}년 전이행렬 (PD Floor 적용 후)", nc)
        r = _headers(ws, r, ["","From\\To"]+grades)
        mat = tm_floor[year]
        for i,g in enumerate(grades):
            if i < mat.shape[0]:
                vals = [None,g]+[mat[i,j] for j in range(min(ng,mat.shape[1]))]
                r = _row(ws, r, vals, alt=i%2==1, fmt=NUM4)
        r += 1


# 영문→한글 변수명 매핑
VAR_KOR = {
    "GDP_GROWTH": "GDP성장률(%)", "IPI": "광공업생산지수", "SPI": "서비스업생산지수",
    "MANUF_CAPACITY": "제조업가동률", "GFCF_GROWTH": "총고정자본증감률",
    "CONSTR_INVEST": "건설투자증감률", "FACILITY_INVEST": "설비투자지수",
    "RETAIL_SALES": "소매판매액지수", "CSI": "소비자심리지수", "BSI_MANUF": "제조업BSI",
    "LEADING_INDEX": "경기선행지수", "COINCIDENT": "경기동행지수",
    "EXPORT": "수출(백만달러)", "IMPORT_AMT": "수입(백만달러)",
    "TRADE_GNI": "수출입/GNI(%)", "KOSPI": "KOSPI지수",
    "INVEST_RATE": "국내총투자율(%)", "SAVING_RATE": "총저축률(%)",
    "HOUSING_PRICE": "주택매매가격지수",
    "UNEMPLOYMENT": "실업률(%)", "EMPLOYMENT": "고용률(%)",
    "EMPLOYED": "취업자수(만명)", "EMPLOYMENT_RATE": "고용률(%)",
    "BASE_RATE": "기준금리(%)", "CD_RATE": "CD91일(%)",
    "GOVT_3Y": "국고3Y(%)", "GOVT_10Y": "국고10Y(%)",
    "CORP_AA": "회사체AA-(%)", "CORP_BBB": "회사체BBB-(%)",
    "CPI_GROWTH": "소비자물가상승률(%)", "IMPORT_PRICE": "수입물가지수",
    "PPI": "생산자물가지수", "USDKRW": "원/달러환율",
    "M2": "M2광의통화(조원)", "DISHONOR_RATE": "어음부도율(%)",
    "DISHONOR_AMT": "부도금액(억원)", "HOUSEHOLD_DEBT": "가계부채(조원)",
    "CONSTRUCTION": "건설수주액(억원)", "CONSTRUCTION_DONE": "건설기성액",
    "CREDIT_SPREAD": "신용스프레드(BBB-AA)", "TERM_SPREAD": "기간스프레드(10Y-3Y)",
    "CREDIT_SPREAD_LAG1": "신용스프레드(t-1)",
    "EXPORT_DIFF": "수출증감액", "IPI_LAG1": "광공업생산(t-1)",
    "CONSTR_INVEST_GR": "건설투자증가율", "CURRENT_ACCOUNT": "경상수지",
}
# 변환 변수 한글명 자동 생성
TRANSFORM_SUFFIX = {"_LAG2": "(t-2)", "_L": "(log)", "_D": "(차분)",
                     "_R": "(수익률)", "_LR": "(log수익률)"}

def _kor(varname):
    if varname in VAR_KOR:
        return VAR_KOR[varname]
    for sfx, label in TRANSFORM_SUFFIX.items():
        if varname.endswith(sfx):
            base = varname[:-len(sfx)]
            base_kor = VAR_KOR.get(base, base)
            return f"{base_kor}{label}"
    return varname

def sheet_macro(wb, macro_data, forced_vars):
    ws = wb.create_sheet("원시데이터_거시변수")
    display_cols = list(forced_vars) + [c for c in macro_data.columns if c not in forced_vars]
    display_cols = [c for c in display_cols if c in macro_data.columns]
    _widths(ws, [3,8]+[14]*len(display_cols))
    nc = 2+len(display_cols); r=1
    _title(ws, r, "  원시 데이터: 거시경제변수", nc)
    r=3
    r = _section(ws, r, f"  ★ 선택 변수: {', '.join([_kor(v) for v in forced_vars])}", nc)
    r = _headers(ws, r, ["","연도"]+[_kor(c) for c in display_cols])
    for i,(year,rd) in enumerate(macro_data.iterrows()):
        vals = [None,int(year)]+[rd[c] if c in rd and pd.notna(rd[c]) else None for c in display_cols]
        r = _row(ws, r, vals, alt=i%2==1, fmt=NUM2)


def sheet_zt(wb, zt_dict, macro_data, forced_vars, rho):
    ws = wb.create_sheet("Zt_추정")
    ncols = 3+len(forced_vars)
    _widths(ws, [3,10,14]+[14]*len(forced_vars))
    r=1; _title(ws, r, "  Zt 추정 (Belkin & Suchower 1998)", ncols)
    r=3
    r = _section(ws, r, "  방법론: 관측 전이행렬 역산 → WLS → Zt", ncols)
    zv = np.array(list(zt_dict.values()))
    r = _kv(ws, r, "자산상관계수 (ρ)", rho, fmt=NUM4)
    r += 1
    # ρ 근거
    r = _section(ws, r, "  ρ = 0.20 근거", ncols)
    ws.cell(row=r, column=2, value="[1] Basel III IRB: 기업 ρ = 0.12~0.24 (CRE31.6)").font = SMALL_FONT; r+=1
    ws.cell(row=r, column=2, value="    R = 0.12×(1-e^(-50×PD))/(1-e^(-50)) + 0.24×(1-(1-e^(-50×PD))/(1-e^(-50)))").font = SMALL_FONT; r+=1
    ws.cell(row=r, column=2, value="[2] BBB(PD≈0.2%) → R=0.208, A(PD≈0.07%) → R=0.217").font = SMALL_FONT; r+=1
    ws.cell(row=r, column=2, value="[3] 한국 기업 포트폴리오 평균: ρ ≈ 0.20 (투자/투기 혼합)").font = SMALL_FONT; r+=1
    ws.cell(row=r, column=2, value="[4] Moody's Analytics CreditEdge: single-factor ρ ≈ 0.15~0.25").font = SMALL_FONT; r+=1
    r += 1
    r = _kv(ws, r, "Zt 평균 (μ)", float(zv.mean()), fmt=NUM4)
    r = _kv(ws, r, "Zt 표준편차 (σ)", float(zv.std()), fmt=NUM4)
    r = _kv(ws, r, "관측 기간", f"{min(zt_dict.keys())}~{max(zt_dict.keys())} ({len(zt_dict)}개년)")
    r += 1
    hdrs = ["","연도","Zt"]+forced_vars
    r = _headers(ws, r, hdrs)
    for i,(year,zt) in enumerate(sorted(zt_dict.items())):
        vals = [None,int(year),float(zt)]
        for v in forced_vars:
            if v in macro_data.columns and year in macro_data.index:
                vals.append(macro_data.loc[year,v] if pd.notna(macro_data.loc[year,v]) else None)
            else: vals.append(None)
        r = _row(ws, r, vals, alt=i%2==1, fmt=NUM4)


def sheet_ar1(wb, model, diag):
    ws = wb.create_sheet("AR1_모형")
    _widths(ws, [3,22,14,14,14,14,14])
    r=1; _title(ws, r, "  AR(1) + Macro 회귀 모형", 7)
    r=3
    r = _section(ws, r, "  Z(t) = c + φ·Z(t-1) + Σ βᵢ·Xᵢ_std(t) + ε(t)", 7)
    ws.cell(row=r, column=2, value="※ 거시변수는 표준화(mean=0, std=1) 후 투입. β = '1σ 충격 → ΔZ'로 해석").font = SMALL_FONT
    r += 2
    # 계수
    r = _section(ws, r, "  회귀 계수", 7)
    r = _headers(ws, r, ["","변수","계수","표준오차","t값","p값","유의성"])
    coef_df = diag.get("coefficients", pd.DataFrame())
    for i,(_,rd) in enumerate(coef_df.iterrows()):
        pv = rd.get("p값",1)
        sig = "***" if pv<0.01 else "**" if pv<0.05 else "*" if pv<0.10 else ""
        vals = [None, rd.get("변수",""), rd.get("계수",0), rd.get("표준오차",0), rd.get("t값",0), pv, sig]
        rn = _row(ws, r, vals, alt=i%2==1, fmt=NUM4)
        if pv < 0.05: ws.cell(row=r,column=7).font = PASS_FONT
        elif pv < 0.10: ws.cell(row=r,column=7).font = Font(name="맑은 고딕",size=9,color="FF8F00")
        r = rn
    r += 1
    # 진단 — 모형 적합도
    r = _section(ws, r, "  모형 적합도", 7)
    for k,v,f in [("R²","r_squared",NUM4),("Adj. R²","adj_r_squared",NUM4),
                   ("F 통계량","f_stat",NUM4),("F p-value","f_pvalue",NUM4),
                   ("AIC","aic",NUM2),("BIC","bic",NUM2)]:
        r = _kv(ws, r, k, diag.get(v, None), fmt=f)
    r += 1
    # 진단 — 잔차 검정 (6개 전항목)
    r = _section(ws, r, "  잔차 검정 (6개 전항목)", 7)
    r = _headers(ws, r, ["","검정","통계량","p-value","기준","결과","해석"])
    tests_data = [
        ("ADF (Zt 정상성)", diag.get("adf_stat"), diag.get("adf_pvalue"),
         "p < 0.05", diag.get("adf_pvalue",1) < 0.05 if diag.get("adf_pvalue") else False,
         "BIC lag 선택, H0: 비정상"),
        ("Ljung-Box Q(5)", diag.get("ljung_box_stat"), diag.get("ljung_box_pvalue"),
         "p > 0.05", diag.get("ljung_box_pvalue",0) > 0.05 if diag.get("ljung_box_pvalue") else False,
         "H0: 자기상관 없음"),
        ("Durbin-Watson", diag.get("durbin_watson"), None,
         "1.5~2.5", 1.5 <= diag.get("durbin_watson",0) <= 2.5 if diag.get("durbin_watson") else False,
         "≈2 이상적"),
        ("Breusch-Pagan", diag.get("bp_stat"), diag.get("bp_pvalue"),
         "p > 0.05", diag.get("bp_pvalue",0) > 0.05 if diag.get("bp_pvalue") else False,
         "H0: 등분산"),
        ("ARCH-LM", diag.get("arch_stat"), diag.get("arch_pvalue"),
         "p > 0.05", diag.get("arch_pvalue",0) > 0.05 if diag.get("arch_pvalue") else False,
         "H0: ARCH 효과 없음"),
        ("Shapiro-Wilk", diag.get("shapiro_stat"), diag.get("shapiro_pvalue"),
         "p > 0.05", diag.get("shapiro_pvalue",0) > 0.05 if diag.get("shapiro_pvalue") else False,
         "H0: 정규분포"),
    ]
    for tname, stat, pval, crit, passed, note in tests_data:
        stat_str = f"{stat:.4f}" if stat is not None else "-"
        pval_str = f"{pval:.4f}" if pval is not None else "-"
        result_str = "Pass ✅" if passed else "Fail ❌"
        vals = [None, tname, stat_str, pval_str, crit, result_str, note]
        r = _row(ws, r, vals)
        if passed:
            ws.cell(row=r-1, column=6).font = PASS_FONT
        else:
            ws.cell(row=r-1, column=6).font = FAIL_FONT
    r += 1
    # 변수 통계
    r = _section(ws, r, "  거시변수 표본 통계 (표준화 전 원시값)", 7)
    r = _headers(ws, r, ["","변수","평균","표준편차","최근값","",""])
    for var,st in model.ar1_macro_stats.items():
        vals = [None,_kor(var),st["mean"],st["std"],st["last"],None,None]
        r = _row(ws, r, vals, fmt=NUM2)
    r += 1
    # 경제적 해석 섹션
    r = _section(ws, r, "  변수별 경제적 해석", 7)
    interp = {
        "CORP_BBB_LAG2": "2년전 BBB금리↑ → 신용위험 잔존 → 부도↑ → Z↓ (시차효과)",
        "GFCF_GROWTH_LAG2": "2년전 고정자본투자↑ → 생산능력↑ → 부도↓ → Z↑",
        "SAVING_RATE_L": "log(저축률)↑ → 경제안정성↑ → 부도↓ → Z↑",
        "HOUSING_PRICE": "주택가격↑ → 담보가치↑ → 차입여력↑ → 부도↓ → Z↑",
        "CREDIT_SPREAD_LAG1": "전년 스프레드↑ → 당해 신용위험 전이 → 부도↑ → Z↓ (시차 효과)",
        "EXPORT_DIFF": "수출증감↑ → 기업매출↑ → 수익성↑ → 부도↓ → Z↑",
        "CURRENT_ACCOUNT": "경상수지↑(흑자) → 불황기 수출의존↑ → Z↓",
        "CURRENT_ACCOUNT_R": "경상수지변화율↑ → 대외부문 개선 속도↑ → Z↑ (단기 모멘텀)",
        "LEADING_INDEX": "경기선행지수↑ → 3~6개월 후 경기확장 → 부도↓ → Z↑",
        "CONSTR_INVEST_GR": "건설투자↑ → 과잉투자/레버리지 → Z↓ (민스키 가설)",
    }
    for var in model.selected_vars:
        beta = model.ar1_beta.get(var, 0)
        sign = "+" if beta > 0 else "−"
        desc = interp.get(var, "")
        ws.cell(row=r, column=2, value=_kor(var)).font = BODY_BOLD
        ws.cell(row=r, column=3, value=f"β={beta:+.4f} ({sign})").font = NUM_FONT
        ws.cell(row=r, column=4, value=desc).font = SMALL_FONT
        ws.merge_cells(start_row=r, start_column=4, end_row=r, end_column=7)
        r += 1


def sheet_zpath(wb, z_paths, config):
    ws = wb.create_sheet("시나리오_Z경로")
    scenarios = list(z_paths.keys())
    nc = 2+len(scenarios)
    _widths(ws, [3,10]+[16]*len(scenarios))
    r=1; _title(ws, r, "  시나리오별 Z(t) 경로", nc)
    r=3
    r = _section(ws, r, "  t=1: 거시 충격 적용 | t≥2: AR(1) 감쇠 → TTC 수렴", nc)
    r += 1
    names = []
    for s in scenarios:
        c = config.get("scenarios",{}).get(s,{})
        names.append(c.get("name",s))
    r = _headers(ws, r, ["","연도(t+k)"]+names)
    horizon = len(list(z_paths.values())[0])
    key_years = list(range(1,11))+[15,20,25,30,40,50]
    for t in key_years:
        if t <= horizon:
            vals = [None,t]+[float(z_paths[s][t-1]) for s in scenarios]
            r = _row(ws, r, vals, alt=t%2==0, fmt=NUM4)


def sheet_pd(wb, pd_results, config, grades8):
    ws = wb.create_sheet("Lifetime_PD")
    ng = len(grades8)-1  # D 제외
    _widths(ws, [3,14,8]+[14]*ng)
    nc = 3+ng
    r=1; _title(ws, r, "  시나리오별 누적 Lifetime PD (%)", nc)
    r=3
    ky = [1,2,3,5,7,10,15,20,30,50]
    by_sc = pd_results.get("by_scenario", {})
    for sname, sdata in by_sc.items():
        c = config.get("scenarios",{}).get(sname,{})
        dn = c.get("name",sname); w = c.get("weight",0)
        r = _section(ws, r, f"  {dn} (가중치 {w*100:.0f}%)", nc)
        r = _headers(ws, r, ["","시나리오","연도"]+list(grades8[:-1]))
        cpd = sdata.get("cumulative_pd", np.zeros((50,ng)))
        for t in ky:
            if t <= cpd.shape[0]:
                vals = [None,dn,t]+[cpd[t-1,g]*100 for g in range(min(ng,cpd.shape[1]))]
                r = _row(ws, r, vals, alt=ky.index(t)%2==1, fmt=NUM4)
        r += 1


def sheet_weighted(wb, pd_results, config, grades8):
    ws = wb.create_sheet("가중평균_PD")
    ng = len(grades8)-1
    _widths(ws, [3,8]+[14]*ng)
    nc = 2+ng
    r=1; _title(ws, r, "  확률가중 Lifetime PD (%)", nc)
    r=3
    # IFRS 9 근거
    r = _section(ws, r, "  IFRS 9 근거: 확률가중 기대신용손실", nc)
    ws.cell(row=r, column=2, value='IFRS 9 B5.5.42: "기대신용손실은 확률가중 금액이어야 하며,').font = SMALL_FONT; r+=1
    ws.cell(row=r, column=2, value='가능한 결과의 범위를 반영하여야 한다. 단일 가장 가능성 높은 결과가 아닌,').font = SMALL_FONT; r+=1
    ws.cell(row=r, column=2, value='신용위험의 벽혹을 변경시키는 일반적 경제 조건에 대한 예측을 포함하여야 한다."').font = SMALL_FONT; r+=1
    ws.cell(row=r, column=2, value='IFRS 9 B5.5.44: "최소 2개 시나리오(호황/불황)+확률가중치 = ECL 요구사항을 충족할 수 있다."').font = SMALL_FONT; r+=1
    r += 1
    r = _section(ws, r, "  PD_weighted(t) = Σ w_s × PD_s(t)", nc)
    wstr = " + ".join([f"{c.get('weight',0)*100:.0f}%×{c.get('name',s)}" for s,c in config.get("scenarios",{}).items()])
    ws.cell(row=r, column=2, value=f"= {wstr}").font = SMALL_FONT
    r += 2
    ky = [1,2,3,5,7,10,15,20,30,50]
    r = _headers(ws, r, ["","연도"]+list(grades8[:-1]))
    wcpd = pd_results.get("weighted_cumulative_pd", np.zeros((50, ng)))
    for t in ky:
        if t <= wcpd.shape[0]:
            wpd = wcpd[t-1,:ng] * 100
        else:
            wpd = np.zeros(ng)
        vals = [None,t]+list(wpd)
        r = _row(ws, r, vals, alt=ky.index(t)%2==1, fmt=NUM4)


def sheet_validation(wb, val_df):
    ws = wb.create_sheet("검증결과")
    _widths(ws, [3,30,22,14,14,10,40])
    r=1; _title(ws, r, "  통계적 검증 결과", 7)
    r=3
    cols = list(val_df.columns)
    r = _headers(ws, r, [""]+cols)
    for i,(_,rd) in enumerate(val_df.iterrows()):
        vals = [None]+[rd[c] for c in cols]
        rn = _row(ws, r, vals, alt=i%2==1)
        # 결과 색상
        result_col = cols.index("결과")+2 if "결과" in cols else None
        if result_col:
            cell = ws.cell(row=r, column=result_col)
            if "Pass" in str(cell.value):
                cell.fill = PASS_FILL; cell.font = PASS_FONT
            elif "Fail" in str(cell.value):
                cell.fill = FAIL_FILL; cell.font = FAIL_FONT
        r = rn


# ================================================================
# 메인
# ================================================================
def generate_report(config_path="config.yaml", output_path="results/lifetime_pd_report.xlsx"):
    print("=" * 60)
    print("  Lifetime PD 분석 보고서 생성")
    print("=" * 60)

    with open(config_path) as f:
        config = yaml.safe_load(f)

    rho = config.get("model",{}).get("rho", 0.20)
    grades = config.get("model",{}).get("rating_grades", list(RATING_GRADES))
    forced_vars = config.get("model",{}).get("macro_vars", [])
    macro_method = config.get("model",{}).get("macro_method", "ar1_macro")
    horizon = config.get("convergence",{}).get("total_horizon", 50)

    from data.pd_floor import apply_pd_floor_to_matrices, build_complete_pd_floor_table

    # 1. 데이터
    print("\n  [1/6] 데이터 로딩...")
    data_config = config.get("data", {})
    tm_source = data_config.get("transition_source", "real")
    tm_dir = data_config.get("transition_dir", None)
    tm_all = load_transition_matrices(tm_source, data_dir=tm_dir)
    # 2000-2025 필터
    tm_raw = {y:m for y,m in tm_all.items() if 2000 <= y <= 2025}

    # KAP 채권 YTM 기반 PD Floor 적용
    pd_floors, _, pd_floors_full = build_complete_pd_floor_table()
    tm = apply_pd_floor_to_matrices(tm_raw, pd_floors)
    ttc = compute_ttc_matrix(tm)

    # 거시변수
    macro_data = _fallback_macro_data()
    try:
        ecos = load_ecos_macro()
        if ecos is not None and not ecos.empty:
            macro_data = pd.concat([macro_data, ecos], axis=1)
            macro_data = macro_data.loc[:,~macro_data.columns.duplicated()]
    except: pass
    derived = compute_derived_features(macro_data)
    if not derived.empty:
        macro_data = pd.concat([macro_data, derived], axis=1)
        macro_data = macro_data.loc[:,~macro_data.columns.duplicated()]
    # 확장 변환: LAG2, log, diff, pctchg, log-return
    base_cols = list(macro_data.columns)
    for col in base_cols:
        s = macro_data[col]
        d = s.diff()
        if d.std() > 1e-10:
            macro_data[f"{col}_D"] = d
        pc = s.pct_change().replace([np.inf, -np.inf], np.nan)
        if pc.dropna().std() > 1e-10:
            macro_data[f"{col}_R"] = pc
        if (s > 0).all():
            ls = np.log(s)
            if ls.std() > 1e-10:
                macro_data[f"{col}_L"] = ls
            ld = ls.diff()
            if ld.dropna().std() > 1e-10:
                macro_data[f"{col}_LR"] = ld
        l2 = s.shift(1)
        if l2.dropna().std() > 1e-10:
            macro_data[f"{col}_LAG2"] = l2
    macro_data = macro_data.ffill().bfill()
    macro_data = macro_data.loc[:,~macro_data.columns.duplicated()]
    print(f"    전이행렬: {len(tm)}개년 [{tm_source}], PD Floor 적용, 거시변수: {len(macro_data.columns)}개")

    # 2. Zt
    print("  [2/6] Zt 추정...")
    zt_dict = estimate_zt_series(tm, ttc, rho)

    # 3. AR(1)
    print("  [3/6] AR(1)+Macro 적합...")
    model = build_macro_zt_model(zt_dict, macro_data, method=macro_method, forced_vars=forced_vars)
    diag = model.diagnostics()
    # 추가 진단 통계 (AR1 시트 6개 검정용)
    zt_arr = np.array([zt_dict[yr] for yr in sorted(zt_dict.keys())])
    from statsmodels.tsa.stattools import adfuller as _adfuller
    _adf = _adfuller(zt_arr, autolag="BIC")
    diag["adf_stat"] = _adf[0]; diag["adf_pvalue"] = _adf[1]
    if model.result is not None:
        _resid = model.result.resid
        _exog = model.result.model.exog
        from statsmodels.stats.diagnostic import acorr_ljungbox as _lb, het_breuschpagan as _bp, het_arch as _arch
        from scipy.stats import shapiro as _shapiro
        try:
            _lbr = _lb(_resid, lags=[5], return_df=True)
            diag["ljung_box_stat"] = float(_lbr["lb_stat"].iloc[0])
            diag["ljung_box_pvalue"] = float(_lbr["lb_pvalue"].iloc[0])
        except: pass
        try:
            _bpr = _bp(_resid, _exog)
            diag["bp_stat"] = float(_bpr[0]); diag["bp_pvalue"] = float(_bpr[1])
        except: pass
        try:
            _ar = _arch(_resid, nlags=3)
            diag["arch_stat"] = float(_ar[0]); diag["arch_pvalue"] = float(_ar[1])
        except: pass
        try:
            _sw = _shapiro(_resid)
            diag["shapiro_stat"] = float(_sw.statistic); diag["shapiro_pvalue"] = float(_sw.pvalue)
        except: pass
        diag["bic"] = float(model.result.bic) if hasattr(model.result, 'bic') else None
    print(f"    φ={model.ar1_phi:.4f}, R²={diag['r_squared']:.4f}, Adj.R²={diag['adj_r_squared']:.4f}")

    # 4. 시나리오
    print("  [4/6] 시나리오 Z경로...")
    engine = ScenarioEngine(config)
    z_paths = engine.generate_z_paths(zt_dict, macro_model=model)
    weights = engine.get_scenario_weights()

    # 5. Lifetime PD
    print("  [5/6] Lifetime PD 산출...")
    ttc_8x8 = expand_to_8x8(ttc) if ttc.shape == (7,7) else ttc
    pd_engine = LifetimePDEngine(ttc_8x8, rho, rating_grades=RATING_GRADES_8)
    pd_results = pd_engine.compute_all_scenarios(z_paths, weights, horizon)

    # 6. 검증
    print("  [6/6] 통계 검증...")
    zt_series = pd.Series(zt_dict)
    reg_result = model.result
    val_df = run_full_validation(zt_series.values, reg_result, pd_results, list(RATING_GRADES[:-1]))

    # ================================================================
    # Excel 생성
    # ================================================================
    print(f"\n  Excel 보고서 생성 중...")
    wb = Workbook()
    sheet_summary(wb, config, model, zt_dict, diag, z_paths, val_df, pd_engine, pd_results, RATING_GRADES_8)
    sheet_tm(wb, tm_raw, tm, ttc, pd_floors, config)
    sheet_macro(wb, macro_data, forced_vars)
    sheet_zt(wb, zt_dict, macro_data, forced_vars, rho)
    sheet_ar1(wb, model, diag)
    sheet_zpath(wb, z_paths, config)
    sheet_pd(wb, pd_results, config, RATING_GRADES_8)
    sheet_weighted(wb, pd_results, config, RATING_GRADES_8)
    sheet_validation(wb, val_df)

    os.makedirs(os.path.dirname(output_path) or '.', exist_ok=True)
    wb.save(output_path)
    print(f"\n  ✓ 보고서 저장: {output_path}")
    print(f"    시트: {len(wb.sheetnames)}개 ({', '.join(wb.sheetnames)})")
    return output_path


if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="Lifetime PD 보고서 생성")
    parser.add_argument("--config", default="config.yaml")
    parser.add_argument("--output", default="results/lifetime_pd_report.xlsx")
    args = parser.parse_args()
    generate_report(args.config, args.output)