최종 업데이트: 2026-03-15 | 유형: NeurIPS 2026 제출 논문 | 커밋: 101개 (📈 +22) 상위 문서: PAPER PROJECT_SPEC | 마스터 바이블
| 항목 | 값 |
|---|---|
| GitHub (private) | Yesol-Pilot/WhyLab |
| GitHub (public) | neogenesislab/WhyLab-NeurIPS2026 |
| Zenodo DOI | 10.5281/zenodo.18948929 |
| 제출 대상 | NeurIPS 2026 (Main Track) |
| 논문 제목 | Causal Audit Framework for Stable Agent Self-Improvement |
| 브랜치 | main |
| 제출 상태 | ✅ 제출 준비 완료 |
| ID | 기여 | 핵심 실험 | 선행연구 접점 |
|---|---|---|---|
| C1 | 정보이론 기반 드리프트 탐지 | E1: 40 seeds, KM curves | ADWIN (Bifet & Gavaldà 2007) |
| C2 | E-value × RV 민감도 필터링 | E2: 40 seeds, Pareto frontier | E-value (VanderWeele & Ding 2017), OVB (Cinelli & Hazlett 2020) |
| C3 | Lyapunov 기반 적응형 댐핑 | E3a: 20 seeds × 4 step sizes | Safe RL (Chow et al. 2018, Berkenkamp et al. 2017) |
| 지표 | 값 | 판정 |
|---|---|---|
| Content pages | ~7 | ✅ ≤ 9 |
| Undefined refs | 0 | ✅ |
| TODO 마커 | 0 | ✅ |
| 체크리스트 | 9항목 완성 | ✅ |
| 11p / 477KB / US Letter / Type1 | ✅ | |
| Double-blind | main.tex 식별정보 0건 | ✅ |
| 익명 리뷰팩 | WhyLab_NeurIPS2026_anonymous.zip (19.53 MB) | ✅ |
WhyLab/
├── paper/ # LaTeX 소스 + 컴파일된 PDF
│ ├── main.tex ← 메인 논문
│ ├── main.pdf ← 제출용 PDF
│ ├── references.bib
│ └── neurips_2025.sty
├── experiments/ # 실험 스크립트
│ ├── e1_drift_detection.py # E1: 드리프트 탐지 (C1)
│ ├── e2_sensitivity_filter.py # E2: 민감도 필터 (C2)
│ ├── e3a_stationary.py # E3a: 정상 안정성 (C3)
│ ├── e3b_heavy_tail.py # E3b: 헤비테일 스트레스
│ ├── config.yaml # 공유 하이퍼파라미터
│ ├── figures/ # 생성된 그림 (PDF + PNG)
│ └── results/ # 실험 결과 (CSV, 커밋됨)
├── scripts/
│ ├── zenodo_upload.py # Zenodo DOI 발급 스크립트
│ └── package_anonymous.py # 리뷰용 익명 ZIP 패키징
├── setup_wizard.py # 환경 설정용 마법사 스크립트 (pip 패키저 아님)
.env(Gemini API 키 포함) → .gitignore +git-filter-repo로 history 완전 제거 완료- 공개 리포에 저자 식별 정보 없음 (double-blind 준수)
- 제출 PDF에 GitHub 링크 없음
⚠️ Gemini API 키 (AIzaSyC3_...) rotation 권장 (history에서 제거됨)
| 채널 | URL | 용도 |
|---|---|---|
| GitHub (public) | neogenesislab/WhyLab-NeurIPS2026 | 코드 공개 |
| GitHub (private) | Yesol-Pilot/WhyLab | 본진 (clean history) |
| Zenodo | doi.org/10.5281/zenodo.18948929 | DOI 발급 + PDF 아카이브 |
| NeurIPS submission | OpenReview (예정) | 논문 제출 |
| 항목 | 논문 아티팩트 트랙 | 플랫폼 트랙 |
|---|---|---|
| 재현성 | 4/5 | 5/5 |
| 의존성/환경 명세 | 4.5/5 | 5/5 |
| 코드 일관성 | 4.5/5 | 5/5 |
| 과학적 검증 스펙 | 4.5/5 | 5/5 |
| 리뷰 친화성 | 5/5 | 5/5 |
- 원시 결과 CSV 커밋 → 표/그림 근거 즉시 확인 가능
- 문제 분해(드리프트/취약 수용/발산 업데이트) 3중 방어 구조 명확
- 단일 스크립트 재현 형태
| 우선 | 작업 | 상태 |
|---|---|---|
| P0 | 익명 zip에서 식별 파일 제거 | ✅ 완료 |
| P0 | E2 RV 부호/정의 문서화 | ✅ 완료 |
| P1 | E1 K/binning 차이 문서화 | ✅ 완료 |
| P1 | E3a EMA 구조 차이 문서화 | ✅ 완료 |
| P2 | 실제 에이전트 벤치마크 검증 (ReAct류) | ✅ 완료 (GPT-5.4 벤치마크 e7 추가) |
| P2 | 플랫폼 트랙 스키마/버전 정합성 복구 | ✅ 완료 (setup_wizard 분리 및 타입 힌트 고도화) |
| P0(추가) | 레거시 오염코드 격리 및 껍데기 디톡스 (Clean Room Protocol) | ✅ 완료 (기존 마케팅 봇 코드 6종 아카이빙 및 README 1:1 매핑) |