Skip to content

Eoo0m/ML_models

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ctr_prediction

lgbm.py

주요 특징

•	1:1 언더샘플링으로 불균형 완화
•	hour cyclic 변환(sin/cos) 적용
•	max_bin=511, depth↑로 미세 구간의 차이를 세밀하게 포착
•	seq 정보를 반영하기 위해 BiGRU seq32 벡터 추가(seq있는 parquet 사용해야함)

bigru.py

원본 데이터의 seq 컬럼(숫자 토큰 시퀀스)을 32차원 의미 벡터(seq32) 로 변환하는 전용 모델

주요 특징

•	BiGRU 기반 Masked LM 방식 사전학습
•	PAD/UNK/MASK 토큰 포함한 자체 vocab 구성
•	시퀀스 길이를 tail-truncate 후 left-padding
•	마지막 hidden state를 평균 풀링 → 32차원 프로젝트 벡터

DeepCrossCTR.py

복잡한 고차 교호작용과 시퀀스 정보의 활용을 목표로 설계한 딥러닝 모델.

내부 구성

1.	Numerical Feature + BatchNorm
•	history 계열의 극단적 분포를 완화하기 위해
• 일부 피처는 네제곱근 변환으로 안정화
2.	Categorical Embedding
•	각 카테고리 ID를 임베딩으로 변환해 dense feature로 통합
3.	Bi-LSTM 기반 시퀀스 인코더
•	seq token을 embedding 후 LSTM으로 양방향 요약
4.	DCNv2
•	복잡한 피처 교호작용을 구조적·명시적으로 생성하는 핵심 모듈
•	Wide & Deep보다 더 안정적으로 고차 관계 포착
5.	MLP (BN + GELU + Dropout)
•	분포 폭등을 억제하기 위해 cross 이후 BN 적용
•	ReLU 대신 GELU로 미세 신호까지 부드럽게 반영

gan

gan.py

논문에 따라 G 1번에, D를 k번 업데이트 가능하도록 구현

모델 구조

Generator
- 입력: 랜덤 벡터 z
- 구조: Linear → BatchNorm → ReLU × 2
- 출력: 이미지(28×28 = 784)

Discriminator
- 입력: 784차원 이미지 벡터
- 구조: Linear → LeakyReLU × 2
- 출력: 진짜/가짜 확률

training_metric.py

d_loss, g_loss, D(G(z))를 그래프로 표현

CV

YBIGTA 과제용 CNN/ViT 구현

데이터셋

  • CIFAR-100 (100 classes, 32×32 RGB images)
  • Training samples: 50,000 / Test samples: 10,000
  • Data augmentation: RandomCrop, HorizontalFlip, Rotation, ColorJitter

모델 구조

원본 코드

  • vit.py: Vision Transformer 원본 (표준 ViT 구조)
  • resnet.py: ResNet 원본 (표준 ResNet18 구조)

과제: 채널 축소 버전 구현

노트북에서 채널 수를 줄여 경량화 버전 구현:

ResNet18 → ResNet18Small

  • 채널: 64→128→256→51224→48→96→192 (약 37.5%)
  • 파라미터: 11.17M → 1.59M (약 85% 감소)

ViT → ViT-Small

  • Embedding dim: 768 → 256
  • Depth: 12 layers → 4 layers
  • Heads: 12 → 4
  • MLP dim: 3072 → 256
  • 파라미터: ~86M → 1.69M (약 98% 감소)
  • SPT (Shifted Patch Tokenization) 사용

학습 노트북

  • train_notebook_example.ipynb
    • 20 epochs, batch size 64, Adam optimizer (lr=1e-3)
    • Cosine annealing scheduler
    • 두 모델의 성능/효율성 비교 분석 포함

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors