ctr_prediction

lgbm.py

주요 특징

•	1:1 언더샘플링으로 불균형 완화
•	hour cyclic 변환(sin/cos) 적용
•	max_bin=511, depth↑로 미세 구간의 차이를 세밀하게 포착
•	seq 정보를 반영하기 위해 BiGRU seq32 벡터 추가(seq있는 parquet 사용해야함)

bigru.py

원본 데이터의 seq 컬럼(숫자 토큰 시퀀스)을 32차원 의미 벡터(seq32) 로 변환하는 전용 모델

주요 특징

•	BiGRU 기반 Masked LM 방식 사전학습
•	PAD/UNK/MASK 토큰 포함한 자체 vocab 구성
•	시퀀스 길이를 tail-truncate 후 left-padding
•	마지막 hidden state를 평균 풀링 → 32차원 프로젝트 벡터

DeepCrossCTR.py

복잡한 고차 교호작용과 시퀀스 정보의 활용을 목표로 설계한 딥러닝 모델.

내부 구성

1.	Numerical Feature + BatchNorm
•	history 계열의 극단적 분포를 완화하기 위해
• 일부 피처는 네제곱근 변환으로 안정화
2.	Categorical Embedding
•	각 카테고리 ID를 임베딩으로 변환해 dense feature로 통합
3.	Bi-LSTM 기반 시퀀스 인코더
•	seq token을 embedding 후 LSTM으로 양방향 요약
4.	DCNv2
•	복잡한 피처 교호작용을 구조적·명시적으로 생성하는 핵심 모듈
•	Wide & Deep보다 더 안정적으로 고차 관계 포착
5.	MLP (BN + GELU + Dropout)
•	분포 폭등을 억제하기 위해 cross 이후 BN 적용
•	ReLU 대신 GELU로 미세 신호까지 부드럽게 반영

gan

gan.py

논문에 따라 G 1번에, D를 k번 업데이트 가능하도록 구현

모델 구조

Generator
- 입력: 랜덤 벡터 z
- 구조: Linear → BatchNorm → ReLU × 2
- 출력: 이미지(28×28 = 784)

Discriminator
- 입력: 784차원 이미지 벡터
- 구조: Linear → LeakyReLU × 2
- 출력: 진짜/가짜 확률

training_metric.py

d_loss, g_loss, D(G(z))를 그래프로 표현

CV

YBIGTA 과제용 CNN/ViT 구현

데이터셋

CIFAR-100 (100 classes, 32×32 RGB images)
Training samples: 50,000 / Test samples: 10,000
Data augmentation: RandomCrop, HorizontalFlip, Rotation, ColorJitter

모델 구조

원본 코드

vit.py: Vision Transformer 원본 (표준 ViT 구조)
resnet.py: ResNet 원본 (표준 ResNet18 구조)

과제: 채널 축소 버전 구현

노트북에서 채널 수를 줄여 경량화 버전 구현:

ResNet18 → ResNet18Small

채널: 64→128→256→512 → 24→48→96→192 (약 37.5%)
파라미터: 11.17M → 1.59M (약 85% 감소)

ViT → ViT-Small

Embedding dim: 768 → 256
Depth: 12 layers → 4 layers
Heads: 12 → 4
MLP dim: 3072 → 256
파라미터: ~86M → 1.69M (약 98% 감소)
SPT (Shifted Patch Tokenization) 사용

학습 노트북

train_notebook_example.ipynb
- 20 epochs, batch size 64, Adam optimizer (lr=1e-3)
- Cosine annealing scheduler
- 두 모델의 성능/효율성 비교 분석 포함

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
CV		CV
ctr_prediction		ctr_prediction
gan		gan
simCLR		simCLR
.DS_Store		.DS_Store
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ctr_prediction

lgbm.py

주요 특징

bigru.py

주요 특징

DeepCrossCTR.py

내부 구성

gan

gan.py

모델 구조

training_metric.py

CV

데이터셋

모델 구조

원본 코드

과제: 채널 축소 버전 구현

학습 노트북

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

ctr_prediction

lgbm.py

주요 특징

bigru.py

주요 특징

DeepCrossCTR.py

내부 구성

gan

gan.py

모델 구조

training_metric.py

CV

데이터셋

모델 구조

원본 코드

과제: 채널 축소 버전 구현

학습 노트북

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages