


EDA 예시 데이터 핸드링,결측치제거 이상치제거,시각화 등등
- 데이터 이해 및 정제: 데이터의 전체적인 모양(분포)을 파악하고 결측치, 이상치를 처리.
- 변수 간 관계 탐색: 산점도, 히스토그램, 박스플롯 등을 통해 데이터 변수 간 패턴 발견.
- 가설 설정 및 수정: 초기 데이터 탐색을 통해 새로운 가설을 세우거나 기존 가설을 수정.
- 기술: 시각화, 평균/중앙값 등 요약 통계량 활용.
- 데이터 수집 및 구조 확인: 데이터셋의 컬럼과 행의 의미 파악.
- 데이터 정제: 결측치 및 이상치 처리.
- 데이터 시각화 및 기술 통계: 그래프(산점도, 박스플롯 등)와 통계값(상관계수 등)으로 데이터 탐색.
- 인사이트 도출: 패턴 및 잠재적 문제 발견.





Slippage(슬리피지)란?
슬리피지 = 내가 원한 가격과 실제 체결 가격의 차이로 발생하는 비용
예를 들면
- 백테스트에서는 10,000원에 매수
- 실제 시장에서는
- 주문량이 많거나
- 호가가 얇거나
- 급등락 중이라
→ 10,020원에 체결
👉 이 20원이 바로 슬리피지 비용
왜 백테스팅에 슬리피지를 넣어야 할까?
백테스팅은 보통:
- 이상적인 가격
- 즉시 체결
- 추가 비용 없음
이라는 너무 낙관적인 가정을 해.
그래서 실제 운용하면 이런 일이 생김:
- 백테스트 수익률: 연 25%
- 실전 수익률: 연 10%도 안 나옴
👉 이유 중 하나가 슬리피지 + 수수료 + 시장 충격.
왜 ‘간단한 작업’인데 신뢰도가 크게 올라갈까?
이유는 딱 하나야 👇
실전에서 반드시 발생하는 비용을 반영했기 때문
슬리피지 적용 전:
- “이론적으로만 잘 되는 모델”
슬리피지 적용 후:
- “현실에서도 살아남을 수 있는 모델”
👉 그래서 모델 신뢰도가 크게 올라간다는 말이야.
슬리피지는 백테스팅에 실제 거래에서 피할 수 없는 체결 비용을 반영해 수익률을 일부러 보수적으로 낮춤으로써, 이론적으로만 좋은 모델이 아니라 실전에서도 신뢰할 수 있는 모델인지 검증하게 해주는 장치다.
'파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 > chapter4 백테스팅 알고리즘 트레이딩 정복하기 전략' 카테고리의 다른 글
| chapter4 알고리즘 트레이딩 정복하기-정량적 백테스팅 정의 및 성과지표 개념 소개 (0) | 2026.01.28 |
|---|---|
| chapter4 알고리즘 트레이딩 정복하기-백테스팅과 수익률 그래프 그리기-(슬리피지 적용0,슬리피지 적용X 비교) (0) | 2026.01.28 |
| chapter4 알고리즘 트레이딩 정복하기-백테스팅 이유/기초백테스팅 모델 개발-(슬리피지 적용x) (0) | 2026.01.27 |
| chapter4 알고리즘 트레이딩 정복하기 매매시그널과 백테스킹으로 실습예제 (0) | 2026.01.27 |
| chapter4 알고리즘 트레이딩 정복하기 전략 벡테스팅 용어 정리 (0) | 2026.01.27 |