본문 바로가기
파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기/chapter4 백테스팅 알고리즘 트레이딩 정복하기 전략

chapter4 알고리즘 트레이딩 정복하기 전략 벡테스팅 개요

by ohsungjun 2026. 1. 27.

4.1_전략_백테스팅_개요.pdf
0.43MB

 

 

EDA가 필요하다

EDA 예시 데이터 핸드링,결측치제거 이상치제거,시각화 등등 

 

EDA(탐색적 데이터 분석, Exploratory Data Analysis)는 데이터 분석 초기 단계에서 그래프, 통계적 요약, 시각화 기술을 활용해 데이터의 분포, 이상치, 변수 간 관계를 파악하고 통찰(Insight)을 얻는 과정입니다. 데이터의 특성을 이해하여 올바른 분석 모델을 선택하고 가설을 검증하기 위한 필수 기초 작업입니다. 
핵심 특징 및 목적
  • 데이터 이해 및 정제: 데이터의 전체적인 모양(분포)을 파악하고 결측치, 이상치를 처리.
  • 변수 간 관계 탐색: 산점도, 히스토그램, 박스플롯 등을 통해 데이터 변수 간 패턴 발견.
  • 가설 설정 및 수정: 초기 데이터 탐색을 통해 새로운 가설을 세우거나 기존 가설을 수정.
  • 기술: 시각화, 평균/중앙값 등 요약 통계량 활용. 
EDA 진행 과정
  1. 데이터 수집 및 구조 확인: 데이터셋의 컬럼과 행의 의미 파악.
  2. 데이터 정제: 결측치 및 이상치 처리.
  3. 데이터 시각화 및 기술 통계: 그래프(산점도, 박스플롯 등)와 통계값(상관계수 등)으로 데이터 탐색.
  4. 인사이트 도출: 패턴 및 잠재적 문제 발견. 
데이터 분석의 기초가 되는 매우 중요한 단계로, 데이터를 쪼개고 시각적으로 검토하여 데이터가 표현하는 현상을 깊이 이해하는 과정입니다

6_DL_modeling_solution.ipynb
0.50MB
6_DL_modeling (1).ipynb
0.49MB
5_ML_modeling (1).ipynb
0.05MB
4_preprocessing (1).ipynb
0.01MB
3_EDA (1).ipynb
0.01MB
2_data_handling_quiz_solution (1).ipynb
0.01MB
2_data_handling_quiz (1).ipynb
0.01MB
2_data_handling (1).ipynb
0.02MB
1_python_library (1).ipynb
0.01MB

 

 

 

 

모델링까지 이 흐름이 중요함

 

 Slippage(슬리피지)란?

슬리피지 = 내가 원한 가격과 실제 체결 가격의 차이로 발생하는 비용

예를 들면

  • 백테스트에서는 10,000원에 매수
  • 실제 시장에서는
    • 주문량이 많거나
    • 호가가 얇거나
    • 급등락 중이라
      10,020원에 체결

👉 이 20원이 바로 슬리피지 비용


 왜 백테스팅에 슬리피지를 넣어야 할까?

백테스팅은 보통:

  • 이상적인 가격
  • 즉시 체결
  • 추가 비용 없음

이라는 너무 낙관적인 가정을 해.

그래서 실제 운용하면 이런 일이 생김:

  • 백테스트 수익률: 연 25%
  • 실전 수익률: 연 10%도 안 나옴

👉 이유 중 하나가 슬리피지 + 수수료 + 시장 충격.


 왜 ‘간단한 작업’인데 신뢰도가 크게 올라갈까?

이유는 딱 하나야 👇

실전에서 반드시 발생하는 비용을 반영했기 때문

슬리피지 적용 전:

  • “이론적으로만 잘 되는 모델”

슬리피지 적용 후:

  • “현실에서도 살아남을 수 있는 모델”

👉 그래서 모델 신뢰도가 크게 올라간다는 말이야.

 

슬리피지는 백테스팅에 실제 거래에서 피할 수 없는 체결 비용을 반영해 수익률을 일부러 보수적으로 낮춤으로써, 이론적으로만 좋은 모델이 아니라 실전에서도 신뢰할 수 있는 모델인지 검증하게 해주는 장치다.