목차
1. CDM (Compound Dirichlet Multinomial) 모델
CDM은 학술 논문(arXiv:2403.12836)에 기반한 베이지안 확률 모델입니다. 단순히 "많이 나온 번호"를 추천하는 것이 아니라, 다음 3가지 요소를 종합적으로 분석합니다.
출현 빈도
전체 회차에서 각 번호의 출현 횟수와 비율
최근 트렌드
최근 50~100회차에서의 출현 패턴 변화
베이지안 사후 확률
디리클레 분포 기반 사후 확률 추정
이 세 가지를 가중 합산하여 각 번호에 CDM 점수(0~1)를 부여하고, 점수가 높은 번호부터 순위를 매깁니다.
2. Markov Chain 전이 확률 분석
Markov Chain은 "이번 회차에 번호 A가 나왔을 때, 다음 회차에 번호 B가 나올 확률"을 계산하는 기법입니다.
작동 원리
- 전체 당첨 이력에서 45x45 전이 행렬을 구축합니다
- T[i][j] = i번호 다음 회차에 j번호가 나온 횟수 / i번호 총 출현 횟수
- 최근 3회차의 번호를 시작점으로 사용합니다 (가중치: 최근 50%, 2회전 30%, 3회전 20%)
- 전이 확률이 높은 번호 = 다음 회차에 나올 가능성이 높은 번호
CDM이 개별 번호의 독립적 확률을 보는 반면, Markov Chain은 번호 간의 관계성(연쇄 패턴)을 포착합니다.
3. Monte Carlo 시뮬레이션
Monte Carlo 시뮬레이션은 CDM과 Markov Chain의 점수를 확률 분포로 변환한 뒤, 컴퓨터로 50,000회의 가상 추첨을 실행하는 방법입니다.
확률 분포 생성
CDM 50% + Markov 50%로 각 번호의 선택 가중치 설정
대량 시뮬레이션
50,000회 가상 추첨에서 번호별 출현 빈도 추출
이론적 확률 계산이 아닌 실제 시뮬레이션 결과이므로, CDM/Markov와는 다른 관점의 교차 검증 역할을 합니다.
4. 앙상블 (Ensemble) 합산
앙상블은 위 3가지 모델의 결과를 가중 합산하여 최종 점수를 산출하는 방법입니다. 머신러닝에서 단일 모델보다 여러 모델을 합치면 성능이 향상되는 원리를 적용합니다.
CDM
Markov
Monte Carlo
CDM에 가장 높은 가중치(40%)를 부여하는 이유는 학술 논문에 기반한 가장 이론적 토대가 견고한 모델이기 때문입니다.
5. 백테스트 검증
백테스트는 20가지 통계 공식을 과거 전체 회차에 적용하여 실제 당첨번호와 비교하는 역추적 검증입니다.
각 공식별로 평균 적중률(6개 중 몇 개 일치)과 최근 50회차 적중률을 계산하여, 가장 성능이 좋은 공식의 결과를 추천합니다. 일반적으로 평균 2~3개 적중 수준의 공식이 선별됩니다.
6. 스마트 랜덤 생성기
완전 랜덤과 달리, 역대 당첨 번호의 통계적 패턴을 충족하는 조합만 생성합니다.
홀짝 비율
2:4 ~ 4:2
고저 비율
2:4 ~ 4:2
합계 범위
100 ~ 180
번호대 분포
3개 이상 구간
7. 로또 당첨 확률 이해하기
로또 6/45는 45개 번호 중 6개를 선택하는 조합입니다. 총 경우의 수는 8,145,060가지입니다.
| 등수 | 조건 | 확률 | 평균 당첨금 |
|---|---|---|---|
| 1등 | 6개 일치 | 1/8,145,060 | ~20억원 |
| 2등 | 5개 + 보너스 | 1/1,357,510 | ~5,000만원 |
| 3등 | 5개 일치 | 1/35,724 | ~150만원 |
| 4등 | 4개 일치 | 1/733 | 5만원 |
| 5등 | 3개 일치 | 1/45 | 5,000원 |
로또는 완전한 무작위 추첨입니다. 어떤 분석도 당첨을 보장하지 않으며, 내로또는 통계적 참고 도구로만 활용하시기 바랍니다. 과도한 구매는 삼가해 주세요.