Commenti dei lettori

나눔로또 파워볼 분석 -알고리즘

동행복권 파워볼 패턴 분석 Lorene Deshotel (2019-07-01)


동행복권 회원가입먼저 데이터가 필요합니다. 많은 분석결과, 200회차 정도의 데이터가 앞으로 나올 일반볼에 끼치는 확률이 유효한 수준이었습니다. 다시 말해서, 너무 오래전 데이터는 오늘 지금의 결과 값에 영향을 끼치기는 하지만, 너무 미미한 영향이라는 것입니다. 이렇게 모은 200회차 분량의 데이터 역시 마찬가지로 150회차 전의 결과와 30회차 전의 결과, 즉 하루 1회 시작부터 따져본다면 그날 50회차 결과와 170회차 결과가 201회차에 끼치는 영향은 다릅니다. 더 극단적으로 말하자면, 첫 1회차는 201회차에 끼치는 영향이 작고, 200회차에 등장한 결과값은 201회차에 끼치는 영향이 큽니다. 205회차에 끼치는 영향력(밀도)을 부여합니다. 이렇게 밀도를 부여하여 미래를 예측하는 것은 카오스 이론의 중심적인 축입니다. 각 변수에 밀도를 얼마만큼 부여하느냐에 따라서 미래가 크게 좌우되기 때문에 카오스 이론이라는 말이 붙었습니다. 이 밀도는 64만개라는 방대한 표본이 있었기 때문에 정밀하게 측정 될 수 있었습니다. 자세한 이론은 링크를 참조해주세요. 각 일반볼이 200회차간 통계적으로 총 몇번 나왔는지, 파워볼 몇회차에 나왔는지 (따라서 단순하게 30번 나왔다고 해서 30이라는 숫자를 갖지 않습니다.) 고려하여 계산을 하면 차트의 파란 기둥이 됩니다. 파란 기둥이 현재까지 나온 일반볼의 데이터를 수치화 한 차트라면, 초록 기둥은 현재까지 나오지 않은 데이터를 확률적으로 나타낸 차트입니다. 이 알고리즘은 동전의 앞면이 연속해서 나오는 확률은 작다는 것에서 착안했습니다.

파워볼 패턴예를 들어 15회간 3번볼이 한번도 등장하지 않았다면, 3번볼에 15라는 값을 주는 것입니다. 물론 파란 기둥과 마찬가지로 단순하게 15라는 값을 주는 것이 아니고, 각 1,2,3.. 마다 정밀하게 계산된 밀도를 부여하는 것입니다. 이렇게 카오스 이론을 통해 계산된 파란 기둥과 초록 기둥이 합쳐져 하나의 차트를 이루게 되는데요, 이를 복합적으로 보셔야 합니다. 파란 기둥이 낮더라도, (즉 통계적으로 확률이 높아도), 초록 기둥이 낮다면 나올 확률은 낮아지는 것입니다. 반대로, 초록 기둥이 높아서 나올 확률이 높다고 생각되어도, 파란 기둥이 높다면 나올 확률을 떨어트리는 것이지요. 하지만, 아무리 정밀하게 계산된 통계와 확률이라도 확률과 통계의 모순을 벗어날 수는 없습니다. 아이러니하게도 현재까지 무슨 볼이 몇번 나왔던지 상관없이, 각 회차에 등장할 일반볼의 확률은 절대로 변하지 않기 때문입니다. 이 때문에 도입하게 된 것이 바로 알파고가 사용하는 몬테카를로 트리탐색 기법입니다. 정확히 말하자면, 몬테카를로 기법이라는 것은 랜덤한 것을 의미하고 트리탐색이라는 것은 각각의 상황이 일어난다고 가정하고 계산한다면 그 이후에는 어떤 식으로 전개될 지 탐색하는 방법입니다. 최근 로또 분석 예측 사이트에서 몬테카를로 방법을 사용한다는 제보가 들어왔습니다. 다시 한번 말하겠습니다. 로또의 표본은 전체의 0.009%밖에 되지 않습니다.



좀 더 알기 쉽게 예를 들어봅시다.

이는 그 어떤 이론도 유효하지 않다는 것을 말해줍니다. 숫자가 씌여진 45개의 공을 늘어놓고 강아지에게 6개를 물어오라고 하는 편이 1등 당첨확률이 더 높습니다. 좀 더 알기 쉽게 예를 들어봅시다. 현재 200회차까지 나온 일반볼 중에서 3, 5, 9, 10 번이 적게 나왔고 나올 확률이 높다면, 즉 파란 기둥이 낮고, 초록 기둥이 적당히 높다고 해봅시다. 205회차에 무슨 볼이 나올지 랜덤하게 대입합니다. 각 회차마다 9만개가 넘는 조합이 존재하므로 총 개 정도의 조합이 존재하게 됩니다. 이는 너무나 큰 숫자여서 모두 다 대입하여 계산할 수가 없습니다. 때문에 랜덤하게 대입하여 가장 결과가 좋은 조합을 찾아내도록 하는 것이 바로 몬테카를로 트리탐색 기법입니다. 205회차의 전체적인 경향성이 어떻게 바뀌는지 계산합니다. 네.. 그래도 무슨 말인지 잘 모르시겠다구요.. 베이지색 주변을 맴돌았다면, 201회부터 주황색, 붉은색으로 점차 변화하는 것은 가능한 일이지만, 뜬금없이 파란색으로 혹은 보라색으로 급변하는 것은 의외적인 일이고 또한 그럴 확률은 낮다고 판단되므로 제외시키는 작업을 할 수 있습니다. 이를 수치화하면 경향성 표가 완성됩니다. 그렇다면 수치화는 어떻게 할까요? 경향성 계산은 조금 복잡합니다. 아주 간단하게 두가지의 볼을 예를들어 보자면, 1번볼과 7번볼이 있는데 둘다 각각 100회중 10회씩만 나왔다고 해봅시다.



5번 버튼의 차트또한 추가되었습니다.

이런식으로 불균일하게 출현했다고 해봅시다. 그리고 둘다 90회차에 동시에 출현한 후 100회차까지 출현하지 않았다고 한다면, 나온 횟수가 동일하고 안나온 회차수가 동일하므로 카오스 이론에서 밀도가 다르다고 하더라도 차트로는 한눈에 분간하기가 꽤 어려울 것입니다. 하지만 일반볼 각각마다 몇회차에 출현했는지, 즉 출현 상태가 어떤 state에 있는지, metastable, stable, unstable 혹은 propagate 중인지 따져보고 위에서 설명한 몬테카를로 트리탐색 기법을 적용시켜 전체적인 퍼즐을 맞추는 것이라고 할 수 있습니다. 경향성 표에서는 수치가 높은 것이 이례적인 것이고 따라서 나올 확률이 적으며 붉은 음영으로 표시됩니다. 수치가 낮은 것은 매우 흐름을 잘 타고 있다는 것이고 따라서 나올 확률이 높으며 초록 음영으로 a href="http://www.reddit.com/r/howto/search?q=%9C%EC%8B%9C%EB%90%A9%EB%8B%88%EB%8B%A4">시됩니다. 여기까지가 제 프로그램의 알고리즘입니다. Python 등으로 옮기는 것은 단순한 노동에 불과합니다. 물론 얼마나 더 빠르게 계산을 할 수 있게 짜는가는 컴퓨터 언어 실력으로 판가름 나지만, 계산은 제가 아닌 컴퓨터가 하는 것이기 때문에 정확성은 똑같습니다. 그러므로 프로그램의 기둥과 토대가 되는, 파워볼 사람이 만드는 알고리즘을 짜는 것이 더욱 중요합니다. 제가 나눠드리는 엑셀 분석기는 계산된 수치들을 눈으로 보기 쉽게 차트로 시각화하기 위한 도구일 뿐입니다. 따라서 제가 드리는 실시간으로 계산된 수치들을 분석기에 넣어야 제대로 된 결과를 얻을 수 있습니다. 5번 버튼의 차트또한 추가되었습니다. 5번 차트는 제 알고리즘을 흉내만 낼 수 있도록 고안한 것이고 완벽한 계산은 아닙니다. 5번 차트는 혹시모를, 지금 일반볼이 준안정(metastable)상태 일 수도 있으니 확인차 드리는 것입니다. 준안정상태일 경우, 급변하는 것이 가능합니다. 급변중의 상황을 5분안에 예측하는 것은 솔직히 말씀드리자면 불가능에 가깝습니다. 바늘 위에 놓인 쇠구슬과 같다고 할 수 있습니다. 어느방향으로 굴러떨어질지는 오직 신만 알 수 있습니다.





ISSN: 05152178