교육
#19. 운동장의 특성#2 (feat. 분산 혹은 집중과 켈리공식)
오렌지보드
2023.09.19
‘음, 슴’ 체?로 전개하니, 전달은 잘 되고 어미가 단정적이게 되는 경향이 있습니다. 감안하고 읽어주시기 바랍니다.
운동장의 특성을 연재하고 있습니다. 운동장(투자와 금융시장)의 특성을 이해하는 것은 투자에 대한 관점을 높이고, 운동장을 유리하게 사용하는데 큰 도움이 됩니다.
'계란을 한 바구니에 담지 말라' 라는 말도 있고, '인생에서 몇 종목이면 충분하다' 라는 말도 있습니다. 15종목이 어떤 이에게는 분산투자이고, 어떤 이에게는 집중투자이기도 합니다. 집중과 분산은 상대적인 개념입니다.
켈리 공식을 통해 분산투자와 집중투자의 의미를 생각해 봅니다.
1. 투자로 돈을 많이 번 분들의 얘기를 들어보면 공통점이 있음. 대박친 종목이 꼭 있음. 비중이 적당히 높은 종목이 꽤 상승해서 부를 이루는 밑천이 되었다는 일화임.
2. 이런 분들도 자주 대박치는 건 아님. 시장에 장기간 살아남아서 여러 종목을 오랫동안 투자하다 보니, 얻을 수 있었던 결과임.
3. 살아 남아서 게임을 계속할 수 있어야 분산이든 집중이든 할 수 있음.
4. 이런 배팅을 설명하는 공식이 있음. 켈리 공식임. 액션할 때는 켈리 배팅이라고 함.
5. 켈리 공식의 의미는, 1)게임에서 오래 살아남으면서, 2)가장 큰 이익을 만들기 위한 배팅 비율을 계산하는 것임.
6. 켈리 공식이 2)를 위한 것으로 많이 알려져 있지만, 1)도 큰 목적임. 살아남아야 배팅도 할 수있음.
7. 켈리 공식을 수학적으로 엄밀하게 투자에 적용할 필요까지는 없다고 봄. 켈리 공식을 이해하고 공식의 개념을 포트폴리오에 적용하는 건 필요하다고 생각함.
8. 두 가지 형태가 자주 사용됨.
1) F = p/a - q/b = 성공확률/손실률 - 실패확률/수익률
*실패확률 = 1 - 성공확률
** 손실률과 수익률은 원금을 제외한 값임
2) F = p-(1-p)/b = 성공확률 - 실패확률/손익비
*손익비 = 수익률/손실률 = 수익금액/손실금액, 손익비는 '위험 대비 보상' 을 의미함.
9. 1)식을 이용한 예시임. 성공확률 55%, 실패확률 45%, 이익률이 50%, 손실률 50%이면, 20%의 비중을 실어야 함.
10. 2)식을 이용한 예시임. 성공확률 55%, 실패확률 45%, 이익률이 50%, 손실률 50%이면, 10%의 비중을 실어야 함.
11. 이상한 점이 발견됨. 두 식의 결과가 다름.
12. 두 번째 문제는 배팅 비중이 너무 높게 나옴. 성공확률 50%, 실패확률 50%, 수익률 1, 손실률 0.4일 경우 75%를 배팅하라는 결과가 나옴. 저 정도 비중으로 투자하지 못할 듯함.
13. 세 번째는 문제는 아님. a(손실률)를 1로 고정하면 두 식의 결과가 동일함.
주) 손실률(a)과 이익률(b)이 1일 때, f는 CAGR과 같음. 본문 55)번 확인.
14. a를 1로 고정하면 b는 손익비(=이익/손실)가 됨. a가 1일 때는 배팅 비율이 어느 정도 납득이 감.
15. 켈리공식은 손실률 a의 값이 1보다 작은 경우, (사실일지라도) 심리적으로 받아들이기 어려운 값이 얻어 지기도 함.
16. 공식 증명을 해보려는 이유임.
17. 결론은 1)식이 증명으로 유도한 공식이고, 2)식은 1)식에서 a가 1인 특수한 형태임.
켈리공식은 1956년에 발표됨
18. 클로드 섀넌(1916~2001)이라고 있음. 디지털의 아버지 혹은 정보이론의 아버지라고 불리는 분임. 1948년 32살 때, 「커뮤니케이션의 수학적 이론(A Mathematical Theory of Communication)」 이란 논문을 씀. 정보를 비트(bit)라는 단위로 최초로 표현한 분임. 비트는 0과 1의 두 가지 값을 가질 수 있는 이진수임. 이 분이 이진수를 사용하여 정보통신하는 토대 이론을 만든 분임.
19. 클로드 섀넌은 1941년부터 1956년까지 벨연구소에서 근무했음. 1956년에 MIT로 옮긴 후, 에드워드 소프(1932~살아계심)를 만났다고 함. 그래도 벨 연구소와 연관된 일은 한 듯함. 여튼, 이 분이 1950년대에 벨 연구소에서 같이 일한 사람이 존 켈리(1923~1965)임.
20. 아래 메르님 글에서 중간 정도에 배경 설명이 있음.
역사에서 배우는 포트폴리오 투자법 (feat 정보와 분산의 중요성) by 메르
21. 켈리 공식은 섀넌이 아이디어를 내고, 존 켈리가 완성한 공식임.
22. 1956년에 발표됨. 논문의 제목은 "A New Interpretation of Information Rate"임.
https://www.princeton.edu/~wbialek/rome/refs/kelly_56.pdf
23. 이 논문은 정보이론과 금융이 어떻게 결합될 수 있는지에 대한 통찰을 제공하며, 도박이나 주식 시장과 같은 불확실한 상황에서의 최적의 배팅 전략의 이론을 제공함.
24. 후에 에드워드 소프(1932~살아계심)와 클로드 섀넌이 켈리 공식을 카지노와 투자에 적용하여 공식의 가치를 높임. 세분 다 천재임.
켈리 공식의 증명 결과는 f=p/a - q/b 임
25. 논문을 직접 이해하는 것은 조금 난해한 측면이 있어 다른 이가 증명한 방식을 차용함. 링크#1, 링크#2
주) 아래 글의 일부 내용은 원글을 적당한 범위에서 인용하였으나, 원작자의 요청에 따라 삭제하거나 다른 내용으로 교체될 수 있음.
26. 승리할 확률을 p, 패배할 확률을 q(=1-p), 승리시 수익률을 b, 패배시 손실률을 a, 총 배팅 횟수를 N, 승리한 횟수를 Nb, 패배한 횟수를 Na라고 정함. f는 배팅 비율임.
p: 승리 확률
q: 패배 확률 (=1-p)
b: 승리 시 이익률
a: 패배시 손실률
f: 배팅 비율
N: 시행 횟수
Nb: 시행 중 승리한 횟수
Na: 시행 중 패배한 횟수
27. 복리 이자율은 '(1+이자율)^시행회수'임. 이자율은 '배팅비율x수익률' 로 표현할 수 있음.
28. N번의 배팅을 수행하는 동안 Nb번 이기고, Na번 졌다면 최종이자율은 아래와 같음.
29. 수익률을 극대화하려면 이자율이 최대가 되어야 함.
30. 위의 식이 N회의 배팅이라면, N번의 배팅 중 1번의 배팅으로 기대할 수 있는 이자율은 최종이자율의 기하평균임 (기하평균은 복리수익률과 동일함). 기하평균을 구하려면 27)번 식에 N루트를 씌우면 됨.
31. Nb/N은 성공확률 p로, Na/N은 패배확률 q로 치환할 수 있음. N이 충분히 크다는 걸 가정해야 함(성공과 실패 확률이 1회로 결정되는 것은 아님. 평균에 수렴하려면 샘플이 많아야 함).
32. 31)번 식에 Log를 씌움. 지수함수를 선형화 하거나, 큰 수를 작은 수로 표현할 때 로그를 사용함.
33. 위 식이 최대가 될 때, 최종 이익률이 최대가 됨.
34. 최대가 되는 f를 찾기위해 f로 위 식을 미분함.
35. 34)번 식이 '0' 가 되는 f 값에서 극대 혹은 극소값을 가짐.
36. f = p/a - q/b 임. 이제 자주 보던 식이 나왔음.
37. 한번 더 확인이 필요함. 위 f는 극대값일 수도, 극소값일 수도 있음. 확인하기 위해 한번 더 미분함 (이계도함수).
38. 이계도함수의 값이 항상 '0'보다 작으므로 위 f가 '0' 가 되는 값은 극대값임.
(아래 내용은 필자의 해석이 포함되어 있음)
손실률이 1인 경우가 가장 보수적임
39. 다른 형태인 f = p - q/b 라는 식은 어떻게 발생했을까 를 생각해 봄.
40. 위 식은 일반식인 f = p/a - q/b 에서 a=1인 특수한 경우임.
41. 앞선 설명에서 a가 1보다 꽤 작은 경우는 받아 들이기 어려운 값을 보일 수 있다고 했음. 예를 들어 성공확률이 90%, 수익률 11%, 손실률 50%에서 최적 배팅은 89%가 나옴. 이런 배팅이 사실일 지라도 실행하기 어려운 부분이 있음.
42. a가 1인 경우는 전액 원금 손실을 의미함. 가장 보수적인 경우라는 말임.
43. 또한 a를 1로 고정하면, b는 손익비가 됨. '이익률/손실률' 혹은 '이익금/손실금' 으로 으로 표현할 수 있음. 많은 책에서 언급되는 어구인 '위험 대비 보상' 을 변수로 활용할 수 있게 됨.
44. 적용#1) f=50% - 50%/2 = 25% 에서 '2' 는 이익률이 200%이고, 손실률이 100%인 경우를 의미함.
45. 적용#2) f=50% - 50%/(2000/1000) = 25% 에서 '2000/1000'은 벌 때는 2000을 벌고, 잃을 때는 1000을 전부 잃는 게임(패배 시 손실률 100%)이라는 의미임.
46. 배팅 금액 전부를 잃는 경우인 a=1로 고정하면 변수를 줄일 수 있음.
47. 이하 언급되는 켈리 공식은 'f=p-q/b' 인 경우를 의미함.
이익률도 1인 경우가 다루기 좋음
48. 논문에서 말하는 로그는 자연로그가 아니라 밑이 2인 로그임. 논문에서 바이너리 정보(0 혹은1)를 반복적으로 처리하는 것(추정: 섀넌의 논문과 관련이 있는 듯)이 도박에서 연속시행을 하는 것과 비슷하다는 식의 표현이 있음.
49. 밑이 2인 로그는 2의 지수함수를 선형화한 것임. 논문에서 말하는 반복 시행은, 승리 시 이익률 1, 패배 시 손실률 1을 가정한다고 봄. '계속 벌면 N시행 후에는 2^N이 된다' 라는 말이 논문에 있음.
50. 기대이익을 크게 잡으면 배팅 비율이 크게 상승함. 그리고 손익비는 한계 효용을 가짐. 대략 손익비가 3이 넘어가면, 기대수익이 더 늘어나도 배팅 비율이 크게 늘어나지 않음.
51. 고로 손익비를 너무 크게 잡을 필요가 없음. 투자에서 위험은 낙관에 비례함. 작게 가정하는 것이 생존에 유리하다는 말임.
52. 나름대로 b를 적당히? 고정할 수 있는 이유가 마련되었음. 위험대비 보상(b)을 고정할 필요는 없다고 보나, 대강의 가이드라인을 마련하기 위해 단순한 형태를 제시함.
주) b를 1로 고정하면, 'f=p-q=2p-1' 로 단순한 형태가 됨.
53. 산식의 증명과정에서는 a와 b의 유효범위가 있는 것 같지 않으나 1)논문을 참고하고, 2)실용적인 부분을 고려했을 때, a(손실률)을 1로, b(이익률)을 1로 고정하는 게 사용하기 쉬움.
주) 식의 유효 범위는 f=p/a-q/b 관계에서 유추할 수 있음. f가 0보다 크려면, pb>qa 이어야 함.
자신의 승률을 과신하면 빨리 망할 수 있음
54. 켈리 공식에서 계산된 결과는 성장률을 최대화하는 배팅 비율임. 켈리 배팅에서 성장률(Growth rate) 곡선은 최적 배팅 비율에서 극대값을 가짐. 가장 공격적인 배팅이라는 말임.
<https://en.wikipedia.org/wiki/Kelly_criterion>
f= 60% - 40%/1 = 20%
55. 성공확률 60%, 실패확률 40%, 손익비가 1인 경우, 배팅 비율은 20%임. 10회 시행시 기대이익은 배팅금액 포함 6.2배임. 포트폴리오 전체에서 6.2배를 기대하려면 5종목으로 투자해야 함.
주) 손익비가 1인 경우, f와 CAGR이 동일함.
56. 위의 가정에서 성공확률을 90%로 올려봄. 배팅 비율이 80%로 상승함.
57. 위험 대비 보상 비율을 올려도 배팅 비율이 상승함.
58. 배팅 비율은 확률과 보상의 함수임. 확률이 높아 보여 비중을 높였을 때, 한 방 맞으면 큰일 날 수 있음. 확률을 자신감으로 바꿔도 됨. 과잉 자신감은 투자에서 큰 비용을 치를 수도 있음.
주) 60% 성공확률도 꽤 높은 수준임.
알파를 원한다면 확률과 기대값을 파악해야 함
59. 통계에서 전수 조사가 어려운 경우 샘플(표본집단)로 전체(모집단)의 특성를 유추함. 선거의 출구조사가 그런 방식임.
60. 샘플의 결과를 정규분포화(normalizing)하여 모집단의 특성을 유추함.
61. 오래 전, 통계학 박사전공을 하는 동생에게 샘플이 몇 개 정도면 정규분포화 할수 있냐고 물어봄. 대략 30개면 가능하지 않을까 라고 대답함.
62. 투자관련 서적에서, 정확한 수치로 말하기 어렵지만 대략 20~30개의 종목이면 포트폴리오가 시장과 비슷한 특성일 보인다고 말함.
주) 출처를 찾지 못해 기억에 의존함. 다양한 경우가 있을 수 있음.
63. 손익비 1, 성공확률 53%일 때, 켈리 배팅은 5%임(CAGR도 5%라는 말임). 20종목이 100%라는 의미임. 그리고 미국이나 한국 주식시장의 수십년간 CAGR이 대략 5% 내외임.
64. Source가 다른 곳에서 말하는 바가 비슷하면, 어느 정도 믿게 됨.
65. 동일 비율로 모두 사면 완전하게 시장과 같이 가겠지만, 대강 20종목이 훌쩍 넘어가면 시장의 특성을 반영한다라고 이해함.
66. 더 많이 벌고 싶으면 종목수를 줄이라는 뜻임.
67. 전설적인 헤지펀드 매니저 조지소로스는 켈리배팅을 사용하고 성공확률이 55% 정도라고 알려져 있음. 소로스의 퀀텀펀드는 1973년부터 2011년까지 연평균 약 20%의 수익률을 달성했음. 55%도 높은 성공확률이라는 말임.
68. 피터린치와 소로스가 한 공통적인 말이 있음. '중요한 건 내가 맞았을 때 얼마를 벌고, 내가 틀렸을 때 얼마를 잃느냐' 임.
69. 워렌 버핏이 2008년 경영대학원 학생들에게 분산투자에 관해 질문을 받았을 때, 대답한 말이 있음. 집중투자 라는 책에서 가져옴.
70. 에드워드 소프는 '켈리 기준은 우월하나 점근적이어서 시간이 흐를수록 확률이 높아지지만, 사람들이 켈리 기준을 유지하기는 어려울 수 있다' 고 말함.
71. 말씀하시는 뉘앙스로 봐선 이 분들은 모두 켈리 배팅의 개념을 투자에 사용하는 듯함.
너무 많지도 적지도 않은 10종목 내외가 적당한 듯
72. 54)번에서 켈리 배팅은 성장률을 극대화하는 값이라고 설명함. 가장 공격적인 경우라는 말임.
73. 우리의 깜냥을 고려할 때, 워렌 버핏이 말한 5종목 보다는 많고, 시장 수익률의 특성을 가지는 20~30종목보다 적게 포트폴리오를 구성해야 알파를 노릴 수 있다고 봄.
74. 켈리 배팅을 투자에 적용하기 위한 대강의 가이드라인을 제시함. 공식의 의미를 알고 자신의 성향에 맞게 적용하면 됨. 종목수에 관한 정답은 없음.
75. 켈리 공식에서 성공확률이 55%, 손익비를 1로 가정했 때 최적 배팅 비율이 10%임. 10종목으로 투자하라는 말임.
76. 10회 반복 시, 기대이익은 원금포함 6.7배이고, 40회 반복 시 기대이익은 45.3배임. 매 시행 반복할 때마다 기대할 수 있는 최종 이익은 지수함수로 늘어남.
77. 켈리 공식에 의하면, 년 평균 10%보다 더 큰 이익을 기대하려면, 포트의 일부는 보상이 큰 종목으로 구성하거나, 비중이 큰 종목을 포함되어야 함.
78. 대강의 가이드라인은 1)10종목 내외로 포트를 유지하면서, 2)나름의 안전장치(하락방어, 현금비중 조절, 종목간 위험회피 등)을 마련하고, 3)확률이 높을 때 가끔 특정 종목의 비중을 높이는 투자를 수행하면 충분할 듯함. 이렇게 운영하면서 수익이 지속적이면 전문가라고 생각함.
79. 10 종목을 반드시 유지하라는 말이 아님. 종목이 많을 수록 인덱스와 가까워지고, 초과수익을 기대하려면 확률을 높이고 종목수를 적당히 줄여야 한다는 말임. 켈리 배팅의 핵심 의미임.
80. 켈리 배팅은 이익을 최대화하는 배팅 비율이므로 공식의 결과값보다는 비중을 조금 적게 가져가는게 생존에 유리하다고 봄.
81. 운동장의 특성은 1)소수의 종목에 2)장기간 투자하는 것이 성공확률을 높인다고 말하고 있음.
82. 켈리 공식은 '시행(배팅)을 지속하면서 수익률을 극대화하려면 몇 종목을 가져가야 되나' 의 문제에 대한 메시지를 던져주지만, 이는 능력범위의 문제와 연결됨.
83. 본인의 능력이 의심스러우면 자산배분하고, 분산해야 함.
84. 소수를 고를 능력이 부족하고, 장기간 투자할 수 있는 실력과 마인드가 부족한 사람은 투자에 적합하지 않을 수 있음. 능력이 부족하다고 생각할수록 광범위한 분산이 더 적합한 듯 함. 이마저도 쉽지 않다고 생각하지만, 시장의 성과라도 가져갈 수 있음.
85. 켈리 공식을 사용하기 전에 나를 파악하는게 먼저인 듯함. 내가 1)소수를 고를 실력이 있는지, 2)승률은 어떤지, 3)장기투자 마인드에 기질이 적합한지 를 파악해야 공식이 의미가 있을 듯.
뭘 하더라도 많은 곳에 분산되어 있으면 복리를 제대로 누릴 수 없다고 생각합니다. 집중하기 위해서는 능력을 키워야 합니다. 간(용기)만 키우면 큰일 날 수 있음!!!
Disclaimer
- 본 보고서는 오렌지 보드에 독점 기고합니다.
- 당사의 모든 콘텐츠는 저작권법의 보호를 받은바, 무단 전재, 복사, 배포 등을 금합니다.
- 콘텐츠에 수록된 내용은 개인적인 견해로서, 당사 및 크리에이터는 그 정확성이나 완전성을 보장할 수 없습니다. 따라서 어떠한 경우에도 본 콘텐츠는 고객의 투자 결과에 대한 법적 책임소재에 대한 증빙 자료로 사용될 수 없습니다.
- 모든 콘텐츠는 외부의 부당한 압력이나 간섭없이 크리에이터의 의견이 반영되었음을 밝힙니다.
이런 글은 어떠세요?