팩터 팩토리 시리즈 1 : 시장 이상현상 및 팩터 탐색 프레임워크

Donghyung Ko
Qraft Technologies
Published in
12 min readSep 15, 2020

팩터 투자란?

팩터 투자라는 단어가 생소한 사람들도 워렌 버핏이라는 이름은 낯설지 않을 것이다. 워렌 버핏은 가치투자의 창시자로도 잘 알려진 벤자민 그레이엄(Benjamin Graham)의 제자이며 투자의 귀재, 오마하의 현인 등 수 많은 수식어가 따라 붙는 전설적인 투자자이다. 워렌 버핏은 회사의 재무제표를 분석하고 다음의 규칙에 의거하여 투자를 하였다.

“재무구조가 건전하고 꾸준한 현금흐름을 창출하는 우량기업 중 시장에서 저평가되어 있다고 판단되는 주식을 매입하라”

팩터 투자도 원칙에 의거하여 투자한다는 점에서 공통점을 갖는다. 팩터 투자는 시장 대비 초과수익을 올리는 것으로 알려진 특성을 지닌 기업에 투자하는 방법론이다. 예를 들어, 밸류 팩터는 장부가치와 시장가치의 비율로 측정된다. 비교적 최근을 제외하고, 전 세계에 존재하는 대부분의 거래소에서 밸류가 높은 기업이 밸류가 낮은 기업보다 좋은 성과를 거둔 것으로 보고되었다. 시장에는 value와 같이 잘 알려진 팩터 이외에도 시장에는 무수히 많은 팩터와 존재한다.

개발 배경

시장이상현상은 이름 그대로 그 원인을 명확히 설명하는 것이 어렵기 때문에 대개 귀납적인 연구를 통해 밝혀진다. 시장이상현상은 경우의 수가 무수히 많고 검증과정이 획일화되어 있지 않다. 따라서, 이를 시장이상현상을 찾고 이를 평가하는 과정은 팩터 투자에 대한 선행 지식을 갖고 있는 일부 연구자에 의해서만 이뤄져왔다. 기존의 방식은 연구자의 역량에 크게 의존하기 때문에, 많은 수의 연구자가 필요하고 새로운 이상현상을 발견하는데 많은 시간이 소요된다는 문제를 갖는다.

Icon made by Eucalyp from www.flaticon.com

Qraft에서 개발하고 있는 팩터 팩토리는 이러한 문제를 해결하기 위해 이상현상 탐색 과정을 자동화한 프레임워크이다. 팩터 팩토리는 새로운 이상현상의 탐색 과정을 모델링하고 이를 평가하는 과정을 계량화 함으로써 사람의 개입 없이 컴퓨터가 풀 수 있는 문제로 변환하였다. 뿐만 아니라, 강화학습 기반의 서치 알고리즘을 결합하여 탐색 과정을 최적화하여 다양한 이상현상을 효율적으로 탐색한다. 팩터 팩토리는 Qraft에서 개발한 Data ETL API인 Kirin을 이용하여 S&P Compustat 데이터를 포함한 모든 데이터를 처리한다. 팩터 팩토리는 Kirin API를 통해 불러온 데이터를 탐색 알고리즘이 제안하는 방식으로 조합하여 강건한 alpha를 갖는 이상현상을 탐색한다.

주요 구성요소

팩터 팩토리가 새로운 이상현상을 탐색하는 과정은 레스토랑에서 새로운 메뉴를 개발하는 과정과 유사하다. 팩터 팩토리는 5가지 대표적인 요소로 구성되어 있다. 각각의 요소는 요리 재료가 담겨있는 Universe, 조리 방식과 어떤 재료를 넣을지 결정한다 셰프에 대응되는 SearchAlgorithm과 PortfolioMethodology, 요리가 만들어지는 주방에 해당하는 FactorGym, 마지막으로 만들어진 음식을 평가하는 MetricFn 등이 있다.

Icon made by Eucalyp from www.flaticon.com

1. Universe
Universe는 재료에 해당하는 요소로 포트폴리오를 구성하기 위한 종목 풀(pool)을 결정한다. Universe에서 결정하는 요소는 투자 종목의 거래소(NYSE, NASDAQ, AMEX..), 클래스별 사용 여부(ex, ClassA Only), 증권 종류(Common, Preferred, ADR), 기간, 시가총액 등 매우 다양하다. 동일한 팩터라도 Universe 설정에 따라 그 효과는 매우 다르게 나타날 수 있기에, 단순하지만 중요한 단계이다.

2. FactorGym

FactorGym은 요리가 만들어지는 주방에 대응되는 요소이다. Universe에서 재료를 선정한 후, 셰프(Search Algorithm & PortfolioMethodology)가 제안하는 방식으로 새로운 요리(포트폴리오)를 만들어낸다. 이렇게 만들어진 요리는 아래의 그림과 같이 Factor Tree 라는 Expression Tree로 표현된다. 셰프는 현재 주어진 재료(Node)를 보고 다음 재료를 선택하는 과정을 반복하여 하나의 Factor Tree를 완성한다. Factor Tree를 구성할 수 있는 노드는 Operator, Data, 그리고 Normalizer의 세 종류로 나뉘며, Operator Node 와 Normalizer Node 가 번갈아 쌓이다가, 마지 막 말단에 Data Node 가 자리하는 형식으로 트리가 구성된다.

[ 그림 01. Expression Tree ]

3. SearchAlgorithm

좋은 요리를 만들기 위해서는 각 재료의 특성과 조화를 충분히 고려하여야 한다. 탐색 알고리즘은 새로운 요리를 만들 때 어떤 재료(Node)를 사용할지 결정한다. 재료를 선택하는 방법은 크게 두 가지가 있다. 먼저, 과거 성공적인 요리를 만들었던 재료의 조합을 조금씩 바꿔가며 새로운 요리를 만들어 볼 수 있다. 이 방법은 성공할 확률이 높다는 장점을 갖지만 이전과 비슷한 요리가 만들어질 수 있다는 단점이 있다. 반면, 완전히 새로운 재료의 조합을 사용하면 많은 시도와 실패를 수반하지만 전혀 새로운 요리가 탄생하기도 한다. 이러한 아이디어를 적용하여, 팩터 팩토리에는 강화학습 방식과 랜덤 서치, 두 가지의 탐색 알고리즘이 구현 되어 있다.

[ 그림 03. Search Algorithm ]

랜덤 서치 방식은, 이름 그대로 무작위로 노드를 추천하여 팩터 트리를 완성해 가는 탐색 방식이다. 랜덤 서치는 그리드 서치와 더불어 가장 단순한 탐색 방식에 해당한다. 경우의 수가 무수히 많은 팩터 트리 구성에서 그리드 서치를 적용하는 것을 사실상 불가능에 가깝다. 랜덤 서치는 효율성은 떨어지지만 다른 서치 알고리즘에 비해 bias가 생길 우려가 적다. 또한, 다른 탐색 알고리즘과 비교하였을 때, 랜덤 서치방식이 종종 더 우수한 성과를 보이기도 한다. 뿐만 아니라, 아래에서 설명할 강화학습 기반의 탐색 방식과 달리 탐색 자체의 오버헤드(Overhead)가 거의 없기 때문에 빠른 탐색이 가능하다.

랜덤 서치 방식은 공간을 비효율적으로 탐색한다는 한계를 갖는다. 100개가 넘는 재무데이터와 연산자의 조합으로 만들어지는 팩트 트리의 경우에 수는 무수히 많다. 넓은 공간을 효과적으로 탐색하기 위해서는 랜덤 서치가 아닌 다른 방법이 필요하고, Bayesian Optimization 등 여러가지 방법을 사용할 수 있다. 최근 두각을 나 타내고 있는 분야인 딥러닝, 그 중에서도 강화학습을 이용한 방법론을 적용하였고, 그 중 Prajit et al(2017)을 기반으로 팩터 서칭에 적합하도록 변형 및 개선하였다.

[ 그림 04. 서치 알고리즘의 네트워크 구조 ]

4. PortfolioMethodology

PortfolioMethodology는 선택된 재료를 어떤 방식으로 조리할지 결정한다. 똑같은 재료를 사용하더라도 조리방식에 따라 전혀 다른 결과가 만들어지기도 한다. PortfolioMethodology는 포트폴리오 구성에 필요한 다양한 요소(리밸런싱 주기, 포트폴리오 구성 기준치(ex, Expression Tree의 평가값이 NYSE 상위 25% 이상), 최소 구성종목 수, 시계열 길이 제한, 섹터 중립화 적용 여부 등)를 설정하는 기능을 수행한다.

5. MetricFn

새롭게 만들어진 요리는 음식의 맛, 플레이팅, 재료의 조화, 시장성, 레스토랑에 이미 존재하는 다른 메뉴와의 조화 등 다양한 관점에서 평가될 수 있다. MetricFn은 바로 이러한 평가 과정에 해당한다. 팩터 팩토리는 다양한 관점(Regression Alpha, RankIC, Shape, Sortino, MDD 등)에서 탐색된 팩터를 평가하는 evaluation 과정을 포함한다.

결과

팩터 팩토리를 통해 탐색한 포트폴리오의 복잡도는 depth 지표를 통해 확인할 수 있다. depth는 팩터 트리의 깊이를 의미하는 것으로 팩터 트리를 구성하는 NormalizerNode, OperatorNode, DataNode의 수와 결합 방식에 의해 결정된다. 일반적으로 depth가 높을수록 복잡도는 증가한다. 아래의 그림은 depth 3에 해당하는 비교적 단순한 Factor Tree(A)부터 depth 7에 해당하는 복잡한 팩터 트리©의 트리 구조를 시각화한 자료이다.

팩터 팩토리의 Expression Tree는 해석이 매우 어렵다는 것이 특징이다. 그러나, 한 가지 흥미로운 점은 팩터 팩토리가 귀납적으로 찾은 이상현상 중 일부는 선행 연구를 통해 밝혀진 결과와 일치한다는 것이다. Factor A는 모멘텀 계열의 포트폴리오로 과거 12개월 수익률에서 최근 6개월 수익률을 뺀 값이 큰 종목을 포트폴리오에 편입하는 방식으로 과거 좋은 성과를 보인 이상현상이다. 즉, 7~12개월 수익률이 최근 6개월 수익률을 보다 모멘텀 효과에 더 큰 기여를 한다는 것을 의미하는데, 이는 R. Novy-Marx(2012)의 결과와 유사하다.

[ 그림 05. Depth에 따른 팩터 트리의 구조 ]

아래의 그림은 팩터 팩토리에서 탐색한 시장 이상현상 중 일부(F 팩터, G 팩터)의 트리 구조를 시각화한 자료이다.

[ 그림 06. 팩터 F와 팩터 G의 트리 구조 ]

아래의 표는 팩터 F와 팩터 G의 학습/테스트 기간 성과에 대한 기초 통계량을 나타낸 것이다. 전체 기간은 학습 기간(1992.01~2015.04)과 테스트 기간(2015.05 ~ 2020.04)로 분리하여 분석을 수행하였다. 팩터 F와 팩터 G는 학습 기간과 테스트 기간에서 모두 벤치마크 대비 우수한 성과를 거뒀다. 위험 대비 수익을 측정하는 Sharpe 지수가 큰 폭으로 증가하였으며 위험 지표인 MDD 또한 크게 개선되었다.

[ 표 01. 팩터 F와 팩터 G 포트폴리오 수익률 기초 통계량 ]
[ 그림 07. 팩터 포트폴리오 누적 성과 비교. 팩터 F(위), 팩터 G(아래) ]

결론

팩터 팩토리의 귀납적 팩터 서칭 방식은 기존의 연역적 사고방식으로는 찾기 어려운 다양한 시장이상현상을 발견할 수 있다. 또한 탐색의 속도도 주목할 만한데, 단순히 개인용 컴퓨터를 이용하여도 하루에 수 백개의 유의한 시장이상현상을 탐색할 수 있다. 이처럼 팩터 팩토리는 실제로 이용 가능하며 강건한 알파를 만들어 냄으로써, 자동화된 팩터 탐색의 가능성을 보여주고 있다.

최근 학계에서 이뤄지는 새로운 팩터에 관한 연구는 연역적으로 진행된다. 대표적으로 Hou(2014)는 general equilibrium model을 기반으로 경제적 함의를 갖는 새로운 팩터모형, Q-팩터를 제안하였다. 현재 가장 널리 알려진 팩터 모델인 Fama-French(1993) 3-팩터 모형이 시장이상현상(기업규모, 장부가 시장가 비율)을 기반으로 하는 것과는 대조적인 모습이다. 현재까지 팩터 팩토리는 그 이름과는 달리 시장이상현상을 탐색하고 있다. 시장이상현상에 기반하여 팩터를 탐색하는 방법론은 여전히 유효하다고 판단된다. 팩터 팩토리가 찾은 수많은 이상현상은 팩터 팩토리의 이름에 걸맞는 새로운 팩터 탐색에 대한 가능성을 제시한다.

반면, 현재의 팩터 팩토리가 가지는 있는 한계점도 존재한다. 첫번째는 낮은 설명력이다. 도출된 팩터 트리가 경제학적으로 어떤 의미를 가지는지는, 사용자가 직접 해석을 해야만 파악 가능하다. 하지만 무작위로 구성된 팩터 계산식을 경제학적으로 해석한다는 것은 쉽지 않은 일이다. 실험과정과 테스트 과정을 철저하게 분리하고, 해당 팩터가 유의한지 통계적으로 철저히 검증하지만, 경제학적인 담의를 담지 못하는 점은 팩터 팩토리의 명확한 한계이다. 두번째로는 산출된 팩터 간의 관계까지는 고려하고 있지 않다는 것이다. 강화학습이 귀납적 방식으로 팩터 트리를 탐색한다는 점을 고려하면, 이미 발견된 팩터 계산식 쪽으로 피팅 되거나, 해당 팩터 트리의 서브 트리(Sub-Tree)를 계속하여 재활용할 가능성이 크다. 이는 각 팩터 간의 상관계수를 높이며, 결과적으로 동일한 비체계적 위험을 공유하게 된다.

팩터 팩토리는 현재 초기 단계의 프로젝트로, 아직 발전할 수 있는 부분이 많다. 따라서 위의 한계점을 극복하고 발전시켜 나간다면, 금융 전반에 숨어 있는 수많은 팩터들을 수면 위로 끌어 올릴 수 있을 것이다.

Check out the latest Factor Factory Series

01. 팩터 팩토리: 시장 이상현상 및 팩터 탐색 프레임워크

02. Anomaly Report

— — — — — — — — — — — — — — — — — —

We are hiring!

Factor Factory에 흥미를 느끼셨나요? 저희도 Qraft Technologies와 AXE(Factor Factory)팀은 이 글을 읽고 계신 열정적인 여러분들과 함께할 여정을 기대하고 있습니다.!

Join now!

Qraft Technologies

Link:https://www.notion.so/axxe/Quant-Researcher-Factor-Factory-da418de382fa48dea04c48cecdbd6a0f

Email: seongmin.kim@qraftec.com

--

--