kianaMachine Learning Algorithms for ClassificationNaive Bayesian Classifiers, Logistic Regression, Support Vector Machines, Decision Trees, K-Nearest Neighbors and More..Jun 28, 2019Jun 28, 2019
kianaWord2Vec 으로 단어 임베딩하기 (Word2Vec word embeddings)기존의 빈도 기반 임베딩 방법들은 단어 벡터 간 관계가 없거나 (one-hot encoding) 제한적이었다 (SVD). Word2Vec은 분산된 표상 (distributed representation) 이라는 아이디어에 기반해서, 벡터의…Jun 13, 2019Jun 13, 2019
kianaModeling diffusion models: Collective ActionIn the previous post, I discussed the diffusion of information and herding. There are two methods for modeling the diffusion of…Jun 12, 2019Jun 12, 2019
kiana빈도 기반 텍스트 분석 (Frequency based Text Analysis)문서를 분석하기 위해서는 텍스트를 숫자로 바꿔주는 과정이 필요하다. 이를 가리켜 embedding 혹은 vectorizing 이라고 한다.Jun 12, 2019Jun 12, 2019
kiana정보의 확산(Diffusion)과 군집 행동 (Herding) — Computing herding situations with the Bayes Rule정보는 네트워크를 통해 확산된다. 전염병처럼 노드에서 노드로 옮겨 가는 모습을 cascading behavior, 혹은 diffusion of innovation 이라고 일컫는다. 네트워크를 통해서 정보가 확산되는 예시는 매우 다양하다. 뉴스나…Jun 11, 2019Jun 11, 2019
kiana저자 식별을 위한 간단한 베이지안 분류기 (Basic Naive Bayesian Text Classifier for Author Identification)나이브 베이즈 분류기 (Naive Bayesian Classifier) 는 문서에 등장하는 단어의 수만 고려하면 되어서 계산이 복잡하지 않고 해석이 쉽다. 또 짧은 시간 안에 구현하기 쉬운 모델이다. 부정어를 해석하는 것이 중요하거나 데이터의…Jun 9, 2019Jun 9, 2019