PinnedJess Chen不只是單純的向量搜尋(I): 白話介紹RAG(Naive RAG)隨著人工智慧領域的蓬勃發展,各式大型語言模型從過往的研究領域破繭而出,逐漸融入人們的日常生活。百家爭鳴的當下,各家模型仍踏不出一個基於模型先天限制的牢籠:知識的侷限性。Aug 20Aug 20
PinnedJess CheninTowards DevManipulate Google Cloud Platform(GCP) Bigquery with PythonAug 2, 2023Aug 2, 2023
Jess ChenRevolution of AI Thinking: A Quick Review of OpenAI’s Latest Model, “o1”In July, OpenAI subtly teased its upcoming developments through social media, hinting at a project codenamed “Strawberry.” Speculation…2d ago2d ago
Jess Chen不只是單純的向量搜尋(II): 如何讓你的RAG系統更精準(Advanced RAG)在上一篇文章,我們提及了大型語言模型的知識侷限性,以及幻覺和資料安全性對於企業和用戶造成的影響,這些問題都在RAG概念的推出得到一定程度的緩解。然而,單純的RAG架構仍然有所缺陷,大多時候它可能不是那麼精準,召回的文檔並非與用戶所詢問的問題相關,有時又召回太多文檔,導致模型遺忘上…Aug 27Aug 27
Jess CheninTowards Dev[ML Concept] Ensemble Learning (I) — Bagging & Random ForestThis article aims to examine the fundamental concepts of Ensemble Learning, a subset of machine learning methods that have gained…Sep 7, 2023Sep 7, 2023
Jess CheninTowards Dev[ML Concept] Ensemble Learning (II) — Boosting & AdaBoostThis article aims to examine the fundamental concepts of Ensemble Learning, a subset of machine learning methods that have gained…Sep 7, 2023Sep 7, 2023
Jess Chen[ML Basic]Clustering Analysis大多數人對於機器學習的印象都是股票預測、回歸分析或是Youtube演算法等事物,這些問題大多都有一個目標變數用來讓模型學習,股票預測要去學習找出隔天的股價、YT演算法學習用戶對影片的喜愛程度等,可是很多時候資料科學家拿到手上的資料並沒有一個明確的目標變數(ex.交友軟體透過配對系…Apr 25, 2023Apr 25, 2023
Jess Chen[ML Math]Principal Component Analysis 主成分分析在資料科學中有許多降維的方法,簡單如線性回歸的迴歸係數顯著性檢定(coefficient test)到複雜的流形學習(Manifold…Apr 15, 2023Apr 15, 2023
Jess Chen[ML Math] Singular Value Decomposition(SVD) 奇異值分解在線性代數中有許多不同的分解定理(Decomposition Theorem),其中多少都對欲分解的矩陣有所限制,例如 LU Decomposition 需對方陣(Square Matrix)進行分解、QR Decomposition…Apr 1, 2023Apr 1, 2023