俄羅斯套娃(Matryoshka)嵌入模型簡介: https://ihower.tw/blog/archives/12016 用處: 提升 vector database 相似性搜尋速度 paper: https://arxiv.org/abs/2205.13147 https://twitter.com/jerryjliu0/status/1750907482380316764 2024/1/26 https://twitter.com/LangChainAI/status/1763985261233668607 2024/3/3 這篇解說最完整,還有做檢索實驗 https://supabase.com/blog/matryoshka-embeddings openai 的 embeddings 是 🪆 Matryoshka Representation Learning (MRL)# 因此可以自己砍掉後面維度後正規化,就得到小維度 先用小維度做相似性搜尋,再用大維度再排序過濾挑選