> 感覺思路跟 [[Agentic Workflow]] 反思搜尋寫文有點像
> 主要差異是 FLARE 是用 logprobs 來判斷信心
> 跟 [[Self-Ask prompting]] 也類似
* https://twitter.com/clusteredbytes/status/1737605003320111342
* https://amatriain.net/blog/prompt201#flare
* llamaindex flare_query_engine
* https://docs.llamaindex.ai/en/stable/examples/query_engine/flare_query_engine.html
* https://ai.gopubby.com/benchmarking-rag-pipelines-with-a-evaluation-pack-in-forward-looking-active-retrieval-augmented-a8bd057c856b
- paper
- https://arxiv.org/abs/2305.06983
- https://github.com/jzbjyb/FLARE/tree/main 有實作 code
- 配合一個 retriever
- 多次迭代內容,中間不清楚的地方在用 retriever 找資料再改寫
* https://amatriain.net/blog/prompt201 提及
* FLARE 是一種先進的 RAG 方法,系統不會僅檢索一次資訊然後生成,而是反覆使用對即將出現的句子的預測作為查詢,以檢索相關文件,以便在信心不足時重新生成句子。以下來自論文的圖表清楚地說明了這種方法。
* 請注意,作者透過為生成句子的每個符號設定機率閾值來衡量信心。然而,其他信心測量方法可能是可行的。