|
RAG,Agent 和 workflow 區(qū)別AI 中的 RAG(Retrieval-Augmented Generation)、Agent 和 Workflow 是三種不同的概念,它們分別解決不同的問題,常在構(gòu)建智能系統(tǒng)時協(xié)同使用。 三者主要區(qū)別 以下是它們的定義、區(qū)別及應(yīng)用場景: 一、 RAG(Retrieval-Augmented Generation) RAG技術(shù)(Retrieval Augmented Generation,檢索增強生成)是一種結(jié)合了信息檢索技術(shù)與語言生成模型的人工智能技術(shù),旨在通過從外部知識庫中檢索相關(guān)信息,并將其作為提示輸入給大型語言模型(LLMs),以增強模型處理知識密集型任務(wù)的能力。 RAG技術(shù)主要包括三個核心部分:檢索(Retrieval)、增強(Augmentation)和生成(Generation)。 1、檢索 從預(yù)先建立的知識庫中檢索與用戶查詢相關(guān)的信息。這一步驟的目的是為后續(xù)的生成過程提供有用的上下文信息和知識支撐。檢索模塊通常依賴于向量檢索技術(shù),如倒排索引、BM25算法或基于深度學(xué)習(xí)的Dense Passage Retrieval(DPR)。 2、增強 將檢索到的信息用作生成模型(即大語言模型)的上下文輸入,以增強模型對特定問題的理解和回答能力。這一步的目的是將外部知識融入生成過程中,使生成的文本內(nèi)容更加豐富、準確和符合用戶需求。 3、生成 結(jié)合LLM生成符合用戶需求的回答。生成器會利用檢索到的信息作為上下文輸入,并結(jié)合大語言模型來生成文本內(nèi)容,最終輸出準確、有用的回答。 一個典型的 RAG 案例如圖所示。如果我們向 ChatGPT 詢問 OpenAI CEO Sam Atlman 在短短幾天內(nèi)突然解雇隨后又被復(fù)職的事情。由于受到預(yù)訓(xùn)練數(shù)據(jù)的限制,缺乏對最近事件的知識,ChatGPT 則表示無法回答。RAG 則通過從外部知識庫檢索最新的文檔摘錄來解決這一差距。在這個例子中,它獲取了一系列與詢問相關(guān)的新聞文章。這些文章,連同最初的問題,隨后被合并成一個豐富的提示,使 ChatGPT 能夠綜合出一個有根據(jù)的回應(yīng)。
圖1 RAG 技術(shù)在 QA 問題中的案例 RAG 技術(shù)范式發(fā)展 RAG 的概念首次于 2020 年被提出,隨后進入高速發(fā)展。RAG 技術(shù)的演進歷程如圖所示,相關(guān)研究進展可以明確地劃分為數(shù)個關(guān)鍵階段。在早期的預(yù)訓(xùn)練階段,研究的焦點集中在如何通過預(yù)訓(xùn)練模型注入額外的知識,以此增強語言模型的能力。隨著 ChatGPT 的面世,對于運用大型模型進行深層次上下文學(xué)習(xí)的興趣激增,這推動了 RAG 技術(shù)在研究領(lǐng)域的快速發(fā)展。隨著 LLMs 的潛力被進一步開發(fā),旨在提升模型的可控性并滿足不斷演變的需求,RAG 的研究逐漸聚焦于增強推理能力,并且也探索了在微調(diào)過程中的各種改進方法。特別是隨著 GPT-4 的發(fā)布,RAG 技術(shù)經(jīng)歷了一次深刻的變革。研究重點開始轉(zhuǎn)移至一種新的融合 RAG 和微調(diào)策略的方法,并且持續(xù)關(guān)注對預(yù)訓(xùn)練方法的優(yōu)化。
圖2 RAG 技術(shù)發(fā)展的科技樹 RAG 的生態(tài) RAG 的應(yīng)用已經(jīng)不僅僅局限于問答系統(tǒng),其影響力正在擴展到更多領(lǐng)域�,F(xiàn)在,推薦系統(tǒng)、信息抽取和報告生成等多種任務(wù)都開始受益于 RAG 技術(shù)的應(yīng)用。與此同時,RAG 技術(shù)棧也在井噴。除了已知的 Langchain 和 LlamaIndex 等工具,市場上涌現(xiàn)出更多針對性的 RAG 工具,例如:用途定制化,滿足更加聚焦場景的需求;使用簡易化,進一步降低上手門檻的;功能專業(yè)化,逐漸面向生產(chǎn)環(huán)境。
圖3 RAG 的生態(tài)系統(tǒng)概覽 二、 Agent AI Agent 是一種能夠基于任務(wù)目標執(zhí)行多步驟動作的系統(tǒng),它能通過調(diào)用工具、API 或知識庫,動態(tài)規(guī)劃并完成復(fù)雜任務(wù)。Agent 具備一定程度的自主決策能力。
圖4 LLM-based Agent的概念框架 AI 智能體,嚴格意義上說更應(yīng)該是一個具備智能的系統(tǒng),能夠理解復(fù)雜任務(wù),利用LLM的規(guī)劃能力將其拆解為子任務(wù),并利用LLM的知識和工具調(diào)用能力來完成任務(wù)。 在這個系統(tǒng)中,LLM充當(dāng)大腦的角色,負責(zé)統(tǒng)籌全局,進行決策處理,自動協(xié)調(diào)系統(tǒng)內(nèi)的各個組件。 AI Agent的主要特點包括: 1. 自主性:AI Agent能夠在沒有外部干預(yù)的情況下,根據(jù)其內(nèi)部目標和規(guī)則進行決策和行動。 2. 感知能力:AI Agent可以通過各種傳感器或數(shù)據(jù)接口獲取環(huán)境信息,并處理這些信息以進行決策。 3. 學(xué)習(xí)能力:AI Agent可以根據(jù)經(jīng)驗和數(shù)據(jù)進行學(xué)習(xí),從而改進其決策和行動策略,提高任務(wù)完成的效率和準確性。 4. 適應(yīng)性:AI Agent可以根據(jù)環(huán)境變化調(diào)整其行為,以應(yīng)對不同的情況和挑戰(zhàn)。 哪些場景需要智能體? 在面對需要多種能力才能完成的任務(wù),且需要借助LLM強大的推理決策能力時,就需要智能體了,基于LLM來決策使用各種內(nèi)置能力,或是設(shè)置多個智能體,通過相互協(xié)作,最終來完成用戶任務(wù)。 智能體在多個場景中都有廣泛應(yīng)用,主要包括以下幾個方面: 1、客戶服務(wù):智能體可以通過自然語言處理和機器學(xué)習(xí)技術(shù),自動回答客戶的咨詢問題、處理訂單問題和退貨請求,提高客戶服務(wù)的效率,減少用戶的等待時間。 2、物流和供應(yīng)鏈管理:在物流領(lǐng)域,智能體可以優(yōu)化庫存管理、路線規(guī)劃和調(diào)度,提高物流效率。例如,自主庫存跟蹤智能體可以通過監(jiān)控市場趨勢和需求模式來預(yù)測庫存水平,防止缺貨情況;送貨車隊的路線優(yōu)化智能體可以根據(jù)天氣、交通和燃油效率來分配送貨路線。 3、醫(yī)療保健:智能體可以用于自主預(yù)約安排和患者管理,提高醫(yī)療保健工作流程的效率。例如,AI驅(qū)動的日程安排助手可以根據(jù)患者可用性、臨床醫(yī)生的日程安排和診所資源自動預(yù)約,確�;颊咦o理的連續(xù)性。 4、金融:在金融領(lǐng)域,智能體可以用于欺詐檢測和自主交易系統(tǒng)。欺詐檢測智能體可以識別可疑交易,防止欺詐活動;自主交易系統(tǒng)可以在高頻交易中快速分析市場并執(zhí)行交易,降低風(fēng)險。 5、電商:智能體在電商領(lǐng)域的應(yīng)用包括個性化推薦系統(tǒng)、智能客服與支持、語音助手與購物體驗以及內(nèi)容生成與營銷。個性化推薦系統(tǒng)可以根據(jù)用戶的購物歷史和偏好提供精準推薦,提高用戶滿意度和銷售額;智能客服可以自動回答用戶咨詢,處理訂單問題;語音助手可以讓用戶通過語音命令購物,提升購物便捷性;內(nèi)容生成與營銷可以幫助企業(yè)生成吸引人的產(chǎn)品描述和營銷文案。 6、研發(fā):在研發(fā)領(lǐng)域,智能體可以提供代碼預(yù)測續(xù)寫、注釋生成代碼、智能代碼評審等功能,顯著提升研發(fā)效率。 7、協(xié)同辦公:智能體可以實現(xiàn)消息、會議、文檔和郵件的智能化管理,提升辦公效率。 三、 Workflow Workflow是一組有序的步驟,用于執(zhí)行某個固定任務(wù),通常是預(yù)先定義的,適合高度結(jié)構(gòu)化的流程。Workflow的核心特點在于每個步驟都有明確的順序和依賴關(guān)系,確保任務(wù)能夠按照既定的規(guī)則和順序高效執(zhí)行。應(yīng)用場景包括文檔審批流程、數(shù)據(jù)管道處理等。優(yōu)點于執(zhí)行結(jié)果通常是可預(yù)測和一致的,適合處理結(jié)構(gòu)化、重復(fù)性任務(wù)。
圖5 工作流程示意圖 Workflow的特點包括: 固定性:流程步驟固定且明確,適合標準化、重復(fù)性高的任務(wù)。 穩(wěn)定性:執(zhí)行過程穩(wěn)定可靠,易于監(jiān)控和管理。 模塊化:各組件功能獨立,便于添加新工具或能力。 Workflow引擎是其核心組成部分,負責(zé)解釋、執(zhí)行和管理整個工作流的運行。 應(yīng)用場景有: 文檔審批流程:如合同從起草到簽署的固定步驟 數(shù)據(jù)管道處理:如從數(shù)據(jù)采集到清洗、分析的自動化流程 持續(xù)集成/部署:如軟件開發(fā)中自動化構(gòu)建、測試、部署 |






