semaphore提示您:看後求收藏(八零中文www.80zw.tw),接著再看更方便。

23 檢索增強生成技術

rag(retrieval-augnted neration)技術是一種結合了資訊檢索(retrieval)和文字生

成(neration)的自然語言處理(nlp)方法。核心思想是將傳統的檢索技術與現代的自然語言

生成技術相結合,以提高文字生成的準確性和相關性。它旨在透過從外部知識庫中檢索相關資訊來

輔助大型語言模型(如 gpt 系列)生成更準確、可靠的回答。

在 rag 技術中,整個過程主要分為三個步驟如圖 22 所示:索引( dexg)、檢索

(retrieval)和生成(neration)。首先,索引步驟是將大量的文件或資料集合進行預處理,將

其分割成較小的塊(chunk)並進行編碼,然後儲存在向量資料庫中。這個過程的關鍵在於將非結

構化的文字資料轉化為結構化的向量表示,以便於後續的檢索和生成步驟。接下來是檢索步驟,它

根據輸入的查詢或問題,從向量資料庫中檢索出與查詢最相關的前 k 個 chunk。這一步依賴於高效

的語義相似度計算方法,以確保檢索到的 chunk 與查詢具有高度的相關性。最後是生成步驟,它將

原始查詢和檢索到的 chunk 一起輸入到預訓練的 transforr 模型(如 gpt 或 bert)中,生成最

終的答案或文字。這個模型結合了原始查詢的語義資訊和檢索到的相關上下文,以生成準確、連貫

且相關的文字。

rag 的概念和初步實現是由 douwe kie、patrick lewis 和 ethan perez 等人在 2020 年首次

提出的。他們在論文《retrieval-augnted neration for knowled-tensive nlp tasks》

中詳細介紹了 rag 的原理和應用,隨後谷歌等搜尋引擎公司已經開始探索如何將 rag 技術應用到搜

索結果的生成中,以提高搜尋結果的準確性和相關性。在醫療領域,rag 技術可以幫助醫生快速檢

索醫學知識,生成準確的診斷建議和治療方案。

24 文字相似度計算

文字相似度計算是自然語言處理(nlp)領域的一個重要研究方向,它旨在衡量兩個或多個文

本之間的相似程度。文字相似度計算的原理基於兩個主要概念:共性和差異。共性指的是兩個文字

之間共同擁有的資訊或特徵,而差異則是指它們之間的不同之處。當兩個文字的共性越大、差異越

小,它們之間的相似度就越高。

文字相似度計算可以根據不同的分類標準進行分類。首先基於統計的方法分類,這種方法主要

關注文字中詞語的出現頻率和分佈,透過統計資訊來計算文字之間的相似度。常見的基於統計的方

法有餘弦相似度、jaard 相似度等。其次是基於語義的方法分類,這種方法試圖理解文字的含義

和上下文,透過比較文字的語義資訊來計算相似度。常見的基於語義的方法有基於詞向量的方法

(如 word2vec、glove 等)和基於主題模型的方法(如 lda、plsa 等)。最後是基於機器學習的方

法分類,這種方法利用機器學習演算法來訓練模型,透過模型來預測文字之間的相似度。常見的基於

機器學習的方法有支援向量機(

其他小說推薦閱讀 More+
扮演男二後,反派每天都想貼貼

扮演男二後,反派每天都想貼貼

音景聽然
關於扮演男二後,反派每天都想貼貼: 瘋批綠茶反派攻×清冷釣系受沈硯卿兢兢業業幹了那麼多年準備收工的時候,突然系統故障,他的積分消失了。再次開啟直播,他的積分乾脆也不攢了。與其最後積分消失,還不如現在享受!888:“宿主別傷心,深情男配的事業起碼是一帆風順的!”然後世界的主角攻就以為主角受喜歡沈硯卿,一直在打壓沈硯卿的公司。888:“深情男配起碼沒有感情上的痛苦。”然後沈硯卿就變成了被主角受退婚的
其他 連載 109萬字
影視諸天:開局相親女主角

影視諸天:開局相親女主角

臭小彬彬
其他 連載 246萬字
苦哈哈,穿成六十年代的團寵

苦哈哈,穿成六十年代的團寵

夜晚也會有光
關於苦哈哈,穿成六十年代的團寵: (穿越+年代文+團寵+空間+人間清醒)姜姜,本是2024年的一個打工人兒,每天上著朝九晚五的班,週末還雙休。聽著很好的工作,就是不知道為什麼,工資攢不下。姜姜自己買了個50多平的房子,付了一些首付,就是每個月還要換銀行貸款。她感覺她每天都很累,一天不工作都不行。這天姜姜剛加完班回到家,累的實在不行簡單洗漱下就睡著了,想著明天週六週日就放假了,終於可以睡個自然醒了
其他 連載 162萬字
和離後,搬空半個京城去流放

和離後,搬空半個京城去流放

九月婧
關於和離後,搬空半個京城去流放: 長信侯府嫡女夏星兒,奉母命嫁給大將軍之子赫連致,大婚當日邊關傳來戰報,南夷來犯,赫連致奉命帶兵增援,一走就是三年,夏星兒在家上孝敬公婆,下友愛弟妹,等來的不是一生一世一雙人,而是一封和離書和整個長信侯府抄家流放……
其他 連載 146萬字
穿書之替嫁世子妃逆襲了

穿書之替嫁世子妃逆襲了

L慕容雲兒
關於穿書之替嫁世子妃逆襲了: 傅雲汐意外穿書,成為大反派的替嫁新娘,可相處後這大反派並非書中所寫那樣殘暴不仁,恰恰相反的是他風度翩翩,貌比潘安,其家族世代男子皆為保家衛國的戰士,實則是遭狗皇帝陷害才會黑化。傅雲汐前世專注於國家科研,忘我奉獻,從未為自己而活。這一世,她堅信天意,珍惜難得的親情與愛情。傅雲汐為了活下去,努力收集物資,悉心照料反派及其家人,無論面對各種天災人禍她和空間都能輕鬆應對!慕
其他 連載 100萬字