semaphore提示您:看後求收藏(八零中文www.80zw.tw),接著再看更方便。

要偏向於更為全面的文獻資料。生命週期評價的本質是用來評估產品或服務從生產到消費再到廢棄的整個過程對環境和社會的影響,它考慮了資源使用、能源消耗、排放物的產生等方面。那麼為了提高最後基於電力LcA這個領域搭建的專業模型的準確度,對文獻進行精細篩選,選取同時包括流程圖,資料,各單元過程投入產出詳細資料,資料時間地點落去方法,技術細節的文獻,作為最終的資料。將精細篩選後的論文資料,結合unstructed庫進行資料處理。進行資訊精細化拆解與清洗,使以pdf形式儲存的文獻資料透過分割,分割槽,變成便於嵌入模型的結構化資料。對文字進行篩選與清理,影象的內容進行識別,儲存影象的解釋資訊,表格轉化為htmL格式。最後統一變成標題加內容的格式。在這裡我列舉了簡單的資料處理流程。首先是對資料進行分割。隨後是對文字進行拆分,識別內容是否為文字,如果是,就填進text_list。將表格轉化為htmL格式,將圖片變為圖片解釋資訊。第二部分是知識庫的構建。向量知識庫,能將各類資料(如文字、影象、音訊等)轉化為向量形式進行儲存。資料之間的相似性和關聯性得以量化,不像平時你儲存你的,我儲存我的,向量資料庫給予了一個統一的標準。也正是因為統一了格式,利用相似度對比,檢索更加高效。構建知識庫的流程首先是提取分割文字進行向量化的操作。向量化的本質是將離散的符號資訊,如詞或句子,對映到連續的向量空間中,以便計算機能夠處理。向量化將高維資料轉化為低維資料,保留了資料的關鍵特徵又降低了資料的複雜度。選擇pipecone儲存向量資料,它支援查詢,插入,刪除等一些列操作。選擇weaviate作為向量搜尋引擎,可以透過主題的分類檢索,進行語義搜尋、問答提取等等功能。第三部分是chatbot的構建。先前已經構建好了針對電力LcA領域的專業大模型,但是缺少檢驗模型的手段,即缺少模型最佳化環節,本專案設定透過chatbot模式,透過與使用者進行問答的形式,檢驗模型是否能呼叫電力行業LcA領域向量資料庫回答該領域專業性問題和時效性問題的有效性。chatbot是模擬人類對話的一種形式,就我們平時能使到的chatgpt就是以chatbot的形式來呈現的,而chatbot在這裡的功能實現主要是為了體現檢索功能,大致可分為知識庫檢索功能和線上搜尋。那麼就產生了三種檢索模式。

僅基於大語言模型,連線知識庫搜尋,和線上搜尋。前端部分我採用streamlit來完成,UI設計如圖所示。這邊是功能按鈕,中間是對話方塊。先前有講到了,我們來檢測針對專業領域的大模型的標準就是檢測是否有能力回答專業領域的問題,並針對結果進行最佳化。這裡我向chatbot提出同一個問題。只採用大語言模型,採用知識庫與大語言模型結合,和聯網搜尋與大語言模型結合。三種功能下獲得的回答是完全不同的,後面兩個檢索功能均為大語言模型最佳化了生成回答的準確性,對大語言模型的專業領域知識做了補充和改善。可以看到普通的大語言模型回答的是最簡短的,採用了知識庫的回答,將答案細分,擴充,並新增了新的內容,附上參考文獻。最後的聯網搜尋,將答案分為了幾類,更加全面,但是每類回答點到即止。最後就是向量知識庫進行最佳化。對於準確率低的查詢,分析模型回應錯誤的原因。如果是由於知識庫中缺少相關資訊,可以透過新增更多相關文件和資料來增強向量知識庫的覆蓋範圍。使用者反饋是對輸入的問題和產生的回答進行記錄,方便針對性進行調整。反饋可以直接用於指導向量知識庫的更新和最佳化。不斷地測試來完善我的專業領域大模型。最後一部分是我本次研究的總結。首先建立了一個能被大語言模型直接呼叫的專

其他小說推薦閱讀 More+
扮演男二後,反派每天都想貼貼

扮演男二後,反派每天都想貼貼

音景聽然
關於扮演男二後,反派每天都想貼貼: 瘋批綠茶反派攻×清冷釣系受沈硯卿兢兢業業幹了那麼多年準備收工的時候,突然系統故障,他的積分消失了。再次開啟直播,他的積分乾脆也不攢了。與其最後積分消失,還不如現在享受!888:“宿主別傷心,深情男配的事業起碼是一帆風順的!”然後世界的主角攻就以為主角受喜歡沈硯卿,一直在打壓沈硯卿的公司。888:“深情男配起碼沒有感情上的痛苦。”然後沈硯卿就變成了被主角受退婚的
其他 連載 109萬字
影視諸天:開局相親女主角

影視諸天:開局相親女主角

臭小彬彬
其他 連載 246萬字
苦哈哈,穿成六十年代的團寵

苦哈哈,穿成六十年代的團寵

夜晚也會有光
關於苦哈哈,穿成六十年代的團寵: (穿越+年代文+團寵+空間+人間清醒)姜姜,本是2024年的一個打工人兒,每天上著朝九晚五的班,週末還雙休。聽著很好的工作,就是不知道為什麼,工資攢不下。姜姜自己買了個50多平的房子,付了一些首付,就是每個月還要換銀行貸款。她感覺她每天都很累,一天不工作都不行。這天姜姜剛加完班回到家,累的實在不行簡單洗漱下就睡著了,想著明天週六週日就放假了,終於可以睡個自然醒了
其他 連載 162萬字
和離後,搬空半個京城去流放

和離後,搬空半個京城去流放

九月婧
關於和離後,搬空半個京城去流放: 長信侯府嫡女夏星兒,奉母命嫁給大將軍之子赫連致,大婚當日邊關傳來戰報,南夷來犯,赫連致奉命帶兵增援,一走就是三年,夏星兒在家上孝敬公婆,下友愛弟妹,等來的不是一生一世一雙人,而是一封和離書和整個長信侯府抄家流放……
其他 連載 146萬字
穿書之替嫁世子妃逆襲了

穿書之替嫁世子妃逆襲了

L慕容雲兒
關於穿書之替嫁世子妃逆襲了: 傅雲汐意外穿書,成為大反派的替嫁新娘,可相處後這大反派並非書中所寫那樣殘暴不仁,恰恰相反的是他風度翩翩,貌比潘安,其家族世代男子皆為保家衛國的戰士,實則是遭狗皇帝陷害才會黑化。傅雲汐前世專注於國家科研,忘我奉獻,從未為自己而活。這一世,她堅信天意,珍惜難得的親情與愛情。傅雲汐為了活下去,努力收集物資,悉心照料反派及其家人,無論面對各種天災人禍她和空間都能輕鬆應對!慕
其他 連載 100萬字