HuggingGPT:Microsoft 的 Jarvis 來了?Hugging Face 結合 ChatGPT 攜手打造 AI 模型王國!
什麼是 HuggingGPT ?
在介紹這個強大黑科技之前,你必須先暸解為什麼它叫做 HuggingGPT ?其實,這是因為它建立在 Hugging Face 這個極受歡迎的開源 AI 模型社群之上。這個龐大的 AI 模型王國平台,上面集成了全球各地大神做出的預訓練模型。
而 HuggingGPT 的工作則是將這些模型組合起來,形成一個強大的協作系統,僅需透過日常的自然語言告訴它你的需求,它就會幫你完成,讓你的需求在瞬間被實現!
現在,你可能已經對 HuggingGPT 的運算邏輯感到好奇了。
讓我們來瞧瞧它是如何運作的吧!
HuggingGPT 的運算邏輯
HuggingGPT 的運作主要分為四個步驟:任務規劃、模型選擇、執行任務和生成。
首先會將你的需求分解成多個子任務,然後根據 Hugging Face 中的模型描述將這些子任務分配給專家模型。接著,專家模型會執行這些任務,並將結果記錄到 LLM 中。
最後, LLM 會總結執行過程和推理結果,並將摘要返回給你。從初期規劃到後期執行,所有動作一氣呵成,就是這麼簡單!
假設今天輸入的需求為 “一篇環保文章“ 呢?
Step 1|任務規劃
HuggingGPT 首先會依據用戶需求,將大任務拆分成幾個子任務。
它會將之分成搜尋資料、寫大綱和產生正文等子任務。此外,HuggingGPT 也會確保各子任務的執行順序。在這裡,利用 ChatGPT 協助 HuggingGPT 確定子任務的依賴關係和順序。
Step 2|模型選擇
第一步完成任務規劃後,HuggingGPT 會在 Hugging Face 社區挑選適合的專家模型來執行子任務。
例如:可能選擇一個擅長搜尋資料的模型,和一個能產生有組織文章內容的模型。在這裡,ChatGPT 幫助 HuggingGPT 根據專家模型的特點和能力,為各子任務挑選最適合的模型。
Step 3|執行子任務
第二部選好模型後,HuggingGPT 會將子任務分配給專家模型進行執行。這些模型會在推理端點上完成子任務。
例如:資料搜尋模型會搜集環保資訊,文章生成模型則會根據搜集到的資料寫大綱和內容。在這裡,LLM 確保專家模型根據用戶需求和模型特點,順利地執行子任務。
Step 4|生成最終產品
當專家模型完成所有子任務後,HuggingGPT 會整合各子任務的成果,生成最終產品。
在這個案例中,將整合搜集到的環保資料、撰寫好的大綱和生成的文章正文,形成一篇完整的環保文章。在此過程中,LLM 協助 HuggingGPT 對子任務成果進行進一步優化和調整,確保最後生成的文章內容通順、有條理並符合用戶需求。
HuggingGPT 研究論文
研究者在論文中提到,假設你想要生成一個女孩正在看書的圖片,並且讓她的姿勢與 image-1 中的男孩相同,還想用你的聲音描述新圖片。這樣的複雜需求,對 HuggingGPT 來說,可以說是 piece of cake !
下圖可見這個請求被拆解為 6 個子任務,並分別選定模型執行,最終得到你想要的結果。
HuggingGPT 能夠生成音樂和翻譯文本,甚至能夠將 MP3 文件轉換成文字,雖然它偶爾還是會犯錯,整體來看可以說是瑕不掩瑜。畢竟,沒有人是完美的,對吧?可以肯定的是 HuggingGPT 的出現,無疑是讓現今科技的人工智慧又邁向 AGI 前進了一大步!
如何使用 HuggingGPT ?
作為一個強大的協作系統,將 ChatGPT 和 Hugging Face 緊密連接,可以完成多模態複雜任務,包括文本分類、目標檢測、語意分割、圖像生成、問答、文本到語音、文本到影像等24個任務。想要體驗到它的強大之處,趕緊前往 HuggingGPT 的試試它的神奇功能吧!
HuggingGPT 的出現無疑為 AI 發展帶來了極大的助力,讓人們可以更輕鬆地利用 AI 技術,解決實際問題。隨著 HuggingGPT 在 Hugging Face 上集成的模型越來越多,它的性能也將不斷提升,讓我們期待著它在未來帶來更多的驚喜!
參考資訊:本文部分資訊由 AI 整理為參考所撰寫之報導。
想瞭解更多科技行銷相關消息嗎?快追蹤我們吧!
Hello , 我是Jemmy , 一位踩過各式幣圈坑的老韭菜。
面對市場每天接踵而來的新項目,我們能做的除了【恐懼】,更需要去【暸解】,再乖乖【認錯】交由市場打臉。
接下來每個月將透過我個人的角度,分析幣圈大小事,
帶著大家更深入的方式探討幣圈各項發展。