x提示工程是一個(gè)新興的領(lǐng)域,專注于開發(fā)、設(shè)計(jì)和優(yōu)化提示,以增強(qiáng) LLM 的輸出,從而滿足您的需求。它為您提供了一種引導(dǎo)模型的行為從而達(dá)到您想要實(shí)現(xiàn)的結(jié)果的方法。
提示工程與微調(diào)不同。在微調(diào)中,使用訓(xùn)練數(shù)據(jù)調(diào)整權(quán)重或參數(shù),目標(biāo)是優(yōu)化成本函數(shù)。就計(jì)算時(shí)間和實(shí)際成本而言,微調(diào)可能是一個(gè)昂貴的過程。然而,提示工程試圖引導(dǎo)經(jīng)過訓(xùn)練的 FM、LLM 或文本到圖像模型給出更相關(guān)、更準(zhǔn)確的答案。
提示工程是充分發(fā)揮大語言模型的強(qiáng)大能力的最快方法。通過利用一系列問題、語句或指令與 LLM 交互,您可以根據(jù)您希望實(shí)現(xiàn)的輸出的特定上下文來調(diào)整 LLM 輸出行為。
有效的提示技術(shù)可以助力您的企業(yè)實(shí)現(xiàn)以下益處:
提高模型的能力,增強(qiáng)安全性。
使用領(lǐng)域知識(shí)和外部工具增強(qiáng)模型,而無需更改模型參數(shù)或進(jìn)行微調(diào)。
與語言模型交互以掌握其全部能力。
通過更高質(zhì)量的輸入獲得更高質(zhì)量的輸出。
提示的要素
提示的形式取決于您給模型指定的任務(wù)。當(dāng)您探索提示工程示例時(shí),您會(huì)注意到提示包含以下部分或全部要素:
?指令:這是大語言模型要執(zhí)行的任務(wù)。它提供模型應(yīng)如何執(zhí)行任務(wù)的描述或說明。
?上下文:這是用于引導(dǎo)模型的外部信息。
輸入數(shù)據(jù):這是需要響應(yīng)的輸入
輸出指示:這是輸出類型或格式
評(píng)估模型的響應(yīng)
務(wù)必檢查模型的響應(yīng),以確保提示產(chǎn)生適當(dāng)質(zhì)量、類型和范圍的響應(yīng)。根據(jù)需要更改提示。您甚至可以要求模型的一個(gè)副本改進(jìn)或檢查模型的另一個(gè)副本的輸出。
通過反復(fù)嘗試,您將提升您撰寫和優(yōu)化提示的直覺,從而最好地適應(yīng)您的需求和模型。提示工程是一種可通過實(shí)踐不斷提高的迭代技能。
零樣本提示是這樣一種提示技術(shù):用戶向 LLM 提出任務(wù),而不給模型提供進(jìn)一步示例。在這種技術(shù)中,用戶期望模型在沒有事先理解或嘗試任務(wù)的情況下執(zhí)行任務(wù)?,F(xiàn)代 LLM 表現(xiàn)出卓越的零樣本能力。
使用零樣本提示技術(shù)的技巧包括:
?LLM 越大,零樣本提示產(chǎn)生有效結(jié)果的可能性就越大。
?指令調(diào)整可以改進(jìn)零樣本學(xué)習(xí)。您可以采用基于人類反饋的強(qiáng)化學(xué)習(xí) (RLHF, reinforcement learning from human feedback) 來擴(kuò)展指令調(diào)整,使現(xiàn)代 LLM 更好地適應(yīng)人類偏好。
小樣本提示是這樣一種提示技術(shù):您為模型提供有關(guān)所請(qǐng)求執(zhí)行的任務(wù)的上下文信息。在這種技術(shù)中,您同時(shí)提供任務(wù)和所需輸出的示例。在提示條件中提供此上下文或少量樣本,可以使模型嚴(yán)格遵循任務(wù)指導(dǎo)。
小樣本提示中的標(biāo)簽不必正確即可提高模型性能。通常,應(yīng)用隨機(jī)標(biāo)簽比完全不使用標(biāo)簽要好。然而,演示指定的標(biāo)簽空間和輸入文本的分布很重要。此上下文中使用的“標(biāo)簽”一詞是指提示示例的輸出。“提示示例”中的語句所表達(dá)的情緒是標(biāo)簽的示例。
如果您有大量示例可以利用,請(qǐng)使用技術(shù)來遵守模型的標(biāo)記限制并動(dòng)態(tài)填充提示模板。您可以使用基于語義相似度的示例選擇器來提供幫助。
思維鏈 (CoT, chain-of-thought) 提示通過中間推理步驟分解復(fù)雜的推理任務(wù)。您可以將零樣本提示技術(shù)和小樣本提示技術(shù)與 CoT 提示結(jié)合使用。 思維鏈提示特定于問題類型。您可以使用短語“一步一步地思考”在機(jī)器學(xué)習(xí)模型中調(diào)用 CoT 推理。
基本提示技術(shù)并不總是能提供您的特定業(yè)務(wù)任務(wù)所需的結(jié)果。本節(jié)課將向您介紹多種高級(jí)技術(shù)。您將學(xué)習(xí)每種高級(jí)技術(shù)的運(yùn)作方式,您還將進(jìn)一步了解哪種使用案例最適合每種策略。
自洽性是一種類似于思維鏈提示的提示技術(shù)。然而,自洽性技術(shù)不采取明顯的一步一步路徑或貪婪路徑,而是提示模型對(duì)各種推理路徑進(jìn)行采樣。然后,模型根據(jù)來自各個(gè)路徑的多個(gè)數(shù)據(jù)點(diǎn)聚合最終答案。根據(jù) Xuezhi Wang 等人撰寫的文章“利用自洽性提高語言模型中的思維鏈推理效果”(Self-Consistency Improves Chain of Thought Reasoning in Language Models),當(dāng)用于一系列常見算術(shù)和常識(shí)推理基準(zhǔn)時(shí),自洽性可以改進(jìn) CoT 推理提示。