對(duì)于生成式人工智能(GenAI)取代人類工作的潛力,人們一直存在很多恐懼、不確定性和懷疑。大型語言模型(LLM)在提示時(shí)回答問題和處理數(shù)字任務(wù)的能力引起了人們的注意,無論是好是壞。但LLM取代人類員工的可能性有多大?Indeed的一項(xiàng)新研究揭示了這個(gè)問題。
求職網(wǎng)站Indeed最近進(jìn)行了一項(xiàng)測(cè)試,以確定LLM在處理基本工作技能方面的效果。Indeed招聘實(shí)驗(yàn)室注冊(cè)了OpenAI最新的LLM項(xiàng)目GPT-4o,并要求它執(zhí)行Indeed數(shù)據(jù)庫(kù)中追蹤的2800多種工作技能,從賬戶管理和保險(xiǎn)索賠等辦公室工作,到公交車司機(jī)和廚師等偏重體力的工作。
對(duì)于每一項(xiàng)工作技能,Indeed招聘實(shí)驗(yàn)室設(shè)置了一種方法來衡量LLM任務(wù)完成程度。他們?yōu)槊總€(gè)任務(wù)創(chuàng)建了復(fù)雜的1000字提示,這需要大量的試驗(yàn)和錯(cuò)誤。在最終確定最佳提示后,招聘實(shí)驗(yàn)室的工作人員將該提示用GPT-4o運(yùn)行了15次,然后匯總結(jié)果。GPT-4o被要求在每個(gè)提示下評(píng)估自己的能力,最終結(jié)果由人類研究人員驗(yàn)證。
招聘實(shí)驗(yàn)室將實(shí)驗(yàn)重點(diǎn)放在三個(gè)主要領(lǐng)域,包括GenAI提供與該技能相關(guān)的理論知識(shí)的能力;GenAI使用技能解決問題的能力;以及GenAI在使用該技能中的重要性的確定。GPT-4o以五分制分析了自己在給定作業(yè)中利用這些屬性的能力。研究人員將結(jié)果制成表格,并于上周發(fā)表在一篇名為《工作中的人工智能:為什么GenAI更有可能支持員工而不是取代他們》的論文中。
這個(gè)標(biāo)題是對(duì)Indeed在GenAI實(shí)驗(yàn)中一個(gè)很大發(fā)現(xiàn)。該報(bào)告的作者Annina Hering和Arcenis Rojas寫道,在2800項(xiàng)人類工作技能中,沒有一項(xiàng)“很可能”被GPT-4o或任何其他LLM所取代。事實(shí)上,Indeed發(fā)現(xiàn)近69%的技能“不太可能”或“非常不可能”被GenAI取代。
顯然,需要?jiǎng)邮謭?zhí)行或應(yīng)用體力的工作,如公共汽車司機(jī)或急診室護(hù)士,不會(huì)被GenAI取代(自動(dòng)駕駛公共汽車和機(jī)器人輔助手術(shù)正在發(fā)展,但它們也需要更多的技術(shù),而不僅僅是GenAI)。考慮到這份報(bào)告中涉及的一半以上的工作需要某種形式的體力勞動(dòng), GenA I完全取代人類的前景看起來相當(dāng)渺茫。
但這并不是說沒有好處。Hering和Rojas寫道,即使是公交車司機(jī)或護(hù)士這樣的工作,GenAI也可以幫助完成其中重復(fù)性的任務(wù),比如文件編制,這將“讓員工重新專注于這些角色所需的核心技能”。
研究人員得出的結(jié)論是,“隨著GenAI的不斷改進(jìn),如果工作場(chǎng)所和/或工作規(guī)范發(fā)生某些變化”,大約29%的工作崗位“有可能”被GenAI取代。研究人員寫道,GenAI影響最大的工作是“更為刻板的辦公室工作”。
橫跨三個(gè)領(lǐng)域的研究核心——理論知識(shí);解決問題;以及物理工作技能——GenAI最擅長(zhǎng)的是理論知識(shí),其次是解決問題的能力。事實(shí)上,理論知識(shí)是GenAI給自己5分的唯一屬性,這是最高分,這要?dú)w功于LLM對(duì)網(wǎng)絡(luò)上大量信息的廣泛培訓(xùn),以及使用搜索引擎的能力。
GPT-4o在解決問題方面得分也不錯(cuò)。在評(píng)估的70%的技能中,它給自己打了3分,在其中28%的任務(wù)中,它表示自己“有可能”取代人類。它也得到了幾個(gè)45分,并認(rèn)為自己“很可能”取代人類完成3%的任務(wù)。
人工智能最有可能在辦公室工作和主要在計(jì)算機(jī)上完成的工作中取代人類。例如,研究人員得出的結(jié)論是,GenAI“有可能”或“很有可能”取代人類,取代軟件開發(fā)工作崗位上超過71%的常見技能。同樣,報(bào)告稱,在典型的會(huì)計(jì)職業(yè)中,GenAI “有可能”或“有可能”取代人類掌握78%的技能。
在需要解決更多問題而不是理論知識(shí)的工作中,GenAI不太可能取代人類。這是GenAI開發(fā)人員和數(shù)據(jù)科學(xué)家可能希望集中精力的領(lǐng)域。“如果GenAI模型在更多的工作中提高了解決更多技能問題的能力,那么在這些工作中,最終可能被取代的技能比例也會(huì)上升。“
公司可以做一些事情來幫助他們?yōu)镚enAI做準(zhǔn)備。例如,在會(huì)計(jì)領(lǐng)域,對(duì)電子記錄保存和數(shù)字化的投資將大大有助于公司成功使用GenAI。
微調(diào)一個(gè)人與GenAI的互動(dòng)也可以產(chǎn)生更好的結(jié)果。例如,一個(gè)松散的提示符可以被LLM以多種方式解釋,每次被問到它時(shí),它可能會(huì)給出不同的答案。更高級(jí)的任務(wù)將需要更好的快速寫作和快速工程技能,才能最大限度地利用GenAI。
GenAI似乎至少會(huì)取代人類工人現(xiàn)在所做的一些任務(wù),隨著行業(yè)和職位的不同而有很大的變化。然而,Indeed的研究人員并不認(rèn)為GenAI在不久的將來會(huì)大規(guī)模取代人類,原因很簡(jiǎn)單,因?yàn)槟壳暗腉enAI沒有人類就無法運(yùn)作?!凹词笹enAI進(jìn)化并學(xué)會(huì)完成要求苛刻的任務(wù),監(jiān)督、指導(dǎo)和糾正GenAI輸出的人類也不會(huì)輕易被取代?!?/span>