一本久久综合亚洲鲁鲁五月天,中文有码无码人妻在线,黄色一级网站国产成人毛片

機(jī)器學(xué)習(xí)（ML）有可能通過利用大量數(shù)據(jù)進(jìn)行預(yù)測洞察來改變醫(yī)療決策。然而，當(dāng)這些模型在不能充分代表所有人口群體的數(shù)據(jù)集上進(jìn)行訓(xùn)練時，就會出現(xiàn)一個嚴(yán)重挑戰(zhàn)。預(yù)測疾病患者治療計劃的模型可以在主要包含男性患者的數(shù)據(jù)集上進(jìn)行訓(xùn)練。這可能會導(dǎo)致對女性患者的預(yù)測不準(zhǔn)確。這種偏見可能會導(dǎo)致有害的建議，特別是對代表性不足的群體。

一種解決方案是調(diào)整或平衡訓(xùn)練數(shù)據(jù)集，以確保所有子組都得到平等表示。然而，這種數(shù)據(jù)平衡方法增加了復(fù)雜性，也可能降低模型的整體性能。此外，這種方法可能需要訪問訓(xùn)練組注釋，最終可能會刪除數(shù)據(jù)集的大部分。

麻省理工學(xué)院的研究人員采取了不同的方法。他們開發(fā)了一種新技術(shù)，可以識別和刪除訓(xùn)練數(shù)據(jù)集中對模型在代表性不足的群體中表現(xiàn)不佳影響最大的特定點。

這種技術(shù)沒有假設(shè)每個數(shù)據(jù)點對模型的性能都有同等的貢獻(xiàn)，而是認(rèn)識到某些點對模型有偏見的預(yù)測產(chǎn)生了不成比例的影響。

研究人員的數(shù)據(jù)模型去偏（D3M）首先使用了一種稱為最差組誤差的指標(biāo)，該指標(biāo)衡量模型在某些亞群上的表現(xiàn)有多差。然后，該模型通過使用他們稱之為數(shù)據(jù)建模的框架來提高性能，該框架將預(yù)測近似為列車數(shù)據(jù)的簡單函數(shù)。這使他們能夠量化單個數(shù)據(jù)點如何影響最差的團(tuán)隊績效。

使用這種方法，研究人員可以識別出最有問題的數(shù)據(jù)點。然而，這種模型并沒有刪除大部分?jǐn)?shù)據(jù)，而是選擇性地只刪除最有害的數(shù)據(jù)。

在代表性不足的數(shù)據(jù)缺失或未標(biāo)記的情況下，D3M的方法仍然可以通過分析數(shù)據(jù)本身來發(fā)現(xiàn)隱藏的偏見，使其成為提高公平性的有力工具，即使數(shù)據(jù)有限或未標(biāo)記。

麻省理工學(xué)院電氣工程與計算機(jī)科學(xué)（EECS）研究生、在arXiv上發(fā)表的一篇論文的共同主要作者Kimia Hamidieh說：“許多其他試圖解決這個問題的算法都假設(shè)每個數(shù)據(jù)點都和其他數(shù)據(jù)點一樣重要。在這篇論文中，我們證明了這一假設(shè)是不正確的。我們的數(shù)據(jù)集中有一些特定的點導(dǎo)致了這種偏見，我們可以找到這些數(shù)據(jù)點，刪除它們，并獲得更好的性能?！?/span>

Hamidieh與來自麻省理工學(xué)院的Saachi Jain、Kristian Georgiev、Andrew Ilyas以及資深作者M(jìn)arzyeh Ghassemi和Aleksander Madrt共同撰寫了這篇論文。這項研究將在神經(jīng)信息處理系統(tǒng)會議上發(fā)表。

研究人員的新技術(shù)建立在他們之前的工作基礎(chǔ)上，他們開發(fā)了一種名為TRAK的方法，該方法可以為特定的模型輸出確定最有影響力的訓(xùn)練示例。

麻省理工學(xué)院的團(tuán)隊聲稱，D3M方法提高了最差的組準(zhǔn)確率，同時比傳統(tǒng)的數(shù)據(jù)平衡方法減少了約20000個訓(xùn)練樣本。

Hamidieh說：“這是任何人在訓(xùn)練機(jī)器學(xué)習(xí)模型時都可以使用的工具。他們可以查看這些數(shù)據(jù)點，看看它們是否與他們試圖教授模型的能力相一致?！?/span>

研究人員計劃驗證這種方法，并通過未來的人體研究進(jìn)一步發(fā)展它。他們的目標(biāo)之一是使該方法易于使用，便于醫(yī)療保健專業(yè)人員使用，從而可以在現(xiàn)實環(huán)境中部署。

根據(jù)該論文的合著者Ilyas的說法，“當(dāng)你有工具可以批判性地查看數(shù)據(jù)并找出哪些數(shù)據(jù)點會導(dǎo)致偏見或其他不良行為時，它就為你構(gòu)建更公平、更可靠的模型邁出了第一步。”

這項研究的結(jié)果可能有助于解決人工智能和機(jī)器學(xué)習(xí)模型的一個長期問題：它們的有效性取決于它們所訓(xùn)練的數(shù)據(jù)。如果可以通過可擴(kuò)展的算法識別和刪除降低人工智能模型整體性能的數(shù)據(jù)點，特別是對于大型數(shù)據(jù)集，這可能會改變游戲規(guī)則，提高各種應(yīng)用程序的模型準(zhǔn)確性和可靠性。

通知

麻省理工研究人員提高機(jī)器學(xué)習(xí)模型準(zhǔn)確性