中文字幕亚洲精品乱码,青草青草久热国产精品,两性午夜福利国产一级毛片,日韩精品一区二区三区视频,久久不卡免费视频久久高清精品,人人妻人人澡人人爽不卡视频,亚洲国产一区二区精品,亚洲一区二区三区AV,中文亚洲av片在线观看,日韩性人妻诱慰无码

  1. <dfn id="zqotl"></dfn>

    <blockquote id="zqotl"><mark id="zqotl"></mark></blockquote>
    <tt id="zqotl"><ul id="zqotl"></ul></tt>
    <table id="zqotl"></table>
    會(huì)員服務(wù) 登錄 注冊(cè)
    ×
    資訊活動(dòng)

    麻省理工研究人員提高機(jī)器學(xué)習(xí)模型準(zhǔn)確性

    發(fā)布時(shí)間:2024-12-24 來源:金屬加工

    機(jī)器學(xué)習(xí)(ML)有可能通過利用大量數(shù)據(jù)進(jìn)行預(yù)測(cè)洞察來改變醫(yī)療決策。然而,當(dāng)這些模型在不能充分代表所有人口群體的數(shù)據(jù)集上進(jìn)行訓(xùn)練時(shí),就會(huì)出現(xiàn)一個(gè)嚴(yán)重挑戰(zhàn)。預(yù)測(cè)疾病患者治療計(jì)劃的模型可以在主要包含男性患者的數(shù)據(jù)集上進(jìn)行訓(xùn)練。這可能會(huì)導(dǎo)致對(duì)女性患者的預(yù)測(cè)不準(zhǔn)確。這種偏見可能會(huì)導(dǎo)致有害的建議,特別是對(duì)代表性不足的群體。

    一種解決方案是調(diào)整或平衡訓(xùn)練數(shù)據(jù)集,以確保所有子組都得到平等表示。然而,這種數(shù)據(jù)平衡方法增加了復(fù)雜性,也可能降低模型的整體性能。此外,這種方法可能需要訪問訓(xùn)練組注釋,最終可能會(huì)刪除數(shù)據(jù)集的大部分。

    麻省理工學(xué)院的研究人員采取了不同的方法。他們開發(fā)了一種新技術(shù),可以識(shí)別和刪除訓(xùn)練數(shù)據(jù)集中對(duì)模型在代表性不足的群體中表現(xiàn)不佳影響最大的特定點(diǎn)。

    這種技術(shù)沒有假設(shè)每個(gè)數(shù)據(jù)點(diǎn)對(duì)模型的性能都有同等的貢獻(xiàn),而是認(rèn)識(shí)到某些點(diǎn)對(duì)模型有偏見的預(yù)測(cè)產(chǎn)生了不成比例的影響。

    研究人員的數(shù)據(jù)模型去偏(D3M)首先使用了一種稱為最差組誤差的指標(biāo),該指標(biāo)衡量模型在某些亞群上的表現(xiàn)有多差。然后,該模型通過使用他們稱之為數(shù)據(jù)建模的框架來提高性能,該框架將預(yù)測(cè)近似為列車數(shù)據(jù)的簡(jiǎn)單函數(shù)。這使他們能夠量化單個(gè)數(shù)據(jù)點(diǎn)如何影響最差的團(tuán)隊(duì)績(jī)效。

    使用這種方法,研究人員可以識(shí)別出最有問題的數(shù)據(jù)點(diǎn)。然而,這種模型并沒有刪除大部分?jǐn)?shù)據(jù),而是選擇性地只刪除最有害的數(shù)據(jù)。

    在代表性不足的數(shù)據(jù)缺失或未標(biāo)記的情況下,D3M的方法仍然可以通過分析數(shù)據(jù)本身來發(fā)現(xiàn)隱藏的偏見,使其成為提高公平性的有力工具,即使數(shù)據(jù)有限或未標(biāo)記。

    麻省理工學(xué)院電氣工程與計(jì)算機(jī)科學(xué)(EECS)研究生、在arXiv上發(fā)表的一篇論文的共同主要作者Kimia Hamidieh說:“許多其他試圖解決這個(gè)問題的算法都假設(shè)每個(gè)數(shù)據(jù)點(diǎn)都和其他數(shù)據(jù)點(diǎn)一樣重要。在這篇論文中,我們證明了這一假設(shè)是不正確的。我們的數(shù)據(jù)集中有一些特定的點(diǎn)導(dǎo)致了這種偏見,我們可以找到這些數(shù)據(jù)點(diǎn),刪除它們,并獲得更好的性能?!?/span>

    Hamidieh與來自麻省理工學(xué)院的Saachi Jain、Kristian Georgiev、Andrew Ilyas以及資深作者M(jìn)arzyeh Ghassemi和Aleksander Madrt共同撰寫了這篇論文。這項(xiàng)研究將在神經(jīng)信息處理系統(tǒng)會(huì)議上發(fā)表。

    研究人員的新技術(shù)建立在他們之前的工作基礎(chǔ)上,他們開發(fā)了一種名為TRAK的方法,該方法可以為特定的模型輸出確定最有影響力的訓(xùn)練示例。

    麻省理工學(xué)院的團(tuán)隊(duì)聲稱,D3M方法提高了最差的組準(zhǔn)確率,同時(shí)比傳統(tǒng)的數(shù)據(jù)平衡方法減少了約20000個(gè)訓(xùn)練樣本。

    Hamidieh說:“這是任何人在訓(xùn)練機(jī)器學(xué)習(xí)模型時(shí)都可以使用的工具。他們可以查看這些數(shù)據(jù)點(diǎn),看看它們是否與他們?cè)噲D教授模型的能力相一致?!?/span>

    研究人員計(jì)劃驗(yàn)證這種方法,并通過未來的人體研究進(jìn)一步發(fā)展它。他們的目標(biāo)之一是使該方法易于使用,便于醫(yī)療保健專業(yè)人員使用,從而可以在現(xiàn)實(shí)環(huán)境中部署。

    根據(jù)該論文的合著者Ilyas的說法,“當(dāng)你有工具可以批判性地查看數(shù)據(jù)并找出哪些數(shù)據(jù)點(diǎn)會(huì)導(dǎo)致偏見或其他不良行為時(shí),它就為你構(gòu)建更公平、更可靠的模型邁出了第一步?!?/span>

    這項(xiàng)研究的結(jié)果可能有助于解決人工智能和機(jī)器學(xué)習(xí)模型的一個(gè)長(zhǎng)期問題:它們的有效性取決于它們所訓(xùn)練的數(shù)據(jù)。如果可以通過可擴(kuò)展的算法識(shí)別和刪除降低人工智能模型整體性能的數(shù)據(jù)點(diǎn),特別是對(duì)于大型數(shù)據(jù)集,這可能會(huì)改變游戲規(guī)則,提高各種應(yīng)用程序的模型準(zhǔn)確性和可靠性。

    亚洲AV无码一区二区一二区| 日日麻批免费40分钟无码| 人妻少妇精品视频一区二区三区| 国产精品亚洲成在人线| 中文字幕无码一区二区免费| 国产精品久久久久久久| 狠狠色丁香婷婷综合五月| 亚洲无码专区免费在线观看| 久久精品国产亚洲AV麻豆AⅤ1| 少妇一级婬片免费放| 欧美FREESEX黑人又粗又大| 无码精品人妻一区二区涩爱| 亚洲文字幕中文字幕mv| 亚洲国产呦萝小初| 久久精品欧美一区二区三区不卡| 日韩电影一区二区亚洲精品| 久久综合九色综合欧美就去吻中文字幕最新在线| 精品亚洲a∨无码专区毛片| 免费观看又污又黄又无遮挡的网站| 好爽进去了视频在线观看国版| 色欲国产精品无码一区二区在| 亚洲av无码无限在线观看| 国产日韩综合一区二区性色AV| 国产AV无码专区亚洲AV手机麻豆| 色国产精品一区在线观看| 亚洲AV香蕉一区区二区三区| 日日噜噜夜夜狠狠久久丁香五月| 国精品无码一区二区三区在线蜜臀| 狠狠人妻久久久久久综合| 欧美激情一区二区三区中文字幕| 久久人搡人人玩人妻精品首页| 少妇厨房愉情理9仑片视频| 国产成人无码免费网站| 久久亚洲AV成人无码| 国产福利在线观看精品| 久久久久久久亚洲AV无码| 精品国产乱码一区二区三区麻豆| 亚洲成AV人综合在线观看| 欧美亚洲国产日韩欧美4p| 男人扒开女人下面舔的AV | 日本内射精品一区二区视频|