亚洲国产精品一区二区美利坚,一女被多男玩喷潮视频,在线观看免费a∨网站,中文字幕 一区二区三区,亚洲区欧美区综合区自拍区

AI醫(yī)療進入精準化“深水區(qū)” :OpenAI醫(yī)療評估基準落地、大模型加速變革|AI醫(yī)療浪潮?

1個月前 來源: 觀看:69

21世紀經(jīng)濟報道記者 閆碩 北京報道Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

近日,OpenAI推出HealthBench開源基準測試,用于衡量大語言模型在醫(yī)療健康領域的性能表現(xiàn)與安全可靠性,引發(fā)業(yè)內(nèi)廣泛討論。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

根據(jù)官方信息,HealthBench由262位來自60個國家/地區(qū)執(zhí)業(yè)的醫(yī)生共同參與構(gòu)建,整合了5000段真實的醫(yī)療對話數(shù)據(jù)。與以前的狹窄基準不同,HealthBench通過48562個獨特的醫(yī)生編寫的評分標準進行有意義的開放式評估,涵蓋多個健康背景和行為維度。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

有研報分析指出,隨著OpenAI推出HealthBench等醫(yī)療大模型評估基準的建立和完善,AI醫(yī)療模型的性能評估將更加科學、全面,有助于加速AI技術在醫(yī)療領域的落地應用,為醫(yī)療行業(yè)的智能化升級提供有力支持,相關企業(yè)有望迎來新的發(fā)展機遇。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

另一方面,大模型本身也在加速變革。事實上,隨著大模型競爭的白熱化,競爭的焦點也已進入全新階段:從早先粗放的參數(shù)體量堆砌競賽,轉(zhuǎn)變?yōu)槟P托蕛?yōu)化與單位算力下的性能提升。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

IQVIA艾昆緯戰(zhàn)略規(guī)劃副總監(jiān)Barrett Li向21世紀經(jīng)濟報道記者表示,隨著大模型的不斷進化,以及模型優(yōu)化方法的不斷提升,已經(jīng)為AI在要求更特殊的專業(yè)場景中的更廣泛應用拓展了可能性,尤其是對于醫(yī)藥行業(yè)的AI應用來說,已顯現(xiàn)三大趨勢:模型即產(chǎn)品、本地與端側(cè)部署、研發(fā)端AI應用的快速拓展。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

新的評估測試集

改善人類健康將成為通用人工智能(AGI)的決定性影響之一。如果能夠得到有效開發(fā)和部署,大語言模型有望拓展健康信息的獲取渠道,支持臨床醫(yī)生提供高質(zhì)量醫(yī)療服務,并幫助人們維護自身健康。而評估對于理解模型在醫(yī)療場景中的表現(xiàn)至關重要。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

OpenAI認為,現(xiàn)有評估仍然存在一些問題,首先,未反映真實場景,脫離了實際醫(yī)療互動的復雜性,如僅采用標準化測試或有限臨床問題。其次,缺乏專家醫(yī)學驗證,評分標準未經(jīng)過醫(yī)療專家嚴格審核,難以體現(xiàn)專業(yè)醫(yī)療判斷。此外,也并未預留改進空間,最先進模型已接近“天花板”得分,無法激勵持續(xù)優(yōu)化。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

也因此,在過去的一年里,OpenAI與60個國家的262名醫(yī)生合作構(gòu)建了HealthBench,包括5000個真實的醫(yī)療對話數(shù)據(jù)。HealthBench 的測試樣本被分為7個主題和5個評估維度。其中,7個主題包括緊急轉(zhuǎn)診、專業(yè)溝通定制、健康數(shù)據(jù)任務等方面,5個評估緯度則包含準確性、溝通質(zhì)量、情境理解等方面。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

在HealthBench的基礎上,OpenAI還推出了兩個特別版本:HealthBench Consensus(共識版)和HealthBench Hard(困難版)。前者包含34個經(jīng)醫(yī)生共識驗證的、對模型行為表現(xiàn)尤為關鍵的評估維度;后者則設置了更高難度的評估場景,目前最高得分僅為o3模型的32%,主要被用于挑戰(zhàn)模型在復雜醫(yī)療情境中的極限表現(xiàn)。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

對于HealthBench的可信度,OpenAI開展了HealthBench Consensus(共識版)的元評估,即將模型的打分結(jié)果與醫(yī)生人工打分進行對比。結(jié)果表明,7個評估領域中的6個領域,模型打分結(jié)果與醫(yī)生評分的中位數(shù)水平高度一致。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

有券商分析師向21世紀經(jīng)濟報道記者表示,在醫(yī)療等垂直領域,準確性和實際場景的相關性比“流暢對話”更為關鍵,HealthBench不同于過去大多關注通用大語言模型表現(xiàn)的基準,而是聚焦醫(yī)療垂直領域,為醫(yī)療領域的AI應用提供更為專業(yè)的評估工具,同時也將推動大模型領域建立專業(yè)的AI評估標準。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

值得一提的是,在HealthBench的測評中可以發(fā)現(xiàn),大模型在醫(yī)療領域的應用正迅速發(fā)展。比如,2023年推出的GPT-3.5Turbo得分為16%,而2024年5月推出的GPT-4o得分已達到32%,2024年12月推出的o3模型得分更是達到60%。另外,較小規(guī)模的模型尤其進步顯著,GPT-4.1 nano的表現(xiàn)超過GPT-4o,且成本僅為GPT-4o的1/25。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

大模型持續(xù)優(yōu)化

根據(jù)世界經(jīng)濟論壇發(fā)布的《人工智能驅(qū)動健康的未來:引領潮流》報告,人工智能是醫(yī)療保健的主要變革力量,預計2024年—2032年,AI醫(yī)療市場將以每年43%的速度增長,市場規(guī)模有望達到4910億美元。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

其中,AI在醫(yī)療服務中的應用前景廣闊。中信建投證券分析指出,AI可以擴展醫(yī)療服務可及性,可應用于診斷前、診治及診斷后階段,解決當前醫(yī)院系統(tǒng)醫(yī)療人員短缺和缺乏有效分流等問題,以少量資源實現(xiàn)高效率。此外,AI輔助醫(yī)生診療未來有望降低誤診率的同時,在部分疑難雜癥診療方面也有望發(fā)揮協(xié)同作用。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

也因此,不僅評估工具在發(fā)生變革,大模型本身也在持續(xù)優(yōu)化。當前,AI在醫(yī)療領域的應用歷經(jīng)了從規(guī)則驅(qū)動到數(shù)據(jù)驅(qū)動、從單一任務優(yōu)化到多模態(tài)協(xié)同的演變,已進入到多模態(tài)融合階段。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

浙商證券分析指出,大模型的多模態(tài)能力解決了早期AI醫(yī)療存在的信息割裂和數(shù)據(jù)孤島等問題,大模型通過“預訓練+微調(diào)”架構(gòu),用統(tǒng)一參數(shù)體系處理多模態(tài)醫(yī)療數(shù)據(jù)。在臨床應用中,借助多模態(tài)技術,AI可以實現(xiàn)跨模態(tài)數(shù)據(jù)的理解和動態(tài)時序建模,使得AI診療與醫(yī)生的診療水平更加接近。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

需要指出的是,由于萬億級參數(shù)模型高昂的訓練成本與當下較低的投資回報比,疊加通用參數(shù)的堆砌對專業(yè)場景下的模型效率提升遇到了瓶頸,大模型競爭的焦點已從早先粗放的參數(shù)體量堆砌競賽,轉(zhuǎn)向模型效率優(yōu)化與單位算力下的性能提升。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

在應用方面,Barrett Li向記者總結(jié)道,隨著大模型的不斷進化,目前對于醫(yī)藥行業(yè)的AI應用來說,幾大趨勢已經(jīng)顯現(xiàn):Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

首先,模型即產(chǎn)品。相比通用大模型在其他行業(yè)中相對較低的應用門檻,醫(yī)藥行業(yè)高度專業(yè)性的場景,對于模型的適配性有著更高的要求。而隨著模型訓練與針對特定知識庫優(yōu)化的技術與應用逐漸推廣,大模型廠商未來預計會逐步關閉對外的API接口,轉(zhuǎn)而將專業(yè)化后的模型本身作為產(chǎn)品直接提供給企業(yè)用戶使用,顛覆現(xiàn)有的套殼應用層。而現(xiàn)有的專業(yè)AI軟件,也必須逐步增強其底層模型訓練的能力以應對這一挑戰(zhàn)。在可見的未來,將會有更多直接針對醫(yī)藥行業(yè)訓練的模型被廣泛應用。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

其次,本地與端側(cè)部署。針對特定場景而訓練優(yōu)化的專業(yè)模型,可以在滿足性能要求的前提下,減少對硬件方面提出過高的要求。因此在成本可控性、分析可溯源、數(shù)據(jù)安全、反饋延遲等要求更高的場景下,專業(yè)中小模型的本地部署會提供極大的賦能。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

“此外,研發(fā)端AI應用也在快速拓展。出于高度專業(yè)性、數(shù)據(jù)安全、隱私合規(guī)等因素,相比通用大模型在商業(yè)化階段的快速發(fā)展,醫(yī)藥行業(yè)企業(yè)尚未在研發(fā)階段感受到AI所帶來的巨大轉(zhuǎn)變。而隨著特定場景專業(yè)模型訓練的普及,研發(fā)階段AI應用的壁壘未來也有望被逐一消解?!盉arrett Li說道。Uxw即熱新聞——關注每天科技社會生活新變化gihot.com

本文鏈接:http://m.enbeike.cn/news-7-17974-0.htmlAI醫(yī)療進入精準化“深水區(qū)” :OpenAI醫(yī)療評估基準落地、大模型加速變革|AI醫(yī)療浪潮?

聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。

上一篇:CXO企業(yè)一季報:5家營收破10億元,8家虧損,國際化與創(chuàng)新賽道或成破局關鍵

下一篇:交易超10億美金,石藥這款首仿藥何以搶灘全球市場?

為你推薦
21世紀經(jīng)濟報道記者 唐唯珂 廣州報道2025年1月24日晚,金域醫(yī)學發(fā)布2024年業(yè)績預告,報告期內(nèi)預計歸母凈利潤為-3.5億元到-4.5億元,與上年同期...
01-27
21世紀經(jīng)濟報道記者 林昀肖 北京報道 春節(jié)假期過后,72家A股中藥上市企業(yè)中已有30家企業(yè)發(fā)布2024年年報業(yè)績預告。據(jù)Wind數(shù)據(jù),這30家中藥上...
02-07
雙子座的男生一向以機智聰慧、善于交際而聞名,他們天生具備吸引人的魅力。當一個雙子男...
01-22
金牛座男生通常對于女生有著獨特的偏好和要求。他們喜歡一種特定類型的女生,下面將介紹...
01-22
黑白小格子襯衫怎么搭配?一、黑白小格子襯衫怎么搭配?謝題主邀請:夏季黑白小格子襯衣搭配怎么搭配?盛夏美女們簡約搭配,都會顯得自然大方,帥氣可愛又有魅力風度,牛仔褲頭配黑白格...
02-07
162女適合什么風格穿搭?一、162女適合什么風格穿搭?白色T恤搭配條紋傘裙,紅色蓬紗裙,打造文藝氣質(zhì)女神風格。白色T恤搭配灰色大衣在配個貝雷帽。短款羽絨服搭配破洞直筒褲,整體風...
02-07
2月7日消息,秦皇島津峰線纜制造有限公司(以下簡稱:津峰線纜)董事長韓金良一行日前到訪涂多多?,F(xiàn)場,涂多多副總裁、跨境產(chǎn)發(fā)部常務副總經(jīng)理鄭德蓮與津峰線纜副總經(jīng)理韓冬共同簽署...
02-07
2月19日消息,小紅書電商日前正式啟動運營服務商招募,通過運營服務商的專業(yè)化能力和經(jīng)驗,為商家提供賬號定位、內(nèi)容打造、直播操盤、店鋪運營、投流推廣、貨盤供應等服務,加速潛...
02-20
2月10日消息,四川省發(fā)展改革委(省數(shù)據(jù)局)公布2024年度四川省數(shù)字化轉(zhuǎn)型促進中心名單,共有18家申報單位獲得批復認定,四川合縱藥易購醫(yī)藥股份有限公司入選名單。這是四川省新修訂...
02-11
高德地圖發(fā)力內(nèi)容化,錨定“一張地圖承載吃喝玩樂”。據(jù)億邦動力消息,高德地圖正在招募評價視頻的內(nèi)測達人,在用戶評價中引入短視頻內(nèi)容形式。達人可以報名的時間為2025年3月6日...
03-09
近年來,智能門鎖已然成為智能家居領域的熱門單品。然而,隨著智能鎖技術的快速迭代,老款產(chǎn)品逐漸難以滿足人們?nèi)找嬖鲩L的生活需求。眾多用戶雖有強烈的換新意愿,卻在這一過程中遭...
01-21
近日,華力創(chuàng)科學宣布完成數(shù)千萬元A+輪融資,本輪融資由金屬3D打印領域頭部上市公司鉑力特獨家投資。據(jù)披露,本輪融資所募集的資金將專注于深挖高性能光學多模態(tài)感知技術,結(jié)合金屬...
01-24
據(jù)法國媒體報道Les Echos報道,育碧和沙特公司Savvy Games Group達成合作關系,這可能讓發(fā)售兩年的《刺客信條:幻景》迎來DLC。 報道稱育碧之前對《刺客信條:幻景》...
01-27
發(fā)行商 Knight Peaks 和開發(fā)商 Owlcat Games 宣布,CRPG游戲《開拓者:擁王者》在推出 6 年后,已突破 200 萬銷量大關。 游戲于去年 9 月正式迎來了 6 周年紀念日,...
01-28
來自2025年綜合運輸春運工作專班數(shù)據(jù)顯示,2025年2月4日(春運第22日,農(nóng)歷正月初七),全社會跨區(qū)域人員流動量預計34611萬人次。其中,鐵路客運量1690萬人次,公路人員流動量32556萬人次...
02-04
春節(jié)檔電影《哪吒之魔童鬧?!罚ㄒ韵路Q《哪吒2》)將在當?shù)貢r間2月12日起于北美地區(qū)開啟特別制式點映,2月14日正式上映。目前預售場次火爆,上座率達90%以上,多個熱門場次均已售罄,一...
02-10
從空間太陽能發(fā)電到破解大腦基因密碼,再到由真菌制造的自我修復材料,《歐盟研究與創(chuàng)新》雜志盤點了2025年有望大放異彩的創(chuàng)新技術。這些成果擁有廣闊...
01-21
  IT之家1月22日消息,經(jīng)北京市委常委會審議通過,2025年“3個100”市重點工程計劃發(fā)布,包括建設30...
01-23
  在歐萊雅、寶潔、花王、愛茉莉太平洋等跨國美妝巨頭的最新財報上,業(yè)績再現(xiàn)高增長:有的全球業(yè)...
02-11
  中新社北京2月12日電(記者應妮)即將在全球多個國家和地區(qū)正式上映的動畫電影《哪吒之魔童鬧...
02-14
全國多個省份陸續(xù)進入“兩會時間”。1月13日,黑龍江省第十四屆人民代表大會第三次會議開幕。根據(jù)2025年黑龍江省政府工作報告,2025...
01-21
  1月22日,臘月二十三,這一天是北方傳統(tǒng)的小年,而南方傳統(tǒng)的小年則在臘月二十四。小年到,甲辰龍年即將別去,乙巳蛇年日漸臨近,天南海北的人們都在高高興興地迎新春?! ∶耖g...
01-22
1 月 21 日消息,小米汽車旗下首款 SUV 車型 YU7 的實車圖片和視頻在網(wǎng)絡上頻頻流出,最新視頻曝光了該車的車門、尾門以及部分內(nèi)飾設計。注意到,從最新曝光的視頻中可以...
01-21
1 月 30 日消息,特斯拉CEO埃隆?馬斯克(Elon Musk)在昨天的財報電話會議上表示,特斯拉將于 6 月在美國得克薩斯州奧斯汀推出“無人監(jiān)督、無人駕駛”的 Robotaxi 出租車...
01-31
《末日地堡第二季》講述了朱麗葉在廢棄筒倉中的冒險與探索。第1集中,17號筒倉爆發(fā)革命,居民紛紛逃離。朱麗葉進入筒倉,發(fā)現(xiàn)上層空無一人,下層被洪水淹沒。她試...
02-19
在娛樂圈這片星光璀璨的土地上,何炅以其深厚的主持功底和溫文爾雅的形象,長久以來贏得了大眾的廣泛好評。而最近,這位年過半百的主持人又因一個意外的瞬間,成為了眾人熱議的焦點...
02-22
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕