亚洲国产精品一区二区美利坚,一女被多男玩喷潮视频,在线观看免费a∨网站,中文字幕 一区二区三区,亚洲区欧美区综合区自拍区

AI醫(yī)療進入精準化“深水區(qū)” :OpenAI醫(yī)療評估基準落地、大模型加速變革|AI醫(yī)療浪潮?

3個月前 來源: 觀看:144

21世紀經(jīng)濟報道記者 閆碩 北京報道5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

近日,OpenAI推出HealthBench開源基準測試,用于衡量大語言模型在醫(yī)療健康領(lǐng)域的性能表現(xiàn)與安全可靠性,引發(fā)業(yè)內(nèi)廣泛討論。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

根據(jù)官方信息,HealthBench由262位來自60個國家/地區(qū)執(zhí)業(yè)的醫(yī)生共同參與構(gòu)建,整合了5000段真實的醫(yī)療對話數(shù)據(jù)。與以前的狹窄基準不同,HealthBench通過48562個獨特的醫(yī)生編寫的評分標準進行有意義的開放式評估,涵蓋多個健康背景和行為維度。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

有研報分析指出,隨著OpenAI推出HealthBench等醫(yī)療大模型評估基準的建立和完善,AI醫(yī)療模型的性能評估將更加科學、全面,有助于加速AI技術(shù)在醫(yī)療領(lǐng)域的落地應用,為醫(yī)療行業(yè)的智能化升級提供有力支持,相關(guān)企業(yè)有望迎來新的發(fā)展機遇。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

另一方面,大模型本身也在加速變革。事實上,隨著大模型競爭的白熱化,競爭的焦點也已進入全新階段:從早先粗放的參數(shù)體量堆砌競賽,轉(zhuǎn)變?yōu)槟P托蕛?yōu)化與單位算力下的性能提升。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

IQVIA艾昆緯戰(zhàn)略規(guī)劃副總監(jiān)Barrett Li向21世紀經(jīng)濟報道記者表示,隨著大模型的不斷進化,以及模型優(yōu)化方法的不斷提升,已經(jīng)為AI在要求更特殊的專業(yè)場景中的更廣泛應用拓展了可能性,尤其是對于醫(yī)藥行業(yè)的AI應用來說,已顯現(xiàn)三大趨勢:模型即產(chǎn)品、本地與端側(cè)部署、研發(fā)端AI應用的快速拓展。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

新的評估測試集

改善人類健康將成為通用人工智能(AGI)的決定性影響之一。如果能夠得到有效開發(fā)和部署,大語言模型有望拓展健康信息的獲取渠道,支持臨床醫(yī)生提供高質(zhì)量醫(yī)療服務(wù),并幫助人們維護自身健康。而評估對于理解模型在醫(yī)療場景中的表現(xiàn)至關(guān)重要。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

OpenAI認為,現(xiàn)有評估仍然存在一些問題,首先,未反映真實場景,脫離了實際醫(yī)療互動的復雜性,如僅采用標準化測試或有限臨床問題。其次,缺乏專家醫(yī)學驗證,評分標準未經(jīng)過醫(yī)療專家嚴格審核,難以體現(xiàn)專業(yè)醫(yī)療判斷。此外,也并未預留改進空間,最先進模型已接近“天花板”得分,無法激勵持續(xù)優(yōu)化。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

也因此,在過去的一年里,OpenAI與60個國家的262名醫(yī)生合作構(gòu)建了HealthBench,包括5000個真實的醫(yī)療對話數(shù)據(jù)。HealthBench 的測試樣本被分為7個主題和5個評估維度。其中,7個主題包括緊急轉(zhuǎn)診、專業(yè)溝通定制、健康數(shù)據(jù)任務(wù)等方面,5個評估緯度則包含準確性、溝通質(zhì)量、情境理解等方面。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在HealthBench的基礎(chǔ)上,OpenAI還推出了兩個特別版本:HealthBench Consensus(共識版)和HealthBench Hard(困難版)。前者包含34個經(jīng)醫(yī)生共識驗證的、對模型行為表現(xiàn)尤為關(guān)鍵的評估維度;后者則設(shè)置了更高難度的評估場景,目前最高得分僅為o3模型的32%,主要被用于挑戰(zhàn)模型在復雜醫(yī)療情境中的極限表現(xiàn)。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

對于HealthBench的可信度,OpenAI開展了HealthBench Consensus(共識版)的元評估,即將模型的打分結(jié)果與醫(yī)生人工打分進行對比。結(jié)果表明,7個評估領(lǐng)域中的6個領(lǐng)域,模型打分結(jié)果與醫(yī)生評分的中位數(shù)水平高度一致。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

有券商分析師向21世紀經(jīng)濟報道記者表示,在醫(yī)療等垂直領(lǐng)域,準確性和實際場景的相關(guān)性比“流暢對話”更為關(guān)鍵,HealthBench不同于過去大多關(guān)注通用大語言模型表現(xiàn)的基準,而是聚焦醫(yī)療垂直領(lǐng)域,為醫(yī)療領(lǐng)域的AI應用提供更為專業(yè)的評估工具,同時也將推動大模型領(lǐng)域建立專業(yè)的AI評估標準。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

值得一提的是,在HealthBench的測評中可以發(fā)現(xiàn),大模型在醫(yī)療領(lǐng)域的應用正迅速發(fā)展。比如,2023年推出的GPT-3.5Turbo得分為16%,而2024年5月推出的GPT-4o得分已達到32%,2024年12月推出的o3模型得分更是達到60%。另外,較小規(guī)模的模型尤其進步顯著,GPT-4.1 nano的表現(xiàn)超過GPT-4o,且成本僅為GPT-4o的1/25。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

大模型持續(xù)優(yōu)化

根據(jù)世界經(jīng)濟論壇發(fā)布的《人工智能驅(qū)動健康的未來:引領(lǐng)潮流》報告,人工智能是醫(yī)療保健的主要變革力量,預計2024年—2032年,AI醫(yī)療市場將以每年43%的速度增長,市場規(guī)模有望達到4910億美元。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

其中,AI在醫(yī)療服務(wù)中的應用前景廣闊。中信建投證券分析指出,AI可以擴展醫(yī)療服務(wù)可及性,可應用于診斷前、診治及診斷后階段,解決當前醫(yī)院系統(tǒng)醫(yī)療人員短缺和缺乏有效分流等問題,以少量資源實現(xiàn)高效率。此外,AI輔助醫(yī)生診療未來有望降低誤診率的同時,在部分疑難雜癥診療方面也有望發(fā)揮協(xié)同作用。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

也因此,不僅評估工具在發(fā)生變革,大模型本身也在持續(xù)優(yōu)化。當前,AI在醫(yī)療領(lǐng)域的應用歷經(jīng)了從規(guī)則驅(qū)動到數(shù)據(jù)驅(qū)動、從單一任務(wù)優(yōu)化到多模態(tài)協(xié)同的演變,已進入到多模態(tài)融合階段。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

浙商證券分析指出,大模型的多模態(tài)能力解決了早期AI醫(yī)療存在的信息割裂和數(shù)據(jù)孤島等問題,大模型通過“預訓練+微調(diào)”架構(gòu),用統(tǒng)一參數(shù)體系處理多模態(tài)醫(yī)療數(shù)據(jù)。在臨床應用中,借助多模態(tài)技術(shù),AI可以實現(xiàn)跨模態(tài)數(shù)據(jù)的理解和動態(tài)時序建模,使得AI診療與醫(yī)生的診療水平更加接近。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

需要指出的是,由于萬億級參數(shù)模型高昂的訓練成本與當下較低的投資回報比,疊加通用參數(shù)的堆砌對專業(yè)場景下的模型效率提升遇到了瓶頸,大模型競爭的焦點已從早先粗放的參數(shù)體量堆砌競賽,轉(zhuǎn)向模型效率優(yōu)化與單位算力下的性能提升。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在應用方面,Barrett Li向記者總結(jié)道,隨著大模型的不斷進化,目前對于醫(yī)藥行業(yè)的AI應用來說,幾大趨勢已經(jīng)顯現(xiàn):5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

首先,模型即產(chǎn)品。相比通用大模型在其他行業(yè)中相對較低的應用門檻,醫(yī)藥行業(yè)高度專業(yè)性的場景,對于模型的適配性有著更高的要求。而隨著模型訓練與針對特定知識庫優(yōu)化的技術(shù)與應用逐漸推廣,大模型廠商未來預計會逐步關(guān)閉對外的API接口,轉(zhuǎn)而將專業(yè)化后的模型本身作為產(chǎn)品直接提供給企業(yè)用戶使用,顛覆現(xiàn)有的套殼應用層。而現(xiàn)有的專業(yè)AI軟件,也必須逐步增強其底層模型訓練的能力以應對這一挑戰(zhàn)。在可見的未來,將會有更多直接針對醫(yī)藥行業(yè)訓練的模型被廣泛應用。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

其次,本地與端側(cè)部署。針對特定場景而訓練優(yōu)化的專業(yè)模型,可以在滿足性能要求的前提下,減少對硬件方面提出過高的要求。因此在成本可控性、分析可溯源、數(shù)據(jù)安全、反饋延遲等要求更高的場景下,專業(yè)中小模型的本地部署會提供極大的賦能。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

“此外,研發(fā)端AI應用也在快速拓展。出于高度專業(yè)性、數(shù)據(jù)安全、隱私合規(guī)等因素,相比通用大模型在商業(yè)化階段的快速發(fā)展,醫(yī)藥行業(yè)企業(yè)尚未在研發(fā)階段感受到AI所帶來的巨大轉(zhuǎn)變。而隨著特定場景專業(yè)模型訓練的普及,研發(fā)階段AI應用的壁壘未來也有望被逐一消解?!盉arrett Li說道。5My即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

本文鏈接:http://m.enbeike.cn/news-7-17974-0.htmlAI醫(yī)療進入精準化“深水區(qū)” :OpenAI醫(yī)療評估基準落地、大模型加速變革|AI醫(yī)療浪潮?

聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。

上一篇:CXO企業(yè)一季報:5家營收破10億元,8家虧損,國際化與創(chuàng)新賽道或成破局關(guān)鍵

下一篇:交易超10億美金,石藥這款首仿藥何以搶灘全球市場?

為你推薦
21世紀經(jīng)濟報道記者 林昀肖 北京報道 春節(jié)假期過后,72家A股中藥上市企業(yè)中已有30家企業(yè)發(fā)布2024年年報業(yè)績預告。據(jù)Wind數(shù)據(jù),這30家中藥上...
02-07
編者按:一個人工智能(AI)機器人,在短短8天內(nèi)獨立完成了668項實驗,合成了668種化合物,并成功研發(fā)出一種全新的化學催化劑。這一壯舉令人贊嘆。AI...
02-11
  大眾網(wǎng)記者 司心鵬 報道  為貫徹落實教育部、山東省《關(guān)于加強新時代教育科學研究工作的實施意見》,提高特殊教育教師教科研水平,促進特殊教育教師專業(yè)成長,2024年12...
01-21
  大眾網(wǎng)記者 楊濤報道  11月19日,白俄羅斯共和國職業(yè)教育研究院校長戈盧博夫斯基?瓦萊里?尼古拉耶維奇副教授, 國際合作中心主任科列伊妮娜?奧爾加?瓦列耶夫娜一...
01-21
  摘要  【供需有望改善鋼價或先抑后揚】1月上旬,爐料補庫漸入尾聲,下游需求處于淡季,爐料及鋼...
02-05
  近期,保險資金頻繁“掃貨”上市公司股票。根據(jù)Wind統(tǒng)計,今年以來,包括平安人壽舉牌郵儲銀行H股...
02-11
天蝎男是一個內(nèi)斂而神秘的星座,他們往往不會輕易表露自己的感情。當他們暗戀一個人時,常...
01-22
射手座的男生天性熱情開朗,喜歡自由自在地生活。他們追求刺激和冒險,對于感情也是如此。...
01-22
EC童年童裝怎么介紹? 童裝搭配技巧?一、EC童年童裝怎么介紹?童年e櫥是一家以純棉為主要面料打造的一家童裝加工工廠,精選材質(zhì),生產(chǎn)出,吸汗,透氣,親膚的衣衣,父母的.童年e櫥是一個定位...
02-12
時尚穿搭的文案? 時尚穿搭說說?一、時尚穿搭的文案?短裝配闊腿褲,顯腿長,大衣配小腳褲,簡約又大氣,衛(wèi)衣配包臀裙,時尚又大方,牛仔褲配體恤,青春又靚麗,黑白灰永恒色,永遠不會過時。二、...
02-12
這兩位來自福建龍巖的老鄉(xiāng),故事就此拉開序幕。1.抖音生活服務(wù)春節(jié)團購訂單量暴漲春節(jié)放假期間,本地消費需求暴漲,讓抖音狠狠地吃了一波紅利。日前,抖音生活服務(wù)發(fā)布《2025春節(jié)消...
02-07
2月8日消息,淘寶數(shù)據(jù)顯示,由導演餃子創(chuàng)作的哪吒系列形象授權(quán)周邊在平臺上銷售額目前已經(jīng)突破了5000萬。其周邊種類也覆蓋了盲盒、卡牌、毛絨、搪膠娃娃、膠片卡、冰箱貼、徽章...
02-09
聽花酒又支棱起來了?近日,多名網(wǎng)友發(fā)帖稱,看到聽花酒投放的電視廣告——廣告畫面簡潔,宣傳語為“聽花酒,裝在瓶子里的春天”,并附上咨詢...
03-01
在當今數(shù)字化時代,直播行業(yè)蓬勃發(fā)展,直播帶貨已成為一種重要的營銷方式。然而,在這看似繁華的背后,卻隱藏著諸多問題。部分主播為了追...
03-09
近日,華力創(chuàng)科學宣布完成數(shù)千萬元A+輪融資,本輪融資由金屬3D打印領(lǐng)域頭部上市公司鉑力特獨家投資。據(jù)披露,本輪融資所募集的資金將專注于深挖高性能光學多模態(tài)感知技術(shù),結(jié)合金屬...
01-24
近日,華力創(chuàng)科學宣布完成數(shù)千萬元A+輪融資,本輪融資由金屬3D打印領(lǐng)域頭部上市公司鉑力特獨家投資。據(jù)披露,本輪融資所募集的資金將專注于深挖高性能光學多模態(tài)感知技術(shù),結(jié)合金屬...
01-24
在《GTA5》中為魅力主角之一崔佛配音的男演員史蒂文·奧格(Steven Ogg)希望能在《GTA6》中最后一次扮演這個瘋子角色。史蒂文·奧格希望崔佛能在游戲早期的某個...
01-29
近日暴雪游戲國服運營團隊宣布,戰(zhàn)網(wǎng)正式調(diào)整登錄方式。用戶需要使用網(wǎng)易通行證登錄戰(zhàn)網(wǎng),但完全切換的時間稍作推遲,未來需要使用網(wǎng)易賬號才能登錄游戲。 暴雪游...
02-13
當?shù)貢r間2月2日,美國華盛頓消防部門表示,已確定兩機相撞事故中55名遇難者的身份。當?shù)貢r間1月29日,一架美國國內(nèi)支線客機在羅納德·里根華盛頓國家機場同一架美軍直升機在半空...
02-03
據(jù)環(huán)球時報援引日本《產(chǎn)經(jīng)新聞》2日報道,自2024年12月下旬流感病例數(shù)創(chuàng)新高后,日本多地藥店表示已無用于治療感冒、發(fā)燒等疾病藥品的庫存。此外,一些過于擁擠的醫(yī)院也建議患者...
02-04
1月13日,由浙江大學杭州國際科創(chuàng)中心(以下簡稱“科創(chuàng)中心”)人形機器人創(chuàng)新研究院聯(lián)合鏡識科技有限公司、杭州凱達爾焊接機器人股份有限公司研發(fā)的四...
01-21
2015年,包括195個國家和歐盟在內(nèi)的各方共同簽署了《巴黎協(xié)定》,承諾將制定并實施一系列計劃,旨在將全球平均氣溫升幅嚴格限制在1.5℃以內(nèi)。然而,到了20...
01-21
  1月8日,蜜絲佛陀的天貓和抖音官方旗艦店均已暫停營業(yè)并下架全部商品。蜜絲佛陀母公司科蒂集...
01-21
  2月7日,來自遼寧省郵政管理局的監(jiān)測數(shù)據(jù)顯示,今年春節(jié)假期(1月28日至2月4日),遼寧省快遞業(yè)務(wù)攬收量1578....
02-09
新聞通訊員 木子春運承載著億萬游子對家鄉(xiāng)的眷戀與期盼,春節(jié)的腳步近了,歸心似箭的人們紛紛踏上返鄉(xiāng)之路。據(jù)交通運輸?shù)炔块T預計,今年春運全社會跨區(qū)域人員流動量將達到90億人...
01-22
  國泰航空飛往香港航班因故障折返美國波士頓  中新社香港1月20日電 (記者 韓星童)國泰航空20日回復中新社記者查詢時表示,國泰航空20日一架由美國波士頓前往香港的航班,...
01-21
1 月 30 日消息,韓國汽車制造商起亞此前宣稱其電動汽車“將于2025年1月”在北美支持使用特斯拉北美超充站充電,不過起亞公司現(xiàn)發(fā)布聲明,宣布相應適配計劃推遲至3月,為購...
01-31
2 月 2 日消息,上汽通用別克品牌宣布別克 GL8 陸尊 PHEV 八方來財版上市。該車以“八方來財”套件形式提供,GL8 陸尊 PHEV 全系款型均可免費選裝(限量 888 輛)。作為比...
02-02
《山寨人生》是最新上映的一部熱門電視劇,成功吸引了大量觀眾的關(guān)注,并在劇情和演員表現(xiàn)方面獲得了高度評價。這部劇圍繞“山寨人生一共有幾季”這一話題展開...
02-22
近日,??谑泄簿铸埲A分局宣布,知名導演鄭某某因涉嫌猥褻兒童罪已被刑事拘留。這一消息迅速在社交媒體上發(fā)酵,引發(fā)了廣泛關(guān)注和討論。據(jù)了解,鄭某某在電影《美人魚》中曾扮演過...
02-22
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕