NEJM AI刊登重磅研究,大型語言模型在腫瘤知識上的效能驗證。

更新於 2024/04/28閱讀時間約 3 分鐘
raw-image
raw-image


運用網路上的資訊訓練大型語言模型是一個重要方法,然而對於資訊正確性十分重要的醫學領域,大型語言的知識來源是否正確,是非常重要的一件事。因此,這篇重磅級的研究,著眼於探討不同醫學主題中,大型語言模型對於知識所顯現的性能差異。


這篇研究顯示

1. 這些LLMs的訓練知識,主要來自網路上的數據庫。

2. 這些模型在基礎主題 (癌症生物學、醫學物理學和醫學統計學)上展示出比臨床腫瘤學更高的準確性,除了LLaMA 65B之外。

3. 目前的大型語言模型具有一定程度的不準確性。而共同的源頭,指向了訓練集中包含了醫學上「不準確的資訊」。

4. 若以選擇題考試驗證大型語言模型的效能,「這些模型在目前的形式中未能達到人類專家所展示的表現水平,但它們仍然提供了有價值的建議,可以補充現有的護理措施」。


個人淺見:

1. 應用到醫學領域時,應該針對模型進行專業領域的fine tune。

2. 同時應該提供醫學領域專家在使用時,能夠同步查詢到原文以進行佐證依據。

3. 大型語言模型的語文能力即便流程,但是在自動生成過程中,仍然會因為內文的資訊 缺乏,而自行補充不正確的資料(俗稱幻覺)。

4. 幻覺問題是 AI 領域研究者或者實踐者應該要重視的議題,除了可以用RAG的方式進行處理之外,更重要的是,如何運用UI/UX介面設計工具協助使用者進行檢視,並且有效地使用。


為什麼要做這個研究?

隨著AI的普及和進步,越來越多的醫療專業人士使用AI工具協助,特別是大型語言模型(LLMs),以快速地獲取醫學資訊並輔助臨床決策。在臨床腫瘤學領域,由於需要不斷更新的臨床試驗數據,這些模型的應用則更為重要。因此,這篇學術論文針對大型語言模型在臨床腫瘤學應用時的比較評估。該研究主要探討了大型語言模型(LLMs)在解決腫瘤學問題上的效能,並對不同的模型進行了系統的比較與分析。尤其是針對腫瘤學領域中的幾種主流LLMs進行評估,包括GPT-3.5、GPT-4、PaLM 2、Claude-v1和LLaMA 1,並對它們在解決2044個腫瘤學問題上的表現進行比較。



這個研究怎麼發展

這篇研究的設計包括對五種公開的LLMs進行綜合評估。這些LLM被獨立測試,每個模型都需要回答一套由腫瘤學、手術腫瘤學、放射腫瘤學、醫學統計、醫學物理學和癌症生物學等領域組成的2044個問題。

在研究的方法中,每個模型的提示(Prompt)都獨立呈現,並重複三次以評估輸出的一致性。此外,模型性能還與新開發的驗證問題集進行了對比,以消除訓練數據重疊的風險。



這篇研究的亮點

  1. 這篇研究不僅揭示了不同LLMs在腫瘤學問題解答上的性能差異,還發現了這些模型在處理不同臨床腫瘤學子領域問題時的表現不一。
  2. 研究結果顯示,相對於人類基準(2013和2014年的考試結果),GPT-4是唯一一個表現超過第50百分位的模型。
  3. 該研究還探討了增強模型回答信心的策略,例如模型選擇、提示重複和信心自評等,這些策略有助於醫療專業人員和患者更有效地利用LLMs。
  4. 本研究的成果不僅提供了LLMs在臨床腫瘤學應用中的實證支持,也為進一步的研究和發展指明了方向。


文章來源:NEJM AI:Comparative Evaluation of LLMs in Clinical Oncology


M-Insight : AI科技創新 分享有關人工智慧對於產業與企業的實務應用、研究成果、產業情報等資訊,歡迎人工智慧、醫藥生技、科技管理領域的同好、專家學者、醫師、研究人員與業界朋友一同參與交流。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
本篇文章分享在NEJM上的重磅研究,利用AI技術從生物醫學訊號中推斷糖尿病患者在駕駛時的低血糖狀態。該研究填補了低血糖即時監測的缺口,提出了非侵入性的低血糖檢測解決方案。透過分析駕駛行為和視線/頭部運動數據,提取特徵並開發機器學習模型,成功偵測低血糖狀態。研究結果具有非常重要的醫療和交通安全意義。
近年來,人工智能與機器學習(AI/ML)技術快速發展,醫療設備數量呈現明顯增長趨勢。本文根據世界衛生組織國際臨床試驗註冊平臺(ICTRP)的臨床試驗數據進行全面分析,瞭解AI/ML SaMD的發展趨勢及地理分佈特徵,並強調了國際合作臨床試驗的必要性。
多模態資料與模型目前在人工智慧領域是主流話題之一。多模態對於醫學研究之所以重要,是因為它能夠提供疾病的全面觀點,從來自不同來源和類型的數據(如醫學影像、文字病歷、臨床數據與生理訊號等)結合起來,使得醫學偵測與診斷更加準確和全面。
這份研究分享了使用AI進行醫療研究的流程,介紹了三角纖維軟骨複合體(TFCC)的定位、重要性,以及如何應用MRI和AI協助進行影像判讀進而降低患者痛楚。研究使用兩種卷積神經網絡進行深度學習模型的設計與訓練以預測TFCC損傷的機率。最後得出結論MRNet 框架較能夠檢測TFCC損傷並協助醫師準確診斷。
本篇文章主要介紹一位菲律賓學者對使用大型語言模型產生文章的想法,說明如何利用AI技術進行學術寫作,以及提示工程的重要性。文中介紹了許多在醫學領域的應用以及學術寫作中的多種提示類型。文章還提到了。本文將會給讀者帶來對AI在學術寫作領域的啟發。
本文章介紹了Nature期刊中關於蛋白質序列的深度學習模型以及未來應用的重要性。蛋白質設計的應用從生物醫學到環境科學等各個領域解決問題方面具有巨大潛力。
本篇文章分享在NEJM上的重磅研究,利用AI技術從生物醫學訊號中推斷糖尿病患者在駕駛時的低血糖狀態。該研究填補了低血糖即時監測的缺口,提出了非侵入性的低血糖檢測解決方案。透過分析駕駛行為和視線/頭部運動數據,提取特徵並開發機器學習模型,成功偵測低血糖狀態。研究結果具有非常重要的醫療和交通安全意義。
近年來,人工智能與機器學習(AI/ML)技術快速發展,醫療設備數量呈現明顯增長趨勢。本文根據世界衛生組織國際臨床試驗註冊平臺(ICTRP)的臨床試驗數據進行全面分析,瞭解AI/ML SaMD的發展趨勢及地理分佈特徵,並強調了國際合作臨床試驗的必要性。
多模態資料與模型目前在人工智慧領域是主流話題之一。多模態對於醫學研究之所以重要,是因為它能夠提供疾病的全面觀點,從來自不同來源和類型的數據(如醫學影像、文字病歷、臨床數據與生理訊號等)結合起來,使得醫學偵測與診斷更加準確和全面。
這份研究分享了使用AI進行醫療研究的流程,介紹了三角纖維軟骨複合體(TFCC)的定位、重要性,以及如何應用MRI和AI協助進行影像判讀進而降低患者痛楚。研究使用兩種卷積神經網絡進行深度學習模型的設計與訓練以預測TFCC損傷的機率。最後得出結論MRNet 框架較能夠檢測TFCC損傷並協助醫師準確診斷。
本篇文章主要介紹一位菲律賓學者對使用大型語言模型產生文章的想法,說明如何利用AI技術進行學術寫作,以及提示工程的重要性。文中介紹了許多在醫學領域的應用以及學術寫作中的多種提示類型。文章還提到了。本文將會給讀者帶來對AI在學術寫作領域的啟發。
本文章介紹了Nature期刊中關於蛋白質序列的深度學習模型以及未來應用的重要性。蛋白質設計的應用從生物醫學到環境科學等各個領域解決問題方面具有巨大潛力。
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
AI是沒有「心」的,他能取代的就是那些僅僅在用「頭腦」的工作。頭腦是台機器,他擅長一切理性的⋯⋯計算、邏輯、資訊。但頭腦沒有心能夠去體會美,沒有心能夠去體會愛,AI可以畫出看似美的畫,但是他們並不是真的知道美;可以說出看似理解愛的文字,但是並不是真的理解愛
https://www.podbean.com/site/EpisodeDownload/PB1487939DQZY6 來讀讀NEJM AI Grand Rounds吧! NEJM AI Grand Rounds Technology An Iron Fist in a Velvet Glo
Thumbnail
無論你是想要在Instagram上撰寫出引人入勝的文案,或者要在職場上發揮巧思,透過ChatGPT、AI指令及各種範本框架的方法,讓你的文案寫作效率大幅提升。除此之外,該文依據文章框架與流程分步引導,並細緻列舉了使用範例以及指令的技巧,讓讀者在瞭解運作原理的同時,更上手地運用相關工具。
Thumbnail
AI 大戰愈演愈烈,ChatGPT 更成為 2023 年首個破億使用者的應用,再加上投資其母公司 OpenAI 的 Microsoft 也運用 GPT-4 打造 Bing Chat,很多焦點就會放在長期由 Google 壟斷的搜尋引擎市場版圖是否可能重新洗牌。Google 的地位真有可能受到動搖嗎?
Thumbnail
Llama 2介紹 下一代開源的大型語言模型的 Llama 2 可以免費用於研究和商業用途。 1. 開源的大型語言模型: Llama 2是一個開源的大型語言模型,這意味著它對於研究人員和企業來說是一個極具價值的資源。開源模型可以讓我們深入了解其內部運作,並且可以根據特定需求進
Thumbnail
文摘:我最近採用了新的寫作方式,利用AI將我錄製的播客內容轉換成文章形式。這個過程需要使用兩套AI程式,分別是雅婷語音轉逐字稿和ChatGPT。以往直接將語音轉換成逐字稿是不實用的,因為缺乏邏輯結構,需要耗費大量時間整理。但現在有了ChatGPT,它可以將逐字稿轉換成有邏輯結構的文章初稿,我再進行修
Thumbnail
文摘: 我觀察了美股的AI浪潮,特別關注NVIDIA股價的波動。有人在這股浪潮中賺了很多錢,但我自己的投入並不大,只是做了一些小型的實驗。我購買了TQQQ,一個3倍槓桿的指數型ETF。 大綱: 1.這股浪潮很大,快樂追浪人? 2.QQQ的慣性 3.結論 這股浪潮很大,快樂追浪人? 最近美股的AI浪潮
Thumbnail
小望是一個59800日圓的充氣娃娃,有一天她突然有了自己的意識,像是小女孩一樣探索著世界的千奇百怪,她被她的主人愛著,當主人知道她有心以後卻說:「那真是太麻煩了。」而她也愛上了另一個人。是枝裕和的《空氣人形》像是《雲端情人》加上《玩具總動員》,當人們深愛的物品有了靈魂,許多人類更顯得「沒有心」。
Thumbnail
當世界消失的盡頭 宇宙也跟著逃亡了 只留下我和我給你的承諾 於是 燈亮了 火點著了 夜睡了 你卻又醒了 還有任何 甚麼 值得 遺憾 呢 只知道活著 只知道死去 在每個醒來的瞬間 在每個嘆息留下的瞬間 你輕輕地走了 正如我悄悄的來 徒留滿地的 是沉默 還是樂園 這人世間的一切 是給你的 還是給我的
Thumbnail
李白的月下獨酌說:「舉杯邀明月,對影成三人。」
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
AI是沒有「心」的,他能取代的就是那些僅僅在用「頭腦」的工作。頭腦是台機器,他擅長一切理性的⋯⋯計算、邏輯、資訊。但頭腦沒有心能夠去體會美,沒有心能夠去體會愛,AI可以畫出看似美的畫,但是他們並不是真的知道美;可以說出看似理解愛的文字,但是並不是真的理解愛
https://www.podbean.com/site/EpisodeDownload/PB1487939DQZY6 來讀讀NEJM AI Grand Rounds吧! NEJM AI Grand Rounds Technology An Iron Fist in a Velvet Glo
Thumbnail
無論你是想要在Instagram上撰寫出引人入勝的文案,或者要在職場上發揮巧思,透過ChatGPT、AI指令及各種範本框架的方法,讓你的文案寫作效率大幅提升。除此之外,該文依據文章框架與流程分步引導,並細緻列舉了使用範例以及指令的技巧,讓讀者在瞭解運作原理的同時,更上手地運用相關工具。
Thumbnail
AI 大戰愈演愈烈,ChatGPT 更成為 2023 年首個破億使用者的應用,再加上投資其母公司 OpenAI 的 Microsoft 也運用 GPT-4 打造 Bing Chat,很多焦點就會放在長期由 Google 壟斷的搜尋引擎市場版圖是否可能重新洗牌。Google 的地位真有可能受到動搖嗎?
Thumbnail
Llama 2介紹 下一代開源的大型語言模型的 Llama 2 可以免費用於研究和商業用途。 1. 開源的大型語言模型: Llama 2是一個開源的大型語言模型,這意味著它對於研究人員和企業來說是一個極具價值的資源。開源模型可以讓我們深入了解其內部運作,並且可以根據特定需求進
Thumbnail
文摘:我最近採用了新的寫作方式,利用AI將我錄製的播客內容轉換成文章形式。這個過程需要使用兩套AI程式,分別是雅婷語音轉逐字稿和ChatGPT。以往直接將語音轉換成逐字稿是不實用的,因為缺乏邏輯結構,需要耗費大量時間整理。但現在有了ChatGPT,它可以將逐字稿轉換成有邏輯結構的文章初稿,我再進行修
Thumbnail
文摘: 我觀察了美股的AI浪潮,特別關注NVIDIA股價的波動。有人在這股浪潮中賺了很多錢,但我自己的投入並不大,只是做了一些小型的實驗。我購買了TQQQ,一個3倍槓桿的指數型ETF。 大綱: 1.這股浪潮很大,快樂追浪人? 2.QQQ的慣性 3.結論 這股浪潮很大,快樂追浪人? 最近美股的AI浪潮
Thumbnail
小望是一個59800日圓的充氣娃娃,有一天她突然有了自己的意識,像是小女孩一樣探索著世界的千奇百怪,她被她的主人愛著,當主人知道她有心以後卻說:「那真是太麻煩了。」而她也愛上了另一個人。是枝裕和的《空氣人形》像是《雲端情人》加上《玩具總動員》,當人們深愛的物品有了靈魂,許多人類更顯得「沒有心」。
Thumbnail
當世界消失的盡頭 宇宙也跟著逃亡了 只留下我和我給你的承諾 於是 燈亮了 火點著了 夜睡了 你卻又醒了 還有任何 甚麼 值得 遺憾 呢 只知道活著 只知道死去 在每個醒來的瞬間 在每個嘆息留下的瞬間 你輕輕地走了 正如我悄悄的來 徒留滿地的 是沉默 還是樂園 這人世間的一切 是給你的 還是給我的
Thumbnail
李白的月下獨酌說:「舉杯邀明月,對影成三人。」