醫學大數據的來源

醫學大數據的來源

醫學大數據的一個簡單定義是“與患者健康護理和健康相關的數據總量”(Raghupathi 2014)。 但是這些類型的數據到底是什麼,它們來自哪裡呢?

以下是衛生保健提供者,研究人員,付款人,決策者和行業感興趣的大數據的類型和來源的廣泛概述。

這些類別不是相互排斥的,因為相同的數據可以來源於各種來源。

這份清單也不是詳盡無遺的,因為大數據分析的實際應用肯定會繼續擴大。

臨床信息系統

這些是醫療保健提供者習慣觀看的傳統臨床數據來源。

來自付款人的索賠數據

公共支付者(例如醫療保險)和私人支付者擁有關於其受益人的大量索賠數據庫。 一些健康保險公司現在也提供激勵措施來分享您的健康數據。

研究研究

研究數據庫包含有關研究參與者,實驗治療和臨床結果的信息。 大型研究通常由製藥公司或政府機構贊助。 個性化醫療的應用是根據臨床試驗數據中的模式,將個體患者與有效治療相匹配。

這種方法超越了應用循證醫學原則,醫療保健提供者通過該原則確定患者是否與試驗參與者俱有廣泛的特徵(例如年齡,性別,種族,臨床狀態)。 通過大數據分析,可以根據更加細化的信息(如患者癌症的基因譜)來選擇治療方法(見下文)。

臨床決策支持系統(CDSS)也發展迅速,現在代表了人工智能(AI)在醫學領域的重要組成部分。

他們使用患者數據來幫助臨床醫生進行決策,並經常與EHR結合使用。

遺傳數據庫

人類遺傳信息儲存庫繼續迅速積累。 自從人類基因組計劃於2003年完成以來,人類DNA測序的成本已經下降了百萬倍。 個人基因組計劃(PGP)由哈佛醫學院於2005年推出,旨在對來自世界各地的100,000名志願者的全基因組進行測序和公佈。 PGP本身就是大數據項目的一個主要例子,因為數據龐大且種類繁多。

個人基因組包含大約100千兆字節的數據。 除了對基因組進行測序之外,PGP還從EHRs,調查和微生物組譜中收集數據。

許多公司在商業基礎上為健康,個人特徵和藥物遺傳學提供直接對消費者的基因測序

這些個人信息可能被征服到大數據分析。 例如,截至2013年11月22日,23andMe停止向新客戶提供與健康相關的遺傳報告,以遵守美國食品和藥物管理局的規定。 然而,在2015年,該公司開始再次提供某些遺傳唾液測試的健康成分,這次是經過FDA批准的。

公共記錄

政府保存有關健康事件的詳細記錄,如移民,婚姻,出生和死亡。 自1790年以來,美國人口普查每十年收集大量信息。截至2013年,人口普查統計網站擁有3700億個單元,每年增加約110億個單元。

網絡搜索

Google和其他網絡搜索提供商收集的網頁搜索信息可以提供與人口健康相關的實時見解。 但是,通過將它與傳統的健康數據源相結合,可以提高來自網絡搜索模式的大數據的價值。

社交媒體

Facebook,Twitter和其他社交媒體平台可全天候生成豐富多彩的數據,從而可以查看用戶的位置,健康行為,情緒和社交互動。 社交媒體大數據在公共衛生領域的應用被稱為數字疾病檢測或數字流行病學。 例如,Twitter已被用於分析普通人群中的流感流行。

在賓夕法尼亞大學開始的世界福祉項目是研究社交媒體以更好地了解人們的經歷和健康的另一個例子。 該項目匯集了心理學家,統計學家和計算機科學家,他們分析在線互動時使用的語言,例如在Facebook和Twitter上撰寫狀態更新時。 科學家正在觀察用戶的語言與他們的健康和幸福之間的關係。 自然語言處理和機器學習的進步正在幫助他們的努力。 賓夕法尼亞大學最近發表的一篇文章研究了通過分析社交媒體來預測精神疾病的方法。 通過研究我們對互聯網的使用,似乎可以檢測到抑鬱症和其他心理健康狀況的症狀。 科學家希望將來這些方法將能夠更好地識別和幫助處於危險中的個體。

物聯網(IoT)

大量與健康有關的信息也被收集並存儲在移動設備和家用設備上

金融交易

患者的信用卡交易包含在Carolinas HealthCare系統使用的預測模型中,以識別重新入院的高風險患者。 總部位於夏洛特的衛生保健提供商利用大數據將患者分成不同的群體,例如根據疾病和地理位置。

道德和隱私的含義

需要強調的是,在某些情況下,收集和獲取醫療保健數據時可能會對道德和隱私產生重大影響。 新的大數據來源可以提高我們對影響個人和人群健康的因素的理解,但是,需要認真考慮和監控不同的風險。 現在也已經認識到,以前被視為匿名的數據可以重新識別。 例如,哈佛數據隱私實驗室的Latanya Sweeney教授審查了參與個人基因組計劃的1,130名志願者。 她和她的團隊根據他們共享的信息(郵編,出生日期,性別)能夠正確地命名42%的參與者。 這些知識可以提高我們對潛在風險的認識,並幫助我們做出更好的數據共享決策。

> 來源:

> Conway M,O'Connor D.社交媒體,大數據和心理健康:當前的進展和道德影響。 2016 年心理學最新觀點 ; 9:77-82。

> Fernandes L,O'Connor M,Weaver V.大數據,更大的結果。 Journal of The American Health Information Management Association 2012; 83(10):38-43

> Guntuku S,Yaden D,Kern M,Ungar L,Eichstaedt J. 在社交媒體上檢測抑鬱症和精神疾病:綜合評論 2017 年行為科學目前的觀點 ; 18:43-49。

> Lazer D,Kennedy R,King G,Vespignani A. 谷歌流感的寓言:大數據分析陷阱 科學 2014; 343(6176):1203年至1205年。

> Raghupathi W,Raghupathi V.醫療領域的大數據分析:承諾和潛力al。 2014年健康信息科學與系統 ; 2:3。

> Sweeney L,Abu A,Winn J. 按名稱識別個人基因組項目的參與者 哈佛大學。 數據保密實驗室。 白皮書1021-1。 2013年4月24日。