數據共享
數據共享是使同一數據資源可供多個應用程序、用戶或組織使用的過程。這一過程包括技術、實踐、法律框架和文化要素,可以促進多個實體的安全數據訪問,而不損害數據完整性。簡單來說,數據共享就是在不同地方使用不同電腦、不同軟件的用戶可以讀取其他人的數據,進行各種操作和分析。早在20世紀50年代,就提出了數據共享的思想。1957年,國際科學技術聯合會建立了世界數據中心(WDL),使數據收集、存儲、交換和使用國際化。20世紀90年代,美國提出了數據共享的概念,建立了9個國家數據中心。21世紀,科學數據開放共享的國際氛圍日益成熟,一些國家以政府數據開放共享為核心,普遍開展數據開放共享實踐。
數據共享可以通過各種技術實現,包括云存儲、文件傳輸協議(FTP)、應用編程接口(API)、Web服務和專用協作平臺。許多國家組織、大學和公司都建立或參與了共享平臺,實現數據共享,可以讓更多的人充分利用現有的數據資源,減少數據采集、數據收集等重復性工作和相應的成本,專注于開發新的應用和系統集成。
發展歷史 編輯本段
大數據時代,數據的開發和再利用很大程度上依賴于數據共享。早在20世紀50年代,就提出了數據共享的思想。1957年,國際科學技術聯合會建立了世界數據中心(WDL),使數據收集、存儲、交換和使用國際化。美國從20世紀70年代開始建立數據自由的法律法規,90年代提出開放數據共享的概念,建立了9個國家數據中心。與此同時,國內很多科學家開始呼吁數據共享。2000年,中國氣象局在國內率先實現部門內數據共享,2001年,中國建成8個數據中心。自20世紀10年代以來,關于數據共享的研究一直備受關注。有研究者提出,通過數據共享,分析以前產生的數據,可以發現新的知識,數據共享是必然的。數據共享的概念開始吸引研究利益相關者的支持,如研究資助者、期刊出版商和科學家,他們形成了一股合力,將世界變成一個數據共享實體。一些國家以政府數據開放共享為核心,普遍開展了優秀有效的數據開放共享實踐,在企業數據開放共享方面也有“開放銀行”等創新探索實踐。
實現方法 編輯本段
數據共享可以通過各種技術實現,包括云存儲、文件傳輸協議(FTP)、應用編程接口(API)、Web服務和專用協作平臺。
云存儲:云存儲系統中的所有設備對用戶完全透明,任何地方的任何授權用戶都可以通過接入線纜與云存儲連接,訪問云存儲的數據。通過數據存儲空間,用戶可以將數據保存到設備中,計算機可以根據需要從各種來源讀取輸入數據,然后創建輸出,并保存到同一來源位置或其他存儲位置,以便用戶與他人共享數據。
網絡服務:Web服務技術是一種基于XML技術和現有及新興標準(或協議)的程序間通信模型。它使用統一的方法來描述、注冊和查詢服務。其主要目標是通過使用統一的標準來統一數據、消息和行為,使不同的系統可以跨平臺、相互兼容、無縫共享數據,而無需考慮具體的應用環境。
文件傳送協議:文件傳輸協議(FTP)是數據共享中最古老、應用最廣泛的協議之一,它使網站、計算機和其他設備能夠以有組織的方式交換數據,確保數據在傳輸過程中的完整性和安全性。它為客戶端和服務器端之間的數據傳輸提供了通道,并通過互聯網實現數據共享。
專用協作平臺:國家機關、企業和高校將通過建立或參與專門的協作平臺來實現數據共享,如微軟的Azure、中科院發布的“數據共享服務系統”、北京大學開發的“數據共享開發服務平臺”等。數據發布者通過數據共享平臺上傳數據資源,并選擇是否公開共享,該平臺支持所有允許的用戶瀏覽、查看、訂閱和下載。作為媒介,平臺可以存儲用戶上傳的代碼、數據、文本、圖形、圖像、應用程序或軟件。
應用程序界面:應用編程接口(API)是一組允許機器對機器通信的軟件指令和標準。這是一種安全的數據共享方法,允許應用程序之間自動共享數據。API通過自動更新信息節省了時間,也使信息更加可靠,因為所有信息都由單一來源管理,這就產生了開放性,使開放數據能夠以一致的方式通過多個來源共享。通過API可以隨時獲取數據,獲取的數據格式也比較靈活。
區塊鏈技術:區塊鏈技術是一種分布式賬本技術,由多方共同維護和去中心化。區塊鏈具有可追溯、不可篡改的特點,可以有效解決傳統數據共享帶來的單點故障,保護數據安全。區塊鏈的工作流程是:每一筆交易發生時,都會被記錄為一個數據“塊”,每個塊與它前后的塊相連,交易以塊的形式組合成一個不可逆的鏈條。
相互性原則:數據共享的原則是數據、元數據、產品和信息應完全公開共享,但應遵守國家或國際法律和政策,包括尊重適當的現有限制,并符合國際倫理研究行為標準。為研究、教育和公共使用而產生的數據和信息應在最短時間內免費提供,或不超過通信費,低收入用戶群體可免除通信費,以支持公平。
每個生成、共享和使用數據和元數據的人都是這些數據的管理者,并確保數據的真實性、質量和完整性得到保護。默認情況下,數據應該是開放的,并標記為“敏感”或“受限”,要處理的數據應按照數據管理員和生產者要求的安全性進行處理,并保持數據的完整性和機密性。
數據共享類型:數據共享的方法非常不同,涉及各種類型的參與者,并且具有不同的目標。數據共享模式因數據提供者而異,包括個人、私營公司、政府機構、非營利組織和研究機構。例如,兩個企業可以使用合同協議共享數據以促進大型項目的合作,或者多個個人可以通過獨立的組織共享數據以獲得財務利益。在ITIF發布的報告中,分為六種不同的模式,分別是數據共享伙伴關系、數據聯盟、數據信任、數據合作、聯邦數據分析和合作研發協議。
數據共享伙伴關系:數據共享伙伴關系涉及不同實體(如學術機構、研究機構、行業伙伴、個人消費者和政府機構)之間的協作,以共享和交換數據,從而開展研究、聯合開發新產品和加強循證決策。這些伙伴關系旨在利用多方的集體專業知識、資源和數據創新中心來解決復雜的問題并產生有價值的見解。此外,這種類型的數據共享安排通常需要明確的協議來界定數據訪問和使用權以及知識產權的所有權,具體特征根據所涉及的數據類型和合作性質而有所不同。
數據聯盟:數據聯盟允許組織集中他們的數據以獲得團體的利益。數據聯盟有一系列互惠共享協議,只有特定聯盟的成員才能訪問數據,聯盟成員通常需要做出貢獻。數據聯盟可以解決具體問題或一般性、持續性的信息交換,促進更多的數據共享和聚合。例如,臨床研究數據共享聯盟的成員包括生物制藥公司、學術機構、非營利組織和患者權益倡導者。這些團體聚集在世界各地,提供對臨床數據的集體訪問,并幫助研究人群多樣化。
數據信任:數據信托是一個供多個實體貢獻和訪問的組織,它是一個數據治理框架,管理、保護和共享數據,以代表個人和組織的商定目的。數據信托的核心是將數據權利委托給一個獨立的中介機構,即受托人,受托人與研究人員、私人公司和公共部門機構做出有利于數據主體的數據共享決策。數據信任為管理和使用匯總數據提供了結構和規則,并有助于向公眾釋放其價值。
數據合作:數據合作模式多用于公共服務領域,通常由基金會、私人公司或個人用戶管理和運營。數據提供者或數據擁有者自愿分享的數據,由數據合作社進行結構化和匿名化,然后由數據需求者運行算法產生價值。這種模式多對公共數據或科研開放,既能使數據需求者獲得足夠的數據樣本來訓練算法,又不會泄露數據提供者或數據所有者的個人隱私。
聯邦數據分析:聯合數據分析是一種允許在組織不能或不愿意共享數據時進行數據分析的方法。聯邦數據分析采用分布式數據處理方法。在這種方法中,數據在不同的位置進行分析,只有匯總的意見才會集中到一個位置。例如,由生物制藥公司勃林格殷格翰和醫療軟件公司Lifebit Biotechnology構建的可擴展聯合分析平臺可以從生物樣本數據庫數據中獲得基因組洞察。聯合分析高度保護了敏感生物醫學數據的隱私,并允許研究人員從單一數據存儲中獲得洞察力,并產生醫學創新。
合作研究與發展協議:合作R&D協議是政府和私營部門之間的伙伴關系,政府研究機構與私營部門伙伴共享數據,以促進R&D項目的商業化。根據這些協議,政府提供人員、服務、設施、知識產權、設備、數據等。敬合伙人。它允許私營部門的合作伙伴申請并保留專利,同時確保政府獲得商業產品的許可。例如,美國國家海洋和大氣管理局利用合作研發協議,招募IBM、微軟和AWS等私營公司開發解決方案,以提高數據利用率和訪問能力。
實現意義 編輯本段
數據共享程度反映了一個地區和國家的信息化發展水平。數據共享程度越高,信息化發展水平越高。實現數據共享可以使研究人員、研究資助者、數據倉庫、科學界和公眾受益,使更多的人能夠充分利用現有的數據資源,減少數據收集和數據采集的重復性工作和相應的費用,并專注于開發新的應用和系統集成,而不是重復現有的研究。
數據共享可以提高公眾的生活質量。一些城市在解決交通擁堵、看病難、應急處理等問題時,共享應用了以大數據、物聯網、云計算為支撐的智能技術。這些數據的共享使得信息的傳遞扁平化,提高了決策的科學性和準確性,提高了城市運行和基層治理的效率。
在公司治理方面,數據共享可以使企業發現重要的數據資產,從而增強員工的協作和生產力,企業可以通過團隊合作發現新的前景并獲得競爭優勢。
附件列表
詞條內容僅供參考,如果您需要解決具體問題
(尤其在法律、醫學等領域),建議您咨詢相關領域專業人士。