亚马逊网络服务(AWS)已形成一个公共AWS COVID-19数据湖 ,这是与新型冠状病毒的传播及相关疾病有关的集中数据集。
AWS在4月8日表示,它正在与合作伙伴合作,免费提供不断增长的COVID-19数据集,并使其保持最新。 AWS已利用Johns Hopkins和《纽约时报》的COVID-19病例跟踪数据,Definitive Healthcare的病床可用性以及艾伦AI研究所的45,000多篇关于COVID-19和相关冠状病毒的研究文章为数据湖注入了种子。 当这些数据公开可用时,AWS将定期添加更多数据。
AWS COVID-19数据湖使实验人员可以快速对现有数据进行分析,而不必花费时间从所有可用数据源提取和整理数据。 AWS或第三方提供的工具可用于执行趋势和问题/答案分析,执行关键字搜索,构建机器学习模型或运行自定义分析以满足特定需求。 用户可以选择使用公共湖泊数据,将其与自己的数据合并或通过AWS Data Exchange订阅源数据集。
AWS设想当地卫生部门可以构建仪表板来跟踪感染并协作以部署重要资源,例如呼吸机或病床。 流行病学家可以补充自己的数据集和模型,以生成趋势和热点的预测。 在其4月8日的公告中 ,AWS提供了有关如何使用AWS COVID-19数据湖进行分析的示例。 要使用数据湖,您必须有权访问AWS帐户并具有创建AWS CloudFormation堆栈和AWS Glue资源的权限。
From: https://www.infoworld.com/article/3537593/aws-makes-covid-19-datasets-freely-available.html