美国化学文摘社(CAS)开放获取“CAS COVID-19抗病毒候选化合物构效关系数据集”
作为科学信息解决方案专业机构,美国化学文摘社(CAS)正与全球研究机构合作,应对COVID-19带来的复杂而又快速变化的挑战。作为美国化学会(ACS)的分支机构,CAS致力于践行美国化学会的使命,持续开发、开放提供一系列资源(包括数据、工具、专业咨询等)共同抗击COVID-19。
CAS就其独特的权威大数据进行挖掘整理,揭示数据间的关联,现发布开放获取“CAS COVID-19抗病毒候选化合物构效关系数据集”(CAS COVID-19 Antiviral Candidate SAR Dataset)。
点击下载:
此数据集来源为报道COVID-19蛋白、病毒和疾病靶点的文献、专利和其他公共资源,之前CAS在这些资源中提炼出9千多个物质构成了“CAS COVID-19抗病毒候选化合物数据集”,此次提供的29万条构效关系(SAR)数据正是基于这些物质。研究人员无需支付费用即可利用这些数据进行研究、数据挖掘、机器学习和数据分析。
本数据集采用.CSV格式,包含超过29万条构效关系数据,包括IC50、EC50和其他数值。能够便捷地将CSV文件导入到电子表格工具,如Microsoft Excel。数据按列排列:cas_rn、蛋白质、治疗用途、活性类型、活性值、活性单位、来源等。对于数据科学工具,例如可考虑使用Python编程语言的免费软件SciKit-Learn、pandas library dataframes等,将数据集部署到机器学习中。
欢迎广大师生使用!