目的:利用爬取的疾病的数据,完成数据的相关处理
方法:
- GWAS cFDR
- 参考文献:[使用多效性cFDR方法改进对冠状动脉疾病和血压常见变异的检测](使用多效性cFDR方法改进对冠状动脉疾病和血压常见变异的检测 |科学报告 (nature.com))
- 条件错误发现率(cFDR),只需要相关性状/疾病的独立GWAS数据集的汇总统计结果。基于遗传多效性,通过合并两个GWAS数据集,将大大提高遗传位点的统计能力和识别能力。
相关函数
package
data.table数据读取
setwd()
- 设置路径需要提前创建一个存在的路径
fread()
- 读取大文件
- 用法:
xx <- fread("xx/xx/xx.txt", header = ?,)
names()
ls()
显示当前已有的所有遍历
rm()
清空变量
rm(list=ls())清空当前所有变量
merge()
- 合并两个数据框的数据,在于在两个不同的数据框中标识共同的列或行。
- 用法:merge(x, y, by=xxx, all=?)
问题
Winkler/GCST010723_buildGRCh37.tsv该路径下文件不存在library(GWAScFDR)该package无法导入- 报错:
A version of this package for your version of R might be avai7ab1e elsewhere- 处理措施:
library(BiocManager)结果:没有帮助 - 解决办法:从GitHub上导入GWAScFDR包,指令:
install.packages("devtools") devtools::install_github("KehaoWu/GWAScFDR")- devtools 已经安装后可以忽略此行
- GWAScFDR 为集成的包,其中包括:RColorBrewer ggplot2 等
- 处理措施: