-
PCA
主成份分析 (Principal Component Analysis, PCA) 是一种元分析技术 (其它常用的还有回归分析、聚类分析、因子分析等等), 由Karl Pearson于1901年发明。PCA的核心思想在于,在尽可能保留数据的差异的前题下,降低数据的维度,也就是抽象出更少的互不相关的变量来描述各数据。可以想象,数据集是一群在多维空间中的点,在保持这一群点的相对空间位置不变的情况下,旋转到一个新的坐标系(坐标轴就是各PC),使得各点在新的坐标轴上的坐标(投影)的方差最大,而投影方差最大的坐标轴即为PC1,其次为PC2,……,此可以通过此在线的演示增加理解。主成份分析可通过求取协方差矩阵的本征向量实现,本征值最大的本征向量即为PC1, 比如R的princomp函数采样的就是这种方法;也可通过奇异值分解(singular value decomposition,SVD)来实现,比如R的prcomp函数。
-
lncRNA筛选
lncRNA的筛选是lncRNA分析流程中的关键步骤
梳理一下流程中的筛选步骤,还有4种编码潜能预测软件
-
碱基含量分布
关于碱基含量分布 (Per Base Sequence Content)图在FastQC帮助文档中有比较详细的说明,这里结合个人的见解浅析。
-
切克闹——初识滑板
-
ggplot2 画图笔记
-
工作状态和惰性
-
转正——以后要记得常更新
-
linux之shell
本页一定程度上参考了Vivek Gite及其他贡献者
-
入职一个月
-
lncRNA之命令行
Linux系统是一类自由开源的电脑操作系统,因其内核为Linux而得名。内核是一个电脑程序,组成操作系统的核心,链接系统硬件和应用程序。Linux系统是自由和开源的,有很多的发行版本。因为Linux免费、开源、稳定性好、安全性高、有活力的社区支持,绝大多数生物信息工具均是基于Linux系统的。