1. PCA

    主成份分析 (Principal Component Analysis, PCA) 是一种元分析技术 (其它常用的还有回归分析、聚类分析、因子分析等等), 由Karl Pearson于1901年发明。PCA的核心思想在于,在尽可能保留数据的差异的前题下,降低数据的维度,也就是抽象出更少的互不相关的变量来描述各数据。可以想象,数据集是一群在多维空间中的点,在保持这一群点的相对空间位置不变的情况下,旋转到一个新的坐标系(坐标轴就是各PC),使得各点在新的坐标轴上的坐标(投影)的方差最大,而投影方差最大的坐标轴即为PC1,其次为PC2,……,此可以通过此在线的演示增加理解。主成份分析可通过求取协方差矩阵的本征向量实现,本征值最大的本征向量即为PC1, 比如R的princomp函数采样的就是这种方法;也可通过奇异值分解(singular value decomposition,SVD)来实现,比如R的prcomp函数。


  2. lncRNA筛选

    lncRNA的筛选是lncRNA分析流程中的关键步骤
    梳理一下流程中的筛选步骤,还有4种编码潜能预测软件


  3. 碱基含量分布

    关于碱基含量分布 (Per Base Sequence Content)图在FastQC帮助文档中有比较详细的说明,这里结合个人的见解浅析。


  4. 切克闹——初识滑板


  5. ggplot2 画图笔记


  6. 工作状态和惰性


  7. 转正——以后要记得常更新


  8. linux之shell

    本页一定程度上参考了Vivek Gite及其他贡献者


  9. 入职一个月


  10. lncRNA之命令行

    Linux系统是一类自由开源的电脑操作系统,因其内核为Linux而得名。内核是一个电脑程序,组成操作系统的核心,链接系统硬件和应用程序。Linux系统是自由和开源的,有很多的发行版本。因为Linux免费、开源、稳定性好、安全性高、有活力的社区支持,绝大多数生物信息工具均是基于Linux系统的。