如何对python文件进行源码编译

python脚本的源码文件是.py为后缀,可通过源码编译的方法将源码文件编译为二进制文件

  • 使用py_compile模块进行编译
1
2
3
#!/usr/bin/python
import py_compile
py_compile.compile('test.py')

阅读全文

awk使用简介

awk是一种优良的流氏文本处理工具,在使用单行命令的时候十分方便,在进行简单文本操作的时候无需在使用perl或python编写脚本,当然perl的单行命令也足够强大,只是使用习惯不同而已;相比于grep和sed来说awk可以更好对某一分割的区域进行筛选及操作。


  • F 用于识别分隔符

阅读全文

Linux下cut,sort,split使用简介

Shell下cut, sort, split使用简介


  • cut 主要用于文件切割

阅读全文

Linux系统下打包及压缩工具的用法

Linux系统下常用的压缩和打包工具

压缩工具

  • gzip
1
2
3
4
5
6
7
8
9
#压缩
gzip file
#添加压缩比例
gzip -n file
#n为1-9
#解压缩
gzip -d file.gz
#查看压缩内容
bcat file.gz

阅读全文

vim使用简介

vim的三种模式:

  • 一般模式
  • 编辑模式
  • 命令模式

阅读全文

Linux系统下TASSEL5.0的安装及使用

之前做SSR和简化测序都是用的桌面化的TASSEL进行运算,对于做关联分析的初学者非常简单,十分好入门。但是关于命令行的操作就要麻烦一些,但是运算起来不像GAPIT那样消耗大量的内存,下面做一些简单的示例。


安装

Java JDK 8.0的安装

    阅读全文

    Centos如何安装JDK8.0

    阅读全文

    GWAS分析之SNP过滤

    1. 缺失比例(Missing rates):( GENO > 0.05 )
      Shortly we will apply more stringent criteria, such that GENO > 0.05. In this case, 0.05*89 = 4.45 samples, meaning that if a SNP is missing in 4.45 more more samples, that SNP will be removed from the dataset.

    阅读全文

    vcftools使用说明

    vcftools是一种可以对VCF文件和BCF文件进行格式转换及过滤的工具,其中很多过滤及计算功能我们可以自己使用perl或者python编写脚本实现,但都不如这个工具的运算速度快。目前官网的版本是vcftools v0.1.13。

    基本参数

    输入参数

      阅读全文

      VCF文件格式解读

      VCF文件全称为Variant Call Format,通常为GATK和Samtools软件处理所得到。在没接触过的人乍一看确实很吓人,但是只要理解了其中的一些关键tag再进行过滤就可以有的放矢了,下面以如下例子做讲解。

      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      11
      12
      13
      14
      15
      16
      17
      18
      19
      20
      21
      22
      23
      ##fileformat=VCFv4.0
      ##fileDate=20090805
      ##source=myImputationProgramV3.1
      ##reference=1000GenomesPilot-NCBI36
      ##phasing=partial
      ##INFO=<ID=NS,Number=1,Type=Integer,Description="Number of Samples With Data">
      ##INFO=<ID=DP,Number=1,Type=Integer,Description="Total Depth">
      ##INFO=<ID=AF,Number=.,Type=Float,Description="Allele Frequency">
      ##INFO=<ID=AA,Number=1,Type=String,Description="Ancestral Allele">
      ##INFO=<ID=DB,Number=0,Type=Flag,Description="dbSNP membership, build 129">
      ##INFO=<ID=H2,Number=0,Type=Flag,Description="HapMap2 membership">
      ##FILTER=<ID=q10,Description="Quality below 10">
      ##FILTER=<ID=s50,Description="Less than 50% of samples have data">
      ##FORMAT=<ID=GT,Number=1,Type=String,Description="Genotype">
      ##FORMAT=<ID=GQ,Number=1,Type=Integer,Description="Genotype Quality">
      ##FORMAT=<ID=DP,Number=1,Type=Integer,Description="Read Depth">
      ##FORMAT=<ID=HQ,Number=2,Type=Integer,Description="Haplotype Quality">
      #CHROM POS ID REF ALT QUAL FILTER INFO FORMAT NA00001 NA00002 NA00003
      20 14370 rs6054257 G A 29 PASS NS=3;DP=14;AF=0.5;DB;H2 GT:GQ:DP:HQ 0|0:48:1:51,51 1|0:48:8:51,51 1/1:43:5:.,.
      20 17330 . T A 3 q10 NS=3;DP=11;AF=0.017 GT:GQ:DP:HQ 0|0:49:3:58,50 0|1:3:5:65,3 0/0:41:3
      20 1110696 rs6040355 A G,T 67 PASS NS=2;DP=10;AF=0.333,0.667;AA=T;DB GT:GQ:DP:HQ 1|2:21:6:23,27 2|1:2:0:18,2 2/2:35:4
      20 1230237 . T . 47 PASS NS=3;DP=13;AA=T GT:GQ:DP:HQ 0|0:54:7:56,60 0|0:48:4:51,51 0/0:61:2
      20 1234567 microsat1 GTCT G,GTACT 50 PASS NS=3;DP=9;AA=G GT:GQ:DP 0/1:35:4 0/2:17:2 1/1:40:3

      阅读全文