beyond
粗滤估计我的街健记录应该是从2018年春天开始的,当时是大二下,断断续续竟然都快3年了! 2020-11-9 23:00
2020年之前(原帖)
2018年07月
2018-07-22 俯卧撑100 引体20
2018-07-23 俯卧撑110 引体向上30
2018-07-24 100俯卧撑35引体
2018-07-25 100俯卧撑35引体向上
2018-07-27 40引体向上
2018-07-28 43引体向上
2018-07-29 20引体向上
2018-07-30 20引体向上
2018-07-31 引体向上12 8 9 8 7 😊
2018年08月
2018-08-04 引体向上 11 10 9 8 7 2个借力双力臂
2018-08-05 11 5 8 8 7
2018-08-06 12 10 8 8 7
2018-08-07 今天 100俯卧撑
2018-08-08 12 8 9 7 5 6
2018-08-09 11 8 8 8 7
2018-08-10 100俯卧撑
2018-08-1 ...
ServerStatus
服务器探针
使用的源码地址
- ServerStatus中文版
- ServerStatus-HostLoc
其中客户端和web主要在ServerStatus-HostLoc的基础上稍作修改,因为ServerStatus中文版中有月流量统计功能,所以使用它做服务端
原理
整个系统共包括三个部分:
客户端
服务器
web
客户端
这个是运行在想要监控的各个服务器上的,主要功能是采集各个客户端(服务器)上的。运行状态,将这些内容发送给服务端。
因为这两个版本略有差别,所以我将客户端ip连接数的key值,修改成了load_1(在服务端这个key值应该接收到的内容是1分钟内的平均负载),然后将ip连接数获取位置的tcp6改为tcp(ipv6 or ipv4 ?)
服务端
服务端运行在你想要部署你的网站的那台服务器上,主要功能是接受客户端发送来的数据,生成json格式的数据,然后把这些数据放到web网站的文件夹内。
一台主机既可以做服务端又可以当客户端
web
这个就是我们能看到的监控页面了,这个其实是个没有后端的静态的页面,主要的动态效果靠前端js实现,主要功能是使用前端js解析 ...
DAGCON
git clone https://github.com/PacificBiosciences/pbdagcon.git
cd pbdagcon
修改 makefile中25行, cd blasr_libcpp; NOHDF=1 NOPBBAM=1 python2.7 configure.py
查看自己python默认版本,如果是3.x 要使用python2.X 运行 config.py
但直接运行会报错
zip2: (stdin) is not a bzip2 file.
tar: Child returned status 2
tar: Error is not recoverable: exiting now
原因是原来文件的连接已经失效,需要我们手动去下载
cd src/cpp/third-party
下载boost库 wget -O boost_1_58_0.tar.bz2 http://sourceforge.net/projects/boost/files/boost/1.58.0/boost_1_58_0.tar.bz2/download
解压boost库 su ...
Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation
Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation
Abstract
对于 SMS read,准确高效的组装大的重复块和密切相关的单倍体仍然具有挑战性。CANU 包含新的 overlapping 和 assembly 策略,包含 tf-idf weighted MinHash 和 构建稀疏组装图可以避免折叠发散的重复区域和单倍体。
Introduction
有时基因的重复区域可能会比 overlap 区域的长度长,这会导致基因重建具有不确定性,并组装会碎片化。Parametric Complexity of Sequence Assembly: Theory and Applications to Next Generation Sequencing 有两个方法能克服这个基础的限制:增加有效的 read 长度或者基于拷贝的特异性变体分离不精确的重复。
本文的目标是重新构建整个基因组,着重于分层策略,它能够生成最具有连续性的从头组装。分层方 ...
Phased diploid genome assembly with single-molecule real-time sequencing
Phased diploid genome assembly with single-molecule real-time sequencing
仅代表个人理解,如果有不准确的欢迎指正
可能会用到的知识点
等位基因!!!!!!
SNP 单核苷酸多态性 SingleNucleotide Polymorphism 例如,对于某种生物,同一位置基因组片段一部分为AAGC CTA,另一部分为AAGC T TA,则认为此处存在SNP、两种基因型属于等位基因。
VS 结构体变异 Structural variation 生物染色体上结构的变异,多指涉长度介于1Kb与3Mb之间的序列大于单核苷酸多态性并且小于染色体畸变
Main
单分子实时测序技术 Single-molecule real-time (SMRT) 可以为哺乳动物提供高连续性的组装,long read 可以横跨多个重复区域,和帮助解决复杂的双倍体基因,本文提供了 FALCON 一个双倍体敏感的 long read 组装工具,FALCON-Unzip 一个相关的单倍体解析工具,用正确的同源染色体来组装代表具有 正确 定相 ...
MECAT: fast mapping, error correction, and de novo assembly for single-molecule sequencing reads
MECAT: fast mapping, error correction, and de novo assembly for single-molecule sequencing reads
仅代表个人理解,如果有不准确的欢迎指正
可能会用到的知识点
SMS:single-molecule sequencing 单分子测序技术
mapping:只提供read比对的参考序列上的位置信息;alignment:不仅提供位置信息,还有他们的实际位点和参考位点之间的匹配、不匹配、插入或删除的关系
global alignment :需要比对整个查询序列,查询序列在参考序列上的比对结果可能会不连续,一般用来比较同源基因,或者基因的差异性
local alignment :查找最能匹配上参考序列的局部区域,比对上的结果可能是查询序列的子序列,
Chimeric reads : occur when one sequencing read aligns to two distinct portions of the genome with little or no overlap. Chi ...
获取JD_COOKIE
在线扫码获取京东cookie
浏览器获取京东cookie教程1
以下浏览器都行
Chrome浏览器
新版Edge浏览器
国产360,QQ浏览器切换到极速模式
操作步骤
电脑浏览器打开京东网址 https://m.jd.com/
按键盘F12键打开开发者工具,然后点下图中的图标
此时是未登录状态(使用手机短信验证码登录),如已登录请忽略此步骤
使用手机短信验证码登录(此方式cookie有效时长大概31天,其他登录方式比较短)
登录后,选择Network,有很多链接的话点箭头这里清空下
然后再点我的,链接就变少了
点第一个链接(log.gif)进去,找到cookie,复制出来,新建一个TXT文本临时保存一下,下面需要用到
我们需要从获取的cookie中找到pt_pin=xxxx;和 pt_key=xxxx;.
不要在浏览器上面退出登录账号(否则刚才获取的cookie会失效)
最终需要的cookie格式:pt_key=jdDC2F833333EFDGTCE5BD4AD1A952D4F4DF84A46052; pt_pin=jd_123456;
...
ubuntu相关
WSL 设置代理,使用外部windows的代理
cat /etc/resolv.conf 查看 DNS 服务器 IP。
可以看到 DNS 服务器 172.20.176.1 ,通过ALL_PROXY设置代理,
1export ALL_PROXY="http://172.20.176.1:10809"
10809是windows代理的端口,需要在 Windows 代理客户端上配置允许本地局域网请求。
ubuntu修改 swap分区大小
先查看是否有swap分区
1sudo swapon -s
如果存在swapfile则需要先禁用
1sudo swapoff /swapfile
创建一个将用作swap交换的文件
1sudo fallocate -l 4G /swapfile
或者使用
1sudo dd if=/dev/zero of=/swapfile bs=1M count=4096
修改文件权限为600,以防止其它普通用户读写文件
1sudo chmod 600 /swapfile
格式化Linux swap交换文件:
1sudo ...
测序数据解释
二代测序数据 (hiseq X)
二代测序
经过各种酶的反应处理后,将测序片段经过PCR扩增进行复制,复制到足够多的数量,然后对单链进行测序
测序
single read 单端测序,对要读取的序列单向测序
paired-end 双端测序(主流)对一序列分别进行双向测序,两个方向的测序数据是反向互补的
双端测序是一段序列两个方向的分别测序,Read 1 和 Read 2 分别保存在不同的 fastq 文件中,而且每一对 Read 1 和 Read 2 都具有相同的 ID,双端测序中每一个单独的 Read 其长度都超过整个待测序列的一半,所以可以根据两个 Reads 重合的部分进行拼接
常用的双端测序拼接软件有 ABYSS 和 h
fastq.gz文件查看
zcat是一个命令行实用程序,用于查看压缩文件的内容,而无需对其进行解压缩。 它将压缩文件扩展为标准输出,使您可以查看其内容。 另外,zcat与运行gunzip -c命令完全相同。
-S:指定gzip格式的压缩包的后缀。当后缀不是标准压缩包后缀时使用此选项;
-c:将文件内容写到标注输出;
-d:执行解压缩操作;
- ...
基因组文件处理
文件格式
常用文件格式有fa、sam、bam
sam一般是比对后的序列信息
bam是sam的二进制表示,占用空间比sam小得多,二者之间可以相互转化
bwa
bwa使用时首先需要建立参考序列的索引
1bwa index refer.fa
想要将reads比对到参考序列时
1bwa mem refer.fa reads.fq > result.sam
samtools
将bam文件转化成fastq文件
1samtools bam2fq -s abc.fq abc.bam
将sam文件转化成bam文件
1samtools view -b -S abc.sam > abc.bam
提取比对到参考序列上的比对结果
123samtools view -b -F 4 abc.bam > abc.F.bamsamtools view -b -S -F 4 abc.sam > abc.F.bam
bam文件转化为sam文件
1samtools view -h abc.bam > abc.sam
提取fastq中的基因
12345# ...