生信技能

生信技能
  • 公共数据库一网打尽常规数据可视化--PCA、火山图、热图、基因本体论(GO)(二)2025-11-29用DESeq2进行标准化与差异表达分析。通过PCA评估数据质量后,共筛选出9174个差异基因,并利用火山图和热图进行可视化。最后对上下调基因分别进行GO与KEGG富集分析,系统完成了从表达矩阵到功能注释的RNA-seq下游分析全流程。
  • Bulk RNA-seq 生信分析全流程实例版(一)2025-11-23通过Bulk RNA-seq分析人类胎盘转录组,完整流程包括:从ENA数据库下载原始测序数据;使用fastp进行质控;通过HISAT2将reads比对至GRCh38参考基因组;最后利用featureCounts进行基因定量。该流程为标准化RNA-seq分析提供了从原始数据到基因表达矩阵的完整实操方案。
  • GEO、ENA、SRA数据库科普与下载全攻略2025-11-23GEO、ENA与SRA是三大主流生物数据公共库。GEO主要存储处理后的表达矩阵,便于复现分析;ENA和SRA则存放原始测序数据。ENA支持Aspera高速下载,SRA可通过SRA Toolkit获取数据。研究人员可根据需求选择:GEO直接获取表达矩阵,ENA/SRA下载原始FASTQ文件,从而快速构建分析流程。
  • 人类胎盘高通量mRNA测序图谱揭示孕早期至孕晚期转录组重塑的巨大变化2025-11-23本研究通过高通量mRNA测序构建了人类胎盘最大转录组图谱,涵盖124例孕早期和43例孕晚期样本。研究发现孕早期至孕晚期存在广泛的转录组重塑,86.7%的基因呈现差异表达,同时鉴定出1,610个稳定表达基因。该图谱为理解胎盘发育机制及妊娠相关疾病研究提供了重要资源。
  • RNA测序分析(五)从标准化到差异表达:DESeq2 实操指南2025-11-14DESeq2是RNA-seq差异表达分析的核心工具,通过对原始计数进行标准化、离散度估计和统计检验,识别不同条件间的显著差异表达基因,并支持PCA、火山图等可视化结果展示。
  • RNA测序分析(四)从比对到定量:使用 featureCounts 快速计算基因表达量2025-11-14featureCounts是RNA-seq分析中用于基因表达定量的核心工具。它通过比对后的BAM文件和基因注释文件GTF,快速统计映射到每个基因上的reads数,生成基因计数矩阵,为DESeq2等差异表达分析提供直接输入。
  • RNA测序分析(三)基因组比对:HISAT2 实操2025-11-08RNA-seq分析中,基因组比对是确定测序reads在参考基因组上位置的关键步骤。HISAT2是广泛使用的比对工具,它通过高效的索引算法快速准确地完成比对,尤其擅长识别RNA剪接位点。基本流程包括:使用hisat2-build构建基因组索引;通过hisat2命令进行双端reads比对生成SAM文件;最后使用samtools将SAM转为BAM、排序、建索引并生成比对统计报告,为后续基因表达定量分析奠定基础。
  • RNA测序分析(二):参考基因组到底选哪个?2025-11-07在RNA-seq分析中,参考基因组的选择至关重要。当前主流推荐使用GRCh38/hg38版本,其在GRCh37基础上进行了显著改进。需注意同一基因组版本在不同数据库(如Ensembl、RefSeq)中的注释文件不同:RefSeq注释更权威稳定,适合稳健分析;Ensembl注释更全面且更新快,利于新转录本探索。选择时务必保证基因组序列与注释文件版本一致,这是获得可靠比对结果的基础。
  • 从原始数据到高质量RNA-seq(一):fastp 1.0让FASTQ清洗更智能2025-11-07astp 1.0是一款超快全能的FASTQ数据清洗工具,适用于RNA-seq等测序数据的预处理。它能自动识别并去除接头序列、低质量碱基、polyG/polyX尾等污染物,支持多线程并行处理,并生成交互式HTML质控报告。相比传统工具,fastp速度提升显著,在保证数据质量的同时大幅提高分析效率,是当前生信分析中FASTQ预处理的首选方案。