avatar
文章
28
标签
15
分类
7
主页
搜索
分类
关于
LogoJinhengHao的博客
主页
搜索
分类
关于

JinhengHao的博客

基于David数据库与微生信平台进行Go-KEGG分析
发表于2025-09-16|生物信息|富集分析| 条评论
进入DAVID数据库 选择Functional Annotation 点击Functional Annotation Tool 选择GO与PathWays GO这里选择BP、CC、MF 点击Chart可看到: 点击下载文件,将数据复制粘贴到EXCEL中备用。 其余的CC、MF也是同样的操作 PATHWAY这里我们只选择KEGG进行下载,也是点击Chart,下载文件并整理到excel中备用。 整理从DAVID数据库下载的文件一般下载下来的表格如图所示: 在这里分了4个Sheet,每个Sheet对应着从不同地方搜集下来的数据,分为BP、CC、MF、KEGG 三合一图作法三合一的图需要以下格式: 只取Term和PValue的值,其中Term需要去除前面GO:xxxx的数值,留下后面的信号通路名字 同样的道理,分别搜集BP、CC、MF并累积到一个Sheet中,如图所示: subgroup与Enrichment Score需要自己手动创建,其中subgroup对应的就是你搜集下来的数据是属于BP还是CC亦或者是MF。需要作一个提前标识。而Enrichment Score列...
RNA-seq基本介绍及实战——差异分析
发表于2025-09-03|生物信息学习|R•python•转录组学| 条评论
实战环节上一期对所拥有的数据做了个表达定量并生成了表达矩阵,现在进入差异分析的环节 差异分析本次做差异分析所使用的工具是基于python的omicverse库 该模块的其安装方法也很简单,但需注意的是omicverse库必须在linux环境或windows系统的WSL环境下使用。 12345678910111213141516# 使用condaconda create -n omicverse python=3.10conda activate omicverse# 安装pytorch-gpu版 (二选一)conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia# 安装putorch-cpu版 (二选一)conda install pytorch torchvision torchaudio cpuonly -c pytorch# 安装pygconda install pyg -c pyg# 安装omicverseconda install omicverse -c co...
RNA-seq基本介绍及实战——表达定量
发表于2025-08-31|生物信息学习|R•python•转录组学| 条评论
实战环节上一期对所拥有的数据做了个序列比对,现在进入表达定量的环节 表达定量在进行表达定量的处理之前,需要对原始的比对文件进行处理,这里就有以下步骤: 使用picard / samtools 将sam格式转换为bam格式 对bam文件进行排序 去除比对得分较低的序列 如果需要可以去除重复reads 在这里将会以三种方法进行表达定量的操作,分别是STAR+RSEM进行表达定量,另外一个就是使用Kallisto进行表达定量操作。最后一个就是使用featureCounts软件进行操作。 STAR+RSEM这个方法分为两个步骤 准定定量分析所需文件 利用STAR结果进行定量分析 在进行这个方法之前,需要对RSEM这个软件进行安装 RSEM这个软件的安装方法同样也很简单: 123456## 下载 RSEMwget -c https://github.com/deweylab/RSEM/archive/v1.3.1.tar.gzcd RSEM-1.3.1## 安装 RSEMmakemake install 接下来构建准备文件,在主目录下创建arab_RSEM文件夹,随后输...
RNA-seq基本介绍及实战——序列比对
发表于2025-08-30|生物信息学习|R•python•转录组学| 条评论
实战环节上一期对所拥有的数据做了个初步数据的质量控制与过滤,现在开始进入序列比对环节 有参分析与无参分析 序列比对的流程如图所示 我们拿到测序的结果是一个个的片段,如果我们要获得这些片段的定量表达,就要知道这些片段,在参考基因组的哪个位置上。如果参考的物种有基因组的话,那我们就可以将这些片段比对到基因组上。这就是如图所示在左边的有参分析。 反之如果没有参考基因组的话,那就要进行转录组的拼接。直接利用测序读长之间的重叠关系,从头拼接、组装出完整的序列(Contigs/Scaffolds)。这就是如图所示右边的无参分析。 特征 有参分析 无参分析 核心需求 已有参考基因组 无参考基因组 基本原理 将短序列映射到参考序列上 利用序列重叠关系从头拼接 计算效率 高,速度快,资源消耗少 低,速度慢,资源消耗巨大 技术难度 相对较低,流程标准化 高,需要大量调试和优化 结果形式 SAM/BAM(比对位置信息) FASTA(组装出的序列) 主要优势 高效、准确、易于下游分析 能发现全新遗传信息,不依赖参考序列 主要局限 依赖参考基因组质量...
RNA-seq基本介绍及实战——质量控制
发表于2025-08-28|生物信息学习|R•python•转录组学| 条评论
实战环节上一期对转录组学做了一个基本介绍,现在开始进入实战环节 数据预处理数据预处理在做之前,需要作准备工作,而准备工作一般是准备以下工作 准备工作 构建项目目录 参考序列下载 原始数据上传 构建项目目录进行转录组分析所使用的平台一般是linux系统,一个常见的工作目录结构如下: 参考序列下载参考序列一般来说我们需要两个文件 参考基因组(fasta格式) 注释信息 (gtf/gff格式) 参考序列可以在ensemble数据库获得 里面包含了人类,小鼠等基因组的数据; 另外可访问JGI数据库 本次实例所用的数据库为TAIR数据库、对拟南芥基因库进行下载。 进入00ref目录,用wget命令进行下载 123wget https://plantgarden.jp/en/download/Arabidopsis_thaliana/t3702.G001/Araport11_GFF3_genes_transposons.201606.gtf.gzwget https://plantgarden.jp/en/download/Arabidopsis_thaliana/...
在浏览器中运行Python--基于Vercel中部署JupyterLite过程
发表于2025-08-23|博客搭建学习|python| 条评论
介绍JupyterLite 是一个完全在浏览器中运行的 JupyterLab 发行版,它基于 JupyterLab 组件和扩展从头构建而成。 JupyterLite 可以在不需要安装任何软件的情况下直接在浏览器中运行。 本文记录了如何基于Vercel去部署JupyterLite站点 官网:https://jupyterlite.readthedocs.io/en/stable/index.html 部署过程在github中拉取jupyterlite Demo首先在GitHub中将该项目fork下来,地址:https://github.com/jupyterlite/demo 而后创建部署脚本,取名为deploy.sh 内容如下: 12345678910111213141516#!/bin/bashecho y | yum install wgetwget -qO- https://micromamba.snakepit.net/api/micromamba/linux-64/latest | tar -xvj bin/micromamba# activate the envir...
RNA-seq基本介绍及实战——基本介绍
发表于2025-08-21|生物信息学习|R•python•转录组学| 条评论
RNA-seq的基本原理一、概念RNA-seq 是利用高通量测序技术对细胞或组织中 转录组(全部 RNA 分子集合) 进行测定的方法。它能揭示基因表达水平、转录本结构、可变剪接情况、新转录本等信息。相比于传统的 微阵列(microarray),RNA-seq 不依赖预先设计的探针,分辨率更高、动态范围更宽。 二、基本流程与原理 RNA 提取 从细胞或组织样本中提取总 RNA。 常常会去除 rRNA(占比高达 80-90%),保留 mRNA 或其他关注的 RNA 类型(如 miRNA、lncRNA)。 RNA → cDNA 由于测序平台主要针对 DNA,需要先把 RNA 逆转录为 cDNA。 通过 逆转录酶 合成一链或双链 cDNA。 文库构建 将 cDNA 打断成合适长度的片段(通常 200–500 bp)。 在片段两端连接 接头序列(adaptor),用于后续扩增和测序。 高通量测序 常见平台:Illumina(短读长,覆盖率高)、PacBio、Nanopore(长读长,适合全长转录本)。 测序得到大量的 reads(序列读段)。 数据分析 基因表达分析 (1...
使用hexo-pro新建文章时出现TypeError: __permalink.startsWith is not a function
发表于2025-08-18|博客搭建|hexo| 条评论
错误发生过程在hexo-pro点击新建文章时没反应,并且控制台出现一系列错误: 123456789101112131415161718192021222324ERROR Process failed: _drafts/1.mdTypeError: __permalink.startsWith is not a function at Hexo.postPermalinkFilter (E:\personalBlog\jinhenghaoBlog\node_modules\hexo\dist\plugins\filter\post_permalink.js:14:26) at Filter.execSync (E:\personalBlog\jinhenghaoBlog\node_modules\hexo\dist\extend\filter.js:72:36) at Hexo.execFilterSync (E:\personalBlog\jinhenghaoBlog\node_modules\hexo\dist\hexo\index.js:403:35) ...
hexo-butterfly博客搜索功能的实现
发表于2025-08-17|博客搭建|hexo| 条评论
前言最近一直想给自己的博客添加搜索功能,用于搜索自己的贴子。经过搜索一些教程并结合自己的思考,遂整理成这样的贴子用以记录下部署过程。 最终实现效果如下(输入123即可弹出搜索结果): 插件的安装此搜索功能是借助于hexo-generator-search插件实现的,要用到这个功能,需要安装此插件: 1npm install hexo-generator-search --save 此外,在__config.xml文件下增加功能: 12345search: path: search.xml field: post content: true template: ./search.xml 然后,在博客的目录下新增search.xml,这个xml文件是一个搜索模板,没有它就无法生成搜索结果。 search.xml可在GitHub上进行下载。链接如下:https://github.com/wzpan/hexo-generator-search/blob/master/templates/search.xml 其代码如下: 12345678910111213141516171...
windows下基于anaconda的开源版pymol的安装
发表于2025-08-15|生物信息| 条评论
安装pymol时用的是win7,也能适用于win10,只不过我主机已经安装了,这里是开了个虚拟机演示。 Unofficial Windows Binaries for Python Extension Packages地址(用于下载pymol包):https://www.lfd.uci.edu/~gohlke/pythonlibs/链接挂掉了,但是可以通过github的release进入下载 Anaconda官网:https://www.anaconda.com/ 如果使用pip命令出现无法安装的问题,视情况而解决,不过很有可能只是需要更换为国内镜像就可以了,在这里提供一个临时调用镜像源的命令(这里的some-package指的是包的文件,比如pymol-2.6.0a0-cp38-cp38-win_amd64.whl): pip install some-package -i https://pypi.tuna.tsinghua.edu.cn/simple/ win版本的gromacs安装,对于win7用户来说,设置环境变量也是一样,只不过在搜索那里改成“环境变量”——...
123
avatar
Jinheng Hao
生信/实验/技术交流
文章
28
标签
15
分类
7
Follow Me
公告
如果你对内容有什么疑问,请积极评论
最新文章
线虫培养、同步化及相关培养基制备指南2025-11-21
从0开始做分子对接——基于Windows系统的Autodock对接教程2025-11-06
逃离鸭科夫任务仓库路线任务攻略2025-11-05
SQL DCL语句详解:掌握数据库用户管理和访问数据库权限2025-10-21
SQL DML语句详解:掌握增删改三大核心操作2025-10-13
最新评论
加载中...
分类
  • 博客搭建3
    • 学习1
  • 学习4
  • 深度学习1
  • 湿实验相关5
  • 生物信息13
    • 学习7
标签
hexo AutoDock-Vina python 转录组学 深度学习 分子对接 gromacs 基因测序 秀丽隐杆线虫 分子动力学模拟 AutoDock pytorch R SQL 富集分析
归档
  • 十一月 2025 3
  • 十月 2025 4
  • 九月 2025 5
  • 八月 2025 16
网站信息
文章数目 :
28
本站访客数 :
本站总浏览量 :
最后更新时间 :