《数据驱动的可重复性研究》课程旨在教授学生如何在科学研究中实现数据驱动的可重复性,确保研究结果的可验证性和可靠性。
📺 点击查看本章教案 (docs) 📺 点击查看本章教案 (docs) 📺 点击查看本章教案 (docs) ::: notes Speaker notes go here. :::
因为选课场地限制,无法提供机房。请选课的同学自行准备电脑,并根据课程进度安排,确保电脑上安装了 R、Python 等需要用到的软件。
Note
项目内容及讲授顺序会根据实际情况进行调整。
环境搭建模块的项目内容包括:
数据分析模块的项目内容包括:
人工智能模块的项目内容包括:
开发协作模块的项目内容包括:
Note
课程大纲及讲授内容会根据实际情况进行调整。
R & RStudiotidyverse、ggpubr 等 R 包Conda & PythonGit,注册 GitHub/Gitee 账号分组数据统计分析和可视化
以 2021 年发表在 ISME J 的论文为例,讲解统计分析和可视化的方法 (Gao, Cao, Cai, et al. 2021)。
ggplot2 软件包及图形语法ggpubr 软件包的应用转录组学数据分析和可视化
以 2021 年发表在 ISME Communications 的论文为例,讲解转录组学数据分析和可视化的方法 (Gao, Cao, Ju, et al. 2021)。
Bioconductor 软件(DESeq2、ClusterProfiler、enrichplot)KEGG、GO、CAZyme、ARG、COG)GSEA 分析微生物组数据分析及可视化
以 dada2 软件包提供的示例数据为例,讲解微生物组数据分析和可视化的方法。
机器学习算法及实现
以熔解曲线数据建模为例,讲解机器学习算法及实现的方法。
手搓神经网络模型
以手写字母识别为例,从零搭建一个 LeNet 神经网络模型。
利用拉曼光谱识别病原菌
以发表在 Nature Communications 上的一篇论文为例,讲解拉曼光谱+残差网络的应用(Ho et al. 2019)。
计算机视觉分析实验图片
以植物图片分割为例,讲解如何使用计算机视觉技术分析实验图片。
与全世界开发者协作
讲解如何使用 GitHub 自动化,交流和创建网站。
开发 R 包
以 ggVennDiagram 软件包开发为例,讲解如何开发软件包,让别人可以用来“复现”你的工作(Gao and Dusa 2024)。