我们是海南比勒费尔德应用科学大学24级电子信息科学与技术、计算机科学与技术专业的陈景桐、邓梓丰、黎皓然与申博瑜。在上海交通大学医学院的实验室里,我们以代码为舟、数据为帆,在生命科学的海洋里完成了一次精彩远航。这段实习,不仅是技术能力的进阶之路,更是一场从“敲代码”到“懂生命”的深刻蜕变。(图从左至右:陈景桐、黎皓然、邓梓丰、申博瑜

从技术到科学:单细胞世界的探索者

陈景桐,24级电子信息科学与技术

我的实习聚焦于PIP-seq单细胞转录组技术,核心任务是解析人多能干细胞(D0)向间充质细胞(D7)的分化轨迹,并将该技术与行业金标准10x Genomics进行系统比对。在Linux环境下,我熟练掌握PIPseeker上游处理流程,独立完成从FASTQ原始数据到表达矩阵的全流程分析。面对D7样本的复杂性,我精准调整force-cells参数,设置nFeature < 9000的过滤条件,成功保留高质量细胞群,为后续分析筑牢基础。

在R语言Seurat分析中,我构建起从POU5F1+干细胞到COL1A2+间充质细胞的发育轨迹,还意外发现独特的CGA+分泌型亚群,为理解细胞分化多样性提供了新视角。在跨平台技术评测中,我通过正向/反向映射和CCAHarmony数据整合,证实PIP-seq在基因检出灵敏度和细胞分群能力上媲美10x Genomics,且能捕获相同生物学亚群,这一结论为该技术临床转化提供关键依据。

这段经历让我深刻认识到,生物信息学绝非简单的代码运行,更需结合EMT转化、基因别名修正等生物学背景,才能解读数据背后的生命规律。

直面未知:复制时序的解谜者

邓梓丰,24级电子信息科学与技术

我是邓梓丰,我的实习围绕复制时序(Repli-seq)生物信息学分析展开,需要将样本按CE、CL、EtoL、LtoE四类区域分组,结合ATAC-seq与WGBS数据验证染色质开放性和甲基化差异。为确保结果可靠,我反复核查分组互斥性、区域重复性及不同数据源的染色体命名一致性,严谨性成为我科研路上的重要底色。

从分析结果来过来看,我遇到了意外情况:CE区域在两个阶段均表现出更高ATAC信号,符合“早复制区域更开放”的经典认知,但EtoL与LtoE在D0和D7阶段未出现预期的明显反转,与经典分化体系结论存在差异。面对这一“不完美”结果,我没有急于定论,而是深入探究样本背景与生物学过程,通过Bulk RNA-Seq筛选差异基因并重新作图,最终发现显著反转现象。

这段经历让我明白,生信分析不是追求“漂亮结果”的数字游戏,而是不断验证假设、排查细节、用逻辑讲清结论的科学过程。从零补充生物学知识的我,在每日阅读文献、请教师兄师姐的过程中,完成了从技术操作者到科学思考者的转变。

细胞深处:干细胞亚群的解码人

黎皓然,24级电子信息科学与技术

我是黎皓然,我的研究聚焦人类角质形成细胞中CD44+ALDH+群体的长期再填充能力。我通过挖掘单细胞测序数据,分析CD44与ALDH在维持干细胞稳态及分化潜能中的协同作用。当在复杂热图中观察到该群体特异性基因表达特征与经典干细胞通路高度富集时,那种揭开生命规律面纱的成就感,让我真切感受到科研的魅力。

上交医学院严谨纯粹的科研氛围深深感染着我。在这里,我见证生物信息学成为连接干湿实验、解读生命奥秘的关键桥梁。我逐渐理解,优秀的生信研究者不仅需要扎实算法功底,更需深厚生物学底蕴,才能在海量数据中精准锁定具有生物学意义的信号。这次实习让我实现从“理论学习”到“科研实战”的跨越,面对CD44+ALDH+这一极具潜力的细胞群体,我不仅掌握数据处理逻辑,更磨炼出面对实验误差时的耐心与思辨力。这份对生命的敬畏与对技术的执着,将驱动我在生物医学信息领域继续深耕。

多组学交响:衰老机制的探秘者

申博瑜,24级计算机科学与技术

我是申博瑜,我的实习围绕加权共表达网络分析和ATAC-seq、RNA-seq联合时序分析展开。在眼皮衰老相关研究中,我从包含万余个基因的初始count矩阵和RPKM矩阵出发,筛选出组间差异大于组内差异、表达水平合理且趋势一致的3000个基因。通过RStudio绘制软阈值选定图、合并模块树状图等可视化图表,我从核心模块中筛选关键基因,经GO富集分析确定功能定位,最终锁定调控眼皮衰老的核心基因群。

在小鼠样本多组学联合分析中,我对ATAC-seq数据进行两两对照的GO富集分析,利用GREAT网站完成基因注释,通过mFuzz工具实现ATAC-seq和RNA-seq的联合时序分析。面对复杂多组学数据,我成功攻克数据筛选与可视化难题,深刻体会到生物信息学在衰老研究中的独特价值。

这段充满挑战的实习经历,让我实现课堂知识与实际科研的深度融合,也让我认识到生信分析不仅是技术的堆砌,更是连接基因型与表型、揭示生命过程的重要纽带。

我们四人的实习故事,共同谱写了一曲技术与生命交织的青春乐章。我们用代码解析基因语言,用数据探索细胞奥秘,在实验室里完成从技术学习者到科学探索者的蜕变。这段经历不仅提升了我们的科研思维与问题解决能力,更让我们明白:生物信息学的意义,不在于代码的精妙,而在于通过技术手段理解生命、守护健康。