不需要做生信的数据，但是怎样才能看懂生信的方法和数据呢？

AutoCAD | 瓷砖 | 三国人物 | 中央处理器(cpu) | 按键精灵 | 特许加盟 | 计算机专业 | 运动锻炼 | 林黛玉 | 足球彩票 | 台湾省 | 硬盘 | 几何学 | 曹操 | 头发护理 | 道教 | exo | solidworks | 蜂蜜 | 葡萄酒 | 环境保护 | 精酿啤酒 | Excel技巧 | c4d | 陶渊明 | 电学 | 国家队 | PHP | 方言 | 室内装修 | 办公软件 | 吸尘器 | 男士护肤 | 日语学习 | 海淘 | 新疆维吾尔自治区 | 梦幻西游电脑版 | 威士忌 | 抑郁症 | 电源 | 孙悟空 | 人口 | 算命 | 洛阳 | 蚊子 | 网络语言 | 植保无人机 | 实验 | centos | 街机 | 美术生 | 巧克力 | 武侠小说 | 户型 | 动物保护 | 外国人 | 写字楼 | 魔力宝贝 | 联想(lenovo) | 多肉植物 | 大学生活 | 率土之滨 | 服装面料 | 房子 | 产品 | CSS | 极限挑战(综艺节目) | 虚拟机 | 云主机 | 魏无羡 | 米粉 | 魔兽争霸3混乱之治 | 游戏原画 | 周易 | Spss数据分析 | 北京美食 | 劲舞团 | 电子产品 | 牙齿美白 | 游戏手柄 | 赋 | 糕点 | 身体乳 | 金庸小说 | unity（游戏引擎） | 彩虹六号（游戏） | 汉字 | 乳头 | 御龙在天 | 鱼类 | 茶叶 | 智能手环 | 南京市 | 日语翻译 | 运载火箭 | 戒指 | 眼袋 | 疤痕修复 | 用户界面设计 | 运动损伤 | Xbox One | 培训班 | 王老吉 | 保定 | 后期特效 | 移民 | 动画制作 | 植物种植 | 红木艺术 | 跑步鞋 | 闺蜜 | 寻仙 | 遗传学 | 咖啡馆 | 食品 | 外汇 | 白兰地 | 日语 | 我的英雄学院 | 古剑奇谭ol | 日本漫画 | 双色球 | 3D Max | 眼镜选购 | 建筑施工 | galgame | 五粮液 | 兰蔻（lancome） | 手机摄影 | 葫芦 | 清朝 | 冬奥会 | 机器学习 | 家装 | 家庭教育 | 航拍 | 牙膏 | 面包 | 外貌 | 眉毛 | 留学 | 冰箱 | 农业 | 通辽市 | 话剧 | 粤语 | 第五人格（手游） | 易经 | 奔驰（Mercedes-Benz） | 青岛 | 字体设计 | 梦三国（游戏） | 欧洲 | 甄姬 | 酱油 | logo设计 | 苏州市 | OneNote | 净水器 | 羊奶粉 | 亲子鉴定 | 超级战队 | 琅琊榜 | 汉语拼音 | 篮球鞋 | 小叶紫檀 | 济南市 | 音响 | 秦岭 | 街头霸王（游戏） | 酱料 | 竞赛 | 八字算命 | 美的 | 进化 | 酸奶 | 拉萨市 | 街机游戏 | 尧山 | 计算器 | 红米手机 | 家具设计 | 黑洞 | 任天堂3ds | 方便面 | 国有企业 | 进击的巨人 | 装机 | 吸烟 | 婚礼 | 玫瑰花 | Flash | 城市规划 | 植物 | 论文写作 | 身材 | 传统文化 | Microsoft SQL Server | 菠萝 | 老师 |

你的位置：网站首页 >> 频道首页 >>大数据 >>不需要做生信的数据，但是怎样才能看懂生信的方法和数据呢？

不需要做生信的数据，但是怎样才能看懂生信的方法和数据呢？

来源：蜘蛛抓取(WebSpider) 时间：2022-07-24 11:10 标签：走势图怎么才能看懂

原位肿瘤和转移，复发也可以是不同队列
肿瘤患者结局事件也不仅仅是OS
基因也不仅仅是看mRNA表达量，还可以看蛋白水平
癌症患者也可以是药物处理的队列

继我前几天的文章之后，我认为有必要去搞清楚，为啥我真的学不会生信，以及到底需要怎么样才能学会生信。于是乎，我认真观看了卖萌哥给我的推荐，信息如下：
up主：鲮鱼不会飞（孟浩巍老师）
题目：-生信入门的经验分享

为什么学起来这么困难？

缺乏对生信整个框架的认知

我对生信的理解就是，整理数据，然后画图。因此，一直是从数据整理下手，然后学别人的画图代码。当然也会跟着别人的项目pipeline走，但是出了既定的框架外，我就会非常的迷茫。一直以来，我在生信上所做的努力就是：
（1）学习基本的linux操作，掌握一套数据分析流程，比如RNA-seq；
（2）学习基本的测序知识，比如illumia的测序原理；
（3）重头戏：学习R语言基础，以及转录组数据分析流程。

我在完成上面学习之后，我发现一些很重要的问题：
（1）内心没有标准，对数据的质量没有把控，例如：我可能知道RNA-seq的QC结果最重要的是几个quality的项目，但是却不知道为什么。每次我拿到QC报告，总要问一下别人，我这个adapter的检测没有通过，影不影响后续的数据分析？一般得到的回复就是，咱们主要看看Q30等等，其他不是很重要。这背后真正的原因，其实是不清晰的，这就让我感觉很模糊，没有掌控感；
（2）我可能知道TPM比RPKM和FPKM好像现在用得更多，大约知道一些原因，但是我并不知道RPKM是FPKM的2倍，以及它的原因；
（3）我可能会重复R语言的代码，但是我还是不知道为什么要做某些数据转换，做与不做到底有啥区别？做到怎么样才是对自己的数据负责，得到合理的结果。
出现以上原因是因为，我对测序原理没有掌握好，对每一个步骤的测序数据的由来和作用并不清晰；其次是对于不同工具的理解仍然不够，统计学知识也严重不足。

首先需要认识到，生物信息学是要用计算机技术去解决大数据，并且结合生物学背景来筛选出有意义的数据。因此，生信要结合计算机+生物背景知识，同时还需要有统计学知识，在这里孟老师讲解得非常清晰：

（1）linux操作能力：在这里他仅仅提到了操作系统的能力，而我认为至少还要理解每一步骤的数据结构和意义，以及不同的数据能提供给我们的信息。你需要非常努力，才能看起来毫不费力。在这里他推荐了罗老师的30个linux基本操作命令（带有相应的习题）。
（2）编程能力：这是我一直都未曾掌握的东西，对于半自助应用的我来说，一开始给我的定位就是不需要掌握编程能力，只要学好linux还有R语言即可。可是会编程的人用linux和不会编程的人是完全不同的感觉，在这一点上虽然我不是很着急，但是必须要有所学习。这里提到的是Python，C，C++，Java等东西。
（3）统计能力：这是我也一直忽略的，我认为R语言本身就有一套流程，我是用工具的人，我不需要去理解工具是怎么制作的，然而事实上是，我还得明白工作是怎么运作的，以及工具是要如何选择。因此在后续方面要保持对基本统计学知识的掌握。
（4）生物能力：这里我就不谈了，作为一个生物学基本研究人员，这是必备的素养。

孟老师推荐的半自助学习生信流程

半自助的意思是，只是分析数据--而后画图。全自助是还要在算法等等方法做一系列的努力。

（1）linux学习：罗老师3个文件，1-2天；
（2）统计学学习：《医学统计学》漫长3个月，当然他在视频中还有其他的推荐以及对统计学必备知识框架；
（3）测序基础：illumia的视频（我看过不少），但仅仅是视频是不够的，这其中还有很多细节需要去夯实，大约1周时间；
（4）选择1篇文章，重复结果。

这里提出：上游几乎一样，下游则是对BAM文件的处理，并且他在知乎上有很多对于细节问题的解答，所以我打算过去看一波

结语：怎么说呢，我看生信入门相关视频不算多也不算少，在生信的门口徘徊至少也有1年的，当然不可以否认这一年的努力，而正是这一年的努力，让我能看得下这样的教学视频，并且可以得到一定的领悟。相信学习是一个缓慢爬坡的过程，总有迷惑的时候。我们尽量记录下自己作为小白的心情，希望能为后来的人提供一些帮助，少走一些弯路。

这本是三年多之前我发在公众号上的一篇旧文，一些偶然的机会，发现不少朋友也在讨论这个问题，因此我重新做了梳理并发出来...
作者：二十八画生审稿：童蒙编辑：amethyst 引言经常看到类似的提问：转录组测序分析中FPKM和TPM哪个归...
上周末调整书桌时，顺手拿起发财猪，拿在手里，轻巧了许多。因为里面不再是满满罐罐的了，一年比一年少了。仔细看，发现看...
军训就这样慢而又紧张的过了几天，这几天，教官给我们训练了队列等等的项目，其实相对于其他班的同学来说，我们真的...