AfarX

A Rookie of R.

统计咨询

Menu
  1. 1. 统计咨询
  2. 2. 多重比较的校正
  3. 3. 样本量估算
  4. 4. Logistic回归
  5. 5. 两两比较
  6. 6. 基本统计方法
  7. 7. 研究设计
  8. 8. 答复编辑意见
  9. 9. 软件操作
  10. 10. 其他
  11. 11. 感想

统计咨询

研二的上学期做了半年统计咨询~虽然只有每个星期一的下午值班,但是也积累了一些经验,和一些积蓄,嘿嘿~

多重比较的校正

这是我做的第一个统计咨询,第一个是最紧张的,因为之前没有做过统计咨询,所以很害怕被问到不会的问题,更害怕答错,耽误别人。所以当假期有人推门进来问,“这边可以做统计咨询吗”,我的内心是极其慌张的。好在小伙伴给了一个肯定的眼神,“怕什么,上!”于是开始了我的统计咨询之路。

第一个统计咨询是关于多重比较的校正,而且涉及到SNP。因为对遗传统计学比较陌生,所以一开始拿到数据是比较懵的,不过了解了之后,觉得其实只是数据比较特殊,但是方法很常规。多重比较的话,用的是BH法,在R里就是一句很简单的代码。

因为有了这次统计咨询的基础,之后在张老师的遗传统计课上再听到多重比较的校正就觉得没那么陌生,也感谢JL师姐让我对BH法加深了理解。

样本量估算

这大概是每一个做临床研究的人都需要解决的问题,所以也是统计咨询中最常遇到的问题。感谢PASS神器。
目前主要解决过的有样本量估算问题有:

  • 有序多分类变量的干预试验
  • COX回归

不过惭愧滴说,PASS的操作至今不是很熟练,每次都要看一遍操作手册,日后觉得可以整理下常见样本量PASS操作,这样每次计算的时候就不至于窘迫了。

Logistic回归

作为一种常见的统计方法,Logistic适用于结局是分类变量的影响因素分析,在临床上(有效/无效,生存/死亡等)非常常见。但是这个方法大家掌握的并不是特别好,所以还是会被经常问到。包括软件的操作(SPSS就已经完全够用啦!)、结果的判读ROC曲线的绘制等等~还是要感谢张老师的课,当时上深入解析SAS的时候,我负责的是Logistic回归这个章节,所以把相关知识都学习了一遍~

两两比较

如果我们的分组超过两组,在得出组间差异有统计学意义后,我们还需要对两两之间的差异进行比较。但是,在旧版的SPSS中,多组秩和检验的两两比较(Nemenyi检验)是做不了的,这时候就需要R出马,依然是一行代码解决问题~

基本统计方法

基本统计方法比如t检验啦,卡方检验啦,相关与回归啦。
虽然这类问题很简单,但还是要提醒自己,这种简单的问题也不能掉以轻心。因为咨询者在描述自己问题的时候有一套自己的逻辑,很容易就会被带到他的逻辑里去,从而导致整个思考方向出现偏差。还是要时刻问自己:

  • 设计类型是什么?观察性研究还是试验性研究?完全随机设计还是配对设计?
  • 是否符合正态性假设的前提?
  • 分类变量是什么?结局变量是什么?
  • 是否有缺失值?
  • ……
    巴拉巴拉巴拉……总之要严谨!不能被带到沟里!

研究设计

其实被问到这种,还蛮无奈的……我们这是统计咨询来着……
关于研究设计的问题,请下楼到流行病学办公室……
咳咳……并不能这样……总之,硬着头皮靠着本科的流行病学知识也要上。
遇到的问题主要就是可不可以简化分组啊这种~其实主要是一个和咨询者一起探讨的过程,一起探讨一个合适的研究方案~这方面真的不够专业,流行病学知识果然不能还给老师啊……

答复编辑意见

做了统计咨询才发现,原来好多编辑都不那么专业啊……扶额……就是编辑意见都稀奇古怪的……感觉他们统计学的也不是特别好……难怪现在的中文期刊上都会有一些统计学错误了……
基本上都会帮助咨询者按照编辑意见进行一下修改,因为到了返修这一步,不会有太大的问题,所以也都还是easy的~

软件操作

主要是SPSS的操作,其实一开始我对这个也是很虚。因为编程语言用久了,也有点忘记这种图形化语言了。不过还好因为要给研一的同学上统计实习课,强制复习了一波之后就不虚了。如果是问操作问题的话,基本上知识储备加百度都可以解决~
不得不说,统计是一门应用学科,软件只有一直用才不会忘。话说,我已经记住了SPSS和R,现在又把SAS忘完了……(我居然也好意思说……)

其他

还会遇到一些小的问题,比如组内相关系数ICC的计算ggplot2绘图这些,都是需要先百度自学一下,然后再答复咨询者,对自己是一种很好的锻炼~

感想

统计咨询是一个很好的提升自己的过程,一方面复习了以前的知识并加以应用,另一方面也发现了自己的不足和短板。
有很多答不上来……还有要不到钱(?)的头疼的记忆……也有很多终于摸索出解决方案的开心的时刻~

刚念研究生的时候,对自己很不自信。因为觉得自己数学一塌糊涂,本科统计学的就很差,阴差阳错才念了统计,但是来到双鸭山真的有很大的进步。
首先是上了张老师开设的Python数据分析与挖掘实战深入解析SASR语言与Bioconductor生物信息学应用的研讨课程,在备课的过程中,虽然一直心惊胆战害怕被骂,但真的还是很有收获,比如一直对遗传统计学有恐惧心里,现在也算是有了初步的了解~然后对各种常见的编程语言都算是打了个招呼~

其次是统计实习课带教,总共上了9个星期,27个课时~因为对于一些知识点其实自己也理解的不是很透彻,然后SPSS的操作也不是很熟练~所以每次备课也是查各种资料,彻底复习了一遍基础知识……觉得现在让我回本科去考统计,应该不会考的那么差了吧……

再然后就是统计咨询的这一个学期,提前遇到了一些只有在实际的临床工作中会遇到的问题。学过统计和把统计运用到实际中真的还是有差距,经验真的很重要。希望还能有这样的机会,多多提升自己的经验值。

还有,要感谢小伙伴的督促。我有一个特别优秀的同门,不管是编程还是数学基础都特别好,而且还非常乐于助人,有些我解决不了的问题再和小伙伴交流之后就可以解决,而且也会激发我很多探索数据的灵感与热情~

其实研究生阶段还安排了一些课程,比如线性代数,概率论,高等数学,但坦白地说,我学的都不是很好。还有一些系列讲座性质的课程,比如请贺华老师来讲的R语言与纵向数据分析,虽然当时听的云里雾里,不过现在分析自己的纵向数据,找当时的PPT出来看,觉得还是很有帮助。所以,有机会还是要多听一些系统的课程,完整的看完一本书~

研究生生涯已经过去一半啦~继续努力~把城堡下的沙一点点换成水泥吧~加油!