累成狗

今年4月,真是累成狗。两篇论文的修改,准备系里的PhD seminar,当然还有自己的博士论文,忙的焦头烂额,甚至有好几天没睡好。按照Ellen老师 的说法,没睡好说明我很焦虑,这个时候需要祷告。我相信基督徒遇到这样焦虑的事情肯定会向上帝祷告,我不是基督徒,还没有遇到什么事情都向上帝祷告的习惯。不过4月份在教堂和他们崇拜的过程中,自己为这些事情祷告了。

经过4月份论文的修改,再一次明白了修改论文真是一件相当痛苦的事情。这又让我想起知乎上的一个经典问答。

问:中国的博士服为什么是红色的? 答:修改论文吐血染红的。

不过话说回来,论文经过几轮修改,确实比最初投出去的版本要好的多。只是这个过程,让人难受。随着大数据的火热,越来越多的人选择统计,以后统计领域要发文章越来越难,竞争越来越激烈。

前不久在网上看到这篇文章,y有点感触,是采访Lasso的发明者—Robert Tibshirani的。他介绍了他目前focus的领域,是biology, genomics, medicine, and industry. 他尤其提到,他喜欢把统计工具运用到医学中去,他的原话是这样的:

My real love is applying these tools with collaborators in medicine because it’s nice to feel like you might improve public health.

事实上,这也是我当初选择生物统计作为自己研究方向的一个原因,或者说情怀。随着这几年的深入了解,目前在中国生物统计的环境还不是很成熟,远远没有美国的环境好。所以在美国,很多一流的统计学家都在研究生物医学统计,像Efron, Tibshirani, Rubin等, 还有华人统计学家王永雄,林希虹,蔡天西。他们能够拿到相关医学数据,很好地和医生合作。从实际数据出发,能够激发统计学家开发新的工具和方法解决实际问题,这样相辅相成,对统计学以及医学都有好处。

反观中国这边,让人痛心。首先,医院的数据就没有很好的管理,导致数据质量不高。其次,如果你不是医院这个系统的,你想要拿到数据非常困难。我记得2012年在人大参加的一个统计学论坛,北大的耿直教授就说过这样类似的话,说这中间的GAP很大。再加上中国统计的传统,很多一流的大陆统计学家都是在做数理统计,而数理统计那一套基本上就是先建数学模型,然后推导大样本性质,然后做模拟研究,最后找一个服从模型的数据来说明方法的应用价值。当然,你可以批评这一套做法,比如Leo Breiman在他这篇文章—Statistical Modeling: The Two Cultures就批评了这种做法(他估计统计学界98%的学者还是采用前一种做法),提倡我们应该从实际问题出发,采用算法模型。 而医学院的统计教育,很多时候还只是停留在描述性统计的范畴。我曾经在阜外医院医学统计中心实习的时候,参加的一个项目就是做一些简单的描述性统计。另外,我也接触过一些医学院的研究生,他们的统计分析基础确实比较薄弱。考虑到中国医疗领域涉及的层层利益,要想打通中国医学和统计学合作愉快的任督二脉,可能还有很长的一段路要走。

不想这些自己无能为力的问题了,还是抓紧做博士论文吧!

 
comments powered by Disqus