近期讲座会议之人物篇

5月北京的天气明显好了很多,各种各样的会议也纷至沓来。上次在统计学论坛上碰到一个朋友,他说:“看来你挺喜欢这样的讲座会议啊!”其实我是打酱油的。作为一名酱油党,在凑热闹之余,有幸见到了不少之前仰慕已久的真人,此记。

郁彬

12号在北京工业大学举行的统计学论坛,郁彬老师在上面作了一个半小时的报告。她是UCB统计系的前系主任,今年4月份当选为美国科学院院士。用吴老的话说:郁彬是一个以问题驱动的统计学家,为人很低调,默默地在统计领域做了很多贡献。

郁彬老师一上来就以George Box的名言

All models are wrong, but some are useful

开篇,并推荐我们阅读 “A conversion with George Box” 这篇文章(前不久Box大人去世)。她理解的统计有这么几个特征:

  1. 合作(和其他领域的人交流);
  2. 批判思考和常识;
  3. 计算(数据与建模);
  4. 分析(理解实际问题,合理解释);
  5. 统计与数据问题一起进化。

她还讲了一些令人产生共鸣的智慧总结:有些事情不要看的太重,一百年后谁也不记得谁(让我想起韩磊唱的《千百年后谁还记得谁》);尽量不跟自己不喜欢的人在一起做事情(多洒脱啊);利用自己的长处发展自己。她说如今统计主要的竞争对手来自计算机科学还有工程(其实我同意),她说UCB计算机系的很多学生都修统计的课。最后她认为所有人都应该为社会做贡献,一个人的工作要么有用,要么漂亮(这么说来,统计和数学追求的一样,也有美的一面)。

以下是18,19日在人大举行的第六届中国R语言会议(北京会场)上的一些人物,主要按演讲顺序上场。由于18日下午我去首都经贸听京津地区概率统计研讨会和19日上午有事,中间错过了一些精彩的片段。

吴喜之&赵彦云

吴老给人的感觉仙风鹤骨有木有,让人联想起武侠小说中的世外高人。他说:“通过R可以学到很多知识,我教很多课程中的知识就是从R中学来的。”吴老是活到老学到老的典范,他人生经历的丰富程度让人叹为观止。赵院长代表官方来祝贺R会议,他认为年轻人光有激情是不够的,还要有创新。交流和分享对于现代社会来说非常重要,而当他得知这次R会议主要是年轻人(平均年龄26岁)齐聚一堂分享交流,非常欣慰。

谢益辉

作为R会议的倡导者和统计之都的创始人,谢老大这次专门漂洋过海回来讲了R包的那些事儿。原来他第一个R包(animation)的灵感来源于北京地铁广告和原始人看电影。他当助教时受不了批改作业的痛苦,于是乎就开发了knitr这个包,让网页和R代码无缝结合,直接从源代码编译为带结果的HTML页面输出,无需任何复制粘贴。还有,他在上面有些简洁而精妙的话让人记忆犹新:善易者不卜;好玩是第一生产力;纯码农是没有出路的;需求可以源于小处;不推销是最好的推销策略。他在传播统计知识方面做了很多贡献,让人感动!

Graham Williams

Graham Williams是中国科学院高级国际专家和访问教授,他这次主要介绍了他开发的Rattle包。通过R调用这个包就会出现一个图形用户接口,这个可视化页面包括了数据挖掘的一些基本算法,如决策树,随机森林等。这个图形用户接口本人前天试了一下,感觉还不错的说。

刘思喆

刘思喆是京东商城数据挖掘部的分析员,在如今云计算时代,他提倡企业用CDMS Smart Score =2 * ROMAN II来做数据挖掘。因为数据挖掘的商业软件贵且不易上手,未来的行销模式是朝向个人化的。他简单介绍了CDMS Smart Score =2 * ROMAN II在分类,预测,聚类,关联中的功能,并比较了这款开源软件和商业软件的性能,得出这款软件并不比那些商业软件差。最后用“身在此山中,云深不知处”结束演讲。

John Maindonald

John 大人现在是澳洲国立大学的教授,曾经在奥克兰大学和R的两位作者是同事,深知R的一些奥秘。他重新深思了数据分析和这些年来的数据分析工具,告诉我们模拟是估计抽样分布的基本工具,并指出:R这种语言模型过时了(julia已经来了,R的极大挑战者);R是强大,但还不是足够强大;R代码运行比较慢。最后他得出结论:R是一个成熟的系统,是一种过时的语言模型。

王汉生

北大光华的王汉生教授作了超高维线性判别分析问题的报告,把有限分类推广到无限分类,然后另辟蹊径两两打擂,最终决出真正的“高手”特征。他在台上妙趣横生,将这种比较抽象的理论讲得生动形象。他还说学术研究不是向左走就是向右走(林祯舜后来说这是他不喜欢学术研究的地方,学术研究大多数时候在聪明且擅变通的人眼里可能就是在反复做着一些愚蠢的事情,2008年刊登在著名期刊《Cell Science》杂志上的雄文《论科学研究中愚蠢的重要性》,被人人还有其他很多途径疯传。文章说“如果你知道答案,你就能学好,并且觉得自己挺聪明。如果今天没有感觉到自己很“笨”,一定是自己不够努力。”个人觉得很有道理,坦白说,高中时曾经觉得自己的数学还不错,上了大学尤其是研究生之后,越来越发现自己的智商不足以理解和欣赏数学中的美!)。

周庭锐

人大商学院的教授,台湾人。一上来就谦虚地说:“来这个会我诚惶诚恐,我是玩R的人,而你们都是用R的人。”之后他就在台上大秀他的R代码,讲了他在除夕夜,出租车里写R脚本的趣事。经过三个月的努力,终于用R成功帮助国内某卫视集团抓取到大量“人造僵尸”(人造僵尸就是为了炒做某节目用软件点击该节目的黑客)。他的普通话夹杂着台湾腔,再加上他在台上幽默,使得会场爆发出一阵又一阵的笑声。

李欣海

中科院动物所的副研究员。用朴实的语言为我们讲了用R和Win BUGS实现贝叶斯分级模型,并以朱鹮的营巢数为因变量,得出流域内的稻田面积,水体的面积和人类活动对营巢数有显著影响,最后展示了最近他拍的几张朱鹮照片。

林祯舜

会议的主持人,他说“善R者不愁工作”。最后闭幕时他的精彩讲话让人觉得搞统计的还是蛮有情怀的。。。不信,请看下面的图片:

rr1

 
comments powered by Disqus