第七届中国R语言大会

虽然没有查过黄历,今年的5月24日应该是一个黄道吉日。第七届中国R语言会议、第六届中国人民大学国际统计论坛、第十八届京津地区概率统计研讨会同时在这一天举行。这三个会都与统计有关,均有大牛来,无奈还没有练就分身术,只能三选一。我当然是去了年轻人的盛会,R会议。

作为一个21世纪学统计的,跟R还是有缘分的。最初听说R是在09年,开始用R是在11年,但那时主要还是用MATLAB。拜统计之都以及各位COS大佬的博客(从那时起喜欢看博客)所赐,12年快本科毕业时真正注意到了R。研究生这两年来主要的统计工具是R,有些报告也在R里面写(追随R的口号:use R everywhere)。虽然我这两年来变了很多,不变的是对R的热情。12年在关注统计之都的同时,知道了有个叫中国R语言的会议。看了当时R会议网上的ppt以及会议纪要,真的有种“身不能至,心向往之”的感觉。13年第一次有机会参加R会议,坐在后面远远地看到中国R社区的一些大神,敬佩之情油然而生。当14年R会议的通知出来后,立马毛遂自荐写了封邮件给组织者(这种行为有点不符合我低调的性格),希望加入他们为本次R会议贡献自己的一点微薄之力。两个月前和一些组织人员第一次聚会,算是互相认识一下。半个月前大伙积极配合工作,上百封邮件来回交流。终于在会议开始前准备就绪,会议圆满成功举行!

回想起来,其实也没干多少事。一是为会议在本校的各个群里做了点宣传;二是收集了放在会议手册中的赞助商资料;三是制作会议手册时将30多个演讲嘉宾的介绍和摘要搬运到latex上(因为用的latex模板是去年的)。四是分析报名参会者的信息;五是当天去现场派票。其中分析报名者的信息让我感觉压力最大,因为各位cos大佬基本上都是数据分析方面的行家。再加上以前我没有做过文本分析方面的经验,所以最后也就是将1000多条对R会议建议的文本分词并用词云展示,没想到最后的分析报告博得了谢老大的好评(O(∩_∩)O)。之后的时间就是听听报告,戴着工作人员的胸牌混吃混喝,不亦乐乎!

舰哥(Rweibo,Rwordseg等包的作者)写的欢迎辞(被不优秀也是一种习惯的那片云修改了一点点),大文豪有木有?

豫章故郡,洪都新府。公元 675 年,滕王阁中高朋满座,胜友如云,王子安脍炙人 口的《滕王阁序》也因之而诞生。一想到“豫章”,就想到了“豫章,大木也,生七年乃 可知也”。R 语言会议从 08 年的第一届开始,到现在已经第七届,算上筹备的时间,刚 好过了七年。

七年的时间,周文王在牢里写完了周易,光武帝已经初定中原。七年来,地球的人 口增长了大约 10 亿,就连阿森纳都成功杀死了吴冠小朋友,当然,莱昂纳多还是没有拿 到奥斯卡。子曰:“善人教民七年,亦可以即戎矣”。

R 语言会议办了七年,在统计之都各位同仁的辛苦努力下,这次会议相比往届有了 更大的突破。本届会议的报名人数已经突破 1800,参会单位超过 600,包括数十位从新 疆、西藏、香港、澳门、台湾,甚至欧洲、美洲、澳洲远道而来的朋友。业界和学界的 单位数量比率约为 2:1,人数比率为 1:1。报名者中,互联网占据了超过三成的席位,IT 行业也贡献了四分之一,改变了之前 R 语言会议总是统计圈占大头的局面。这与 R 语 言的发展轨迹是完全一致的。上个世纪 R 语言主要应用于学界;2005 年 R 在欧美爆发; 2008 年国内燃起火焰,第一届中国 R 语言会议也应运而生;2013 年借助大数据的浪潮 走出了统计圈;2014 年开始,R 已经全面进入业界的工程应用。

回顾历届 R 语言会议,2008 年在北京召开第一届会议,大多数人甚至没有上台演讲 的经验,靠着一股血勇搞了个在当时被认为是自娱自乐的活动。2009 年开始渐成气候, 在鸟兄张翔的努力下,上海也形成了固定的分会场。2010 年是艰难的一年,好在所有的 统计之都小伙伴没有放弃,当作使命坚持了下来。2011 年迎来了业界的广泛关注,改变 了之前学界为主的局面。2012 年出现会议爆满的情况,无论北京还是上海都是一座难 求。2013 年终于可以轻松下来,不再发愁参会者和赞助的问题。2014 年自然要寻求新的 突破,于是汇集了全球领军的 R 语言公司、大数据时代顶尖的学者、产业界的大咖,开 始重新定义数据科学的含义。

正所谓风虎云龙、风云际会,再说下去就是物华天宝、人杰地灵了。让我们回到本 次 R 语言会议,主题是数据科学;这是个融合了数学和统计模型、IT 技术、业务知识的 全新领域,在大数据的时代真正地实现了数据分析的价值。R 的初心就是统计,纵然被 语言声名所累,这些年在 IT 界也积蓄了大量成功经验。当前,上千个优秀的 R 包绝大 多数都是来自于具体的行业和领域,从这个角度来看,R 已是数据科学界当之无愧的弄 潮儿。让我们一起怀着一期一会的心念,给这个数据的时代做一个不平凡的记号吧。

此时此刻,你我共聚中国人民大学。仰观数据之大,俯察品类之盛,所以游目骋怀, 足以极视听之娱,信可乐也。

23号晚上是工作人员以及一些嘉宾(主要是来自台湾的R group、中科大的青年才俊)在咖啡厅包间小聚了一下。给我印象很深的是台湾来的这几位朋友很健谈,我跟台湾R group中的亮亮(目前在台湾大学读硕士)聊得比较多,主要是聊生物统计,一致觉得counting process比较难。亮亮在25号可视化专题的报告中很幽默,迎来了一阵又一阵的掌声。

24号早上下雨(在北京难得),尽管如此,950张票还是派完了。1400人的会场,之所以只派950张票,是因为国家规定上了1000人的大会就要去公安局备案,这个很麻烦。为了解决人数问题,事实上我们还准备了很多工作人员的牌照。由于下雨,最后这些牌照没发多少。24号那天参会总人数在1100人左右,将一楼基本坐满了,二楼只坐了几十个人。

R会议终身名誉主席,吴喜之老师的致辞。(吴老仙风鹤骨,真像武侠小说中的世外高人)

Hadley wickham!R社区非常受欢迎的人物,RStudio首席数据科学家,著名的ggplot2包的作者。他的讲座用一句话概括就是:Creating R packages is easy!

David Smith先生一上台就自拍,然后发到自己的twitter上。

百度IDL的余凯先生,同时也是千人计划。他带领的团队获得“2013年百度最高奖”,他讲述了百度在deep learning方面的成果。

微软亚洲研究院的周明先生,生动有趣地教我们如何用计算机作对联与诗词,很文艺。

北大光华的王汉生教授,去年也在R会议上做了一场幽默的报告(还记得去年他说“学术研究不是向左走就是向右走”。24号这天他在国际论坛上也要做报告(他还挂着另一个胸牌哦),后来讨论的时候他的嗓子都哑了。

24号下午的专场有来自光大证劵,微量网的老总讲述R在量化投资中的应用,来自腾讯的工程师讲述它们如何在互联网上贴广告,来自优酷土豆的高级经理描述了数据分析在视频行业的应用。台湾来的郑义老师带着他的学生在台上为我们展示他们如何用R建立基金评选平台。 最后是八位嘉宾同时上台畅谈大数据,表达对如今被炒的异常火热的大数据的看法。

24号晚上的咖啡厅聚会,主要是和一些同学(中科大,人大的居多)听了阎军老师(目前在美国的Connecticut大学任教)讲述他们在招收phd时看重学生哪些方面的能力。

25号我上午我在A会场,听了张家齐(台湾R group的leader)教我们如何解决传统modeling中遇到的困难与挑战。家齐很善于演讲,又幽默,个人觉得他的风格有点像谢老大。另外,两个人都很瘦。 下午听了可视化专场。人果然多!反正那些图各种炫,确实挺吸引人的。

晚宴,有幸与Hadley wickham,Daviad Smith同桌。我坐在肖楠大神的旁边,肖楠坐在Hadley的右边,我为Hadley倒了三杯雪碧,David果然爱照相,自己拿着手机将酒杯与贵州茅台拍了好几张。图为大会主席在倒茅台以及晚宴过后的合影。 参加本次会议当然有很多收获,除了演讲内容,还交到了一些朋友。但想真正融入这个圈子还得多努力啊!最后借用金庸先生在《笑傲江湖》中的诗来结束本篇。

天下英雄出我辈,一入江湖岁月催。
皇图霸业谈笑中,不胜人生一场醉。

 
comments powered by Disqus