ICML是国际顶级的机器学习会议,它与NIPS一起,是机器学习与人工智能研究领域影响力极高的两个主要会议。今年的ICML将于8月6-11日在澳大利亚悉尼开会,预计也将前往现场展开报导。早在5月时,ICML 2017被拒绝接受的论文就早已发布了。
今年的ICML接到了创纪录的1676篇论文,434篇被拒绝接受(也刷新了新纪录)。OpenAI的研究科学家Andrej Karpathy对这些论文不作了分析,并找到了一些有意思的事。
根据分析,所有论文中共经常出现了961个机构名称,其中420个只经常出现了一次。论文数前30名的机构如下:统计资料中Google和微软公司的论文数排在了前两名,CMU分列第三。必须留意的是,统计资料中Google、Google公司、Google大脑和Google Research都归属于一个类别,某种程度的还有斯坦福和斯坦福大学。
一篇论文中多个人归属于同一机构时会拆分。从这些统计资料中也可以显现出,工业界公开发表的论文占到了极大的比例。Karpathy统计资料了一些较为著名的工业界实验室的论文状况,比如DeepMind、Google、微软公司、Facebook、IBM、迪士尼、亚马逊和Adobe,找到他们的论文占到论文总数的14%。而如果算上其它不过于著名业界公司的论文,他指出大约20-25%的论文有公司参予。
也就是说,ICML 2017的论文中约四分之三是几乎来自学术界。另外,由于DeepMind和Google可以算数一家,加在一起它们共计参予60篇论文,占到总论文的6.3%。大幅分析这些论文可以找到,在2011年时很少有工业界研究经常出现在ICML上。
而现在公司的参予有了很明显的提升。不过学术界依然做到得很好,贡献了相当大一部分论文。
还有其它一些较为有意思的统计数据。以第一作者身份论文被拒绝接受最少的是一位中国研究者朱泽园,他有5篇论文被拒绝接受。
他如今在北美的微软公司研究院工作。对第一作者所在机构展开统计资料,名列前五的是CMU(25),Google(19),DeepMind(15),MIT(14)和UCB(14),可见Google的实力。
微软公司研究院以10篇位列第七。显数量统计资料并无法反应现实的研究状况,一个更加最重要的指标也许是论文被提到的情况,却是论文不是与生俱来公平的。工业界与学术界内容被提到的情况如何,这点还没统计资料。
ICML也也是看出机器学习近期趋势的途径之一。深度自学当然是最重要的内容,但检索标题找到,只有6篇文章不含这一关键词。其它经常出现频率较高的研究领域还有:增强自学,随机及高斯过程,映射(embeddings),贝叶斯优化,AutoML(用机器学习探寻神经网络架构)等。
除了论文,ICML上最不受注目的要科每天的主题演说了。今年大会决定了四场主题演说,涵括了AI的前沿、应用于和社会影响等方面。四大主题演说牛津大学Peter Donnelly他演说的主题是:基因组学、大数据与机器学习:解读生命图普,推展医疗革命。
演讲会通过明确的例子来解释,将机器学习和其他推理小说工具应用于基因组数据的机会和挑战。Donnelly是维康信托中心人类遗传学研究室主任和牛津大学统计学教授,以及Genomics Plc公司CEO。
他是牛津大学博士,曾任伦敦大学和芝加哥大学教授。他的早期研究工作牵涉到人口遗传学随机模型的研发,后来渐渐研发研究遗传和基因组数据统计资料方法。他和团队研发了多种普遍用于的统计算法,还包括STRUCTURE和PHASE。他还领导了一个取名为wWGS500的项目,在其中牛津大学与Illumina合作,对500名具备一系列临床条件的个体展开测序,以评估临床医学中全基因组测序的短期潜力,这一项目也是NHS 100000基因组计划的前身。
过去10多年,基因测序的成本呈圆形指数级上升,而未来10多年,也许不会有将近10亿人展开基因测序。海量的基因数据与个人的病历信息和可穿着设备信息的融合,将明显提升我们评估个体身体健康风险、预测健康状况以及作出个性化化疗的能力。
哈佛大学Latanya Sweeney她的演说主题是:AI设计者如何影响公民生活作为哈佛大学政府和技术学院教授,Sweeney的愿景是研发和运用技术,来评估和解决问题社会、政治和管理问题。她的重点研究领域是技术对人类的影响,她本人还是Technology Science总编辑。她对数据隐私也很感兴趣,是哈佛数据隐私实验室主任。
她指出,技术设计者(Technology designer)是新的决策者。虽然他们没经过议会选举,而且大多数人不告诉他们的名字,但正是他们开发工具和创意时作出的要求,影响了那些能规范我们日常生活的代码。隐私和安全性是新技术的第一个挑战,而随着技术的变革,生活的方方面面都会被新的定义。DeepMind的Raia Hadsell她的演说主题是:迈进现实世界的强化自学她是DeepMind的高级研究科学家,在深度自学和机器人领域有10多年研究经验。
她早期的研究与用暹罗网络展开多学科自学有关,这可以用作恒定特征自学。她的博士导师是Yann LeCun,后来重新加入CMU的机器人研究所,以及SRI International。她在2014年初重新加入了DeepMind,开始研究标准化人工智能。
她目前的研究侧重于AI代理和机器人系统持续自学的挑战。深度增强自学早已很快发展沦为极具潜力的人工智能研究领域,大量的雅达利游戏也被用作许多基础研发的主要基准。随着研究的成熟期,更加最重要的是研发简单的自学系统,以解决问题更加简单的任务。
她预计不会讲解DeepMind的最近研究,这些研究与在现实世界和具备简单任务结构的挑战性环境中展开末端到末端自学有关。马克斯·普朗克智能系统研究所Bernhard Schölkopf他的演说主题是:因果自学。Schölkopf的主要研究领域是机器学习和因果推理小说。
他将研究应用于许多有所不同的领域,比如生物医学问题、计算出来摄影和天文学。他曾在AT&T贝尔实验室和英国的微软公司研究院工作。他是德国科学院的成员,取得过国际模式识别协会的J.K. Aggarwal奖。
在机器学习中,不会用于数据来自动找寻倚赖关系,目的是对未来展开预测。大多数机器学习方法都创建在统计学上,当然也可以更进一步分析数据在统计资料依赖性后的因果结构。
Schölkopf指出,这样的因果科学知识可以协助在机器学习任务中作出预测。他在演说中也不会提及因果模型对机器学习任务的影响,如迁入自学和半监督自学。(公众号:)将在现场带给ICML 2017的即时报导,若无注目我们的先前文章。
原创文章,予以许可禁令刊登。下文闻刊登须知。
本文来源:澳门威尼克斯人网站-www.yqgloves.com