乐天集团中国产业园区品牌连锁运营商

昔日数据科学竞赛大师作弊夺冠:终身禁赛

发布时间:2020-01-12 发布者:亚洲时报

据机器之心报道,近日Kaggle一项竞赛的讨论页面显示,一个名为“Bestpetting”的冠军团队因作弊被Kaggle取消了参赛资格,团队成员还包含一位Grandmaster。这位Grandmaster将被永久禁赛,因为有证据表明,他是该作弊活动的关键人物。


(图源:网络) 


据悉,该团队通过作弊的方式获取了测试集的答案,而且为了让分数看起来更加真实,他们只用了其中一部分答案。

 

此次被曝作弊的团队参与的是一项预测宠物领养速度的竞赛。研究表明,宠物被领养的速度与它们在网上的照片、描述等信息存在相关性。参赛者的任务就是找出这种相关性,帮助宠物领养机构优化宠物的电子档案,使其看上去更加“可爱”,从而提高被领养的速度,减少被安乐死的数量。

 

此次竞赛在去年三月份展开,奖金池总共2.5万美元,冠军团队可以获得1万美元的奖励。

 

而据Kaggle官方消息显示,该团队的作弊行为有:他们通过作弊的方式获取了私有测试数据的领养速度答案,并将之伪装成外部数据集的一部分;他们只使用了其中一部分被编码的答案,以使分数看起来更加“可信”;这些经过处理的代码被精心隐藏并混淆在许多嵌套的函数和代码层下,故意被设计成高度不可读和平淡无奇的样子。

 

然而伪装再好也改变不了它是作弊的事实。一位Kaggle网友在将优秀方案转化为生产过程的时候发现,冠军队伍的方案有猫腻,于是将情况上报给Kaggle组委会。经调查,冠军队伍确实存在作弊行为。举报者还写了一个详细文档来说明该作弊行为。

 

据报道,确认作弊后,Kaggle组委会取消了冠军团队的资格,并重新修改了排行榜。不过当时颁发给冠军团队的10000美元奖金已经难以追回。在这种公益性赛题中,该团队为了经济利益而作弊,实在让人不齿。这也是Kaggle创立以来首次在赛后9个月才发现作弊行为。

 

据悉,该团队的Kaggle Grandmaster同时也在硅谷一家开源软件公司H2O.ai任数据科学家职位。事发后,公司已经作出了回复,称“已进入调查程序,此人与我司不再有任何关系”。还有人爆料,这个Grandmaster在Kaggle比赛中出现不端行为已经不是第一次了。

 

对此,这位Grandmaster辩解称,他们没有向大众隐藏自己的方法,所以没有违反规则。“如果比赛本身就有漏洞,那总会有人去利用。不用的话就会失去优势,得到令人失望的结果。所以摆在参赛者面前的只有两个选择:要么退赛,要么利用漏洞。”


 

涉事Grandmaster回应 (图源:机器之心)


据悉,作为最著名的数据科学竞赛平台,Kaggle成立于2010年,并于2017年被谷歌收入旗下。迄今为止,这一平台上已经举行了三百多场各种类型的数据竞赛。很多公司、政府研究机构都会把自己的数据放上来,让他们帮助自己建模型,并设立奖金。

 

为了激励参赛者不断挑战新的难题,Kaggle设置了一个排行榜,将参赛者分为“Novice”、“”Contributor”、“Expert”、“Master”、和“Grandmaster“四个等级。要晋升到竞赛的“Grandmaster”,参赛者需要至少获得5枚金牌。

 

亚洲时报 综合

责任编辑:Carrick

特别声明:本站转载或引用之图文若侵犯了您的合法权益,请与本站联系,本站将及时更正、删除。版权问题及网站合作,请通过亚时财经邮箱联系:asiatimescn@sina.com

热门话题更多>>

扫一扫手机阅读

ATimesCN手机网站