联系方式CONTACT 

当前位置: 主页 > 企业招聘 >

觊时娱乐共羸欢乐

疑似非法爬取简历数据创新工场深圳SAAS招聘平台遭举报!

来源:http://www.zodahk.com 责任编辑:觊时娱乐共羸欢乐 更新日期:2019-04-04 15:12

  3月24日,多家媒体报道称,号称中国最大的简历大数据公司,曾获两轮融资的“巧达科技”被警方一锅端。该消息发布后引发社会巨大关注,简历大数据背后的黑产由此曝光。

  近日,有内幕人士向探长爆料称,采用黑产手段获取简历数据的绝非巧达科技一家。深圳呗佬智能有限公司(下称:倍罗智能)表面上做简历解析器,背地里却招了十几个工程师,爬取了包括拉勾、智联、inkedin、招聘狗等第三方千万级的简历数据。另外,倍罗智能将简历解析器免费给猎头使用,在此过程中未经当事人同意收集和抓取了更多简历数据。

  如果说巧达科技是简历黑产界的“一哥”,那么倍罗智能应该就是“小弟”。公开资料显示,倍罗智能自2018年初以来,获得数千万元天使轮融资。和巧达共同的是,这家公司也入住了创新工场深圳办公空间。此外,这家公司号称还把产品成功的推销给了腾讯系企业使用。

  倍罗公司简介显示,Bello(倍罗)是一家提供人才解决方案的人工智能公司,为大型企业提供招聘系统智能化的升级方案,为人力资源服务企业开放 API 接口,同时也有 SAAS 产品面向广大中小企业。其产品包括精准人岗匹配、安卓手机兼职赚钱软件_安卓手机兼职赚钱。简历深度解读、简历职位分析。

  倍罗官网显示,腾讯、华为、Facebook、字节跳动、大疆、CGL、华润置地等公司已与其合作,开启了招聘自动化。

  据该公司一名离职人士爆料,Bello有两个主营业务,一个是简历解析器,另一个是做人岗匹配。其中,简历解析器是将docx或Pdf、html等格式的简历输入,然后返回结构化的字段。例如,姓名XXX,年龄XX,手机号XXX等等。

  至于人岗匹配,就是根据岗位描述,从大量的简历中快速检索出简历,并根据匹配度排序,快速找到最合适的人。不难发现,简历解析器是一款AI智能工具,要实现人岗快速匹配,必须要有海量的简历数据。

  那么Bello哪来的简历数据呢?根据Bello前工作人员爆料,Bello主要在拉勾、智联招聘、领英、58同城、大街网、招聘狗这些网站爬取简历。据悉,倍罗为获取大批量简历数据,招聘了大量工程师,利用爬虫技术抓取简历。

  那么招聘网站在技术上能拦截爬虫吗?报料人告诉商评君,这些网站普遍防爬虫技术不到位,换个IP地址就可以轻松绕开。

  显然,倍罗爬取第三方招聘网站简历数据既未经过第三方网站同意,也未获得简历当事人授权,属于私自恶意爬取行为。而倍罗将爬取的数据用于所谓的人工智能大数据分析,搭建自动匹配模型等,这一商业模式的背后,存在着明显的灰色地带。

  网络爬虫,也叫网页蜘蛛或网络机器人,是一种按照一定的规则,自动地抓取网络信息的程序或脚本。目前,互联网领域对网络爬虫抓取数据的一个基本共识是,网络爬虫其必须遵守网站Robots协议。但一些恶意爬虫工具是可以绕开网站防护壁垒,爬取全网数据的。

  2017年,21实际经济报道曾曝光,58同城招聘数据因为安全漏洞,被恶意爬虫大批量爬取,这种软件地下市场只卖700元。互联网招聘行业的两大巨头智联招聘和前程无忧都曾公开表示,网站均设置了安全规则,不允许第三方爬虫爬取简历数据。

  智联招聘官网在个人隐私保护政策文件内声明,网站在收集使用者的个人化信息后,将通过技术手段对数据进行去标识化处理,去标识化处理后的信息将无法识别主体。我们会使用已经去标识化的信息,包括进行数据分析、优化服务、提供针对性的服务等。但网站不会将带有明确个人信息的数据提供给第三方使用。

  各种非法爬虫爬取的数据有多大危害?一条新闻足以说明一切。据界面新闻报道,2018年12月28日,一个包含2.02亿中国求职者简历信息的数据库在国际网络上泄露,被称为中国有史以来最大的数据曝光之一。据悉,该数据库规模高达854 GB数据,共计202,730,434条简历详尽记录了大量敏感信息,包括个人全名家庭住址,手机号码,电子邮件,婚姻状况,子女数量,政治关系,身高,体重,驾驶执照,识字水平,薪水期望、教育背景、过去的工作经验等等。据网络安全专家推测,这些数据来自于第三方数据抓取,但不知为何,被泄露到网上。

  根据2018年5月1日实施的《信息安全技术个人信息安全规范》条例,间接获取包括但不限于自然人的姓名、出生日期、身份证件号码、个人生物识别信息、住址、电话号码等个人信息需要取得信息主体的同意,而简历内的个人信息几乎涵盖了上述所有敏感个人信息。

  根据《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》,向特定方提供或发布个人信息数量情节严重者可以入刑。对于“情节严重”的认定标准,司法解释明确规定了10种情形,包括非法获取、出售或者提供行踪轨迹信息、通信内容、征信信息、财产信息50条以上的;非法获取、出售或提供住宿信息、通信记录、健康生理信息、交易信息等其他可能影响人身、财产安全的公民个人信息500条以上的;非法获取、出售或提供前两项规定以外的公民个人信息5000条以上的;违法所得5000元以上的。

  探长注意到,倍罗没有公开披露其简历数据库的信息来源,亦没有披露其掌握的简历数量。但从其宣传看,中国平安、腾讯、今日头条都是其产品使用者。而要成功训练一个简历自动匹配AL产品,至少需要千万级的简历数据库做支撑。

  工商资料显示,深圳呗佬智能有限公司(下称:倍罗)成立于2016年11月24日,注册资本134.3219万元人民币,法人代表李松毅,共6个股东,分别为李松毅(持股34.62%)、深圳呗佬依斯欧倍管理咨询合伙企业(有限合伙)(持股25.48%)、深圳陨铁管理咨询合伙企业(有限合伙)(持股15.68%)、共青城梦元盈达投资合伙企业(有限合伙)(持股11.4%)、戚瑶(持股7.82%)、秦捷(持股5%)。

  企查查资料显示,深圳呗佬智能有限公司共有两起融资信息,分别于2016年9月30日获得种子轮融资,具体金额、投资方不详;于2018年1月3日获得昊翔资本和云天使基金投资的千万级人民币的天使轮融资。

  商评君注意到,持有呗佬智能11.4%股份的共青城梦元盈达投资合伙企业(有限合伙)共有7个股东,其中就包括北京昊翔资本管理有限公司。昊翔资本官网显示,其过往发起设立和募集成立的梦元影视产业投资基金,参与投资了万达影视股权投资。

  至于持有持有呗佬智能5%股份的秦捷,其公开身份是云天使基金创始人,曾任宽带资本和北京云基地投后负责人。

  云天使基金官网简介显示,云天使基金由宽带资本、红杉资本、北极光创投、金沙江创投以及双湖投资于2013年联合创立。投资范围涵盖:消费市场,企业服务,云计算及大数据,新型硬件等领域。其投资案例中,谷露(真格基金参与投资)与倍罗极为相似,都是做智能招聘管理的平台。

  根据媒体公开报道,Bello(倍罗)是一家人工只能辅助招聘Saas平台。2018年1月获得昊翔资本、云天使基金的天使轮+融资。

  创始人李松毅,天使投资人,自身为猎聘专家;MichaelPage(全球领先的招聘顾问公司米高蒲志)集团首位管培生,原伦敦上市集团Robert Walters(国际招聘咨询公司华德士)华南副董事。

  根据铅笔道的报道,李松毅与李开复相识于深圳软件园产业基地的一次晚会。李松毅向李开复这样介绍自己,“我在创投圈待过,也很懂人工智能与招聘。我想用人工智能去优化猎聘行业,您有什么建议吗?”

  让李松毅意外的是,李开复开口第一句直接问,“你辞职了吗?”;李松毅回答“还没有。”,李开复接着问,“你不辞职,我怎么帮你?”。

  正如铅笔道的报道,因为李开复的一句话,李松毅毅然辞职创业。创立倍罗之后,李松毅虽未获得李开复的投资,但Bello入驻了创新工场孵化器。与此同时,李开复还给李松毅找投资,介绍人脉资源。

  2018年4月15日,Bello在微信公号发布消息称,贝落智能荣获“最具价值企业奖”。根据文章介绍,Bello智能成功入选腾讯AI加速器项目,也是惟一一家人力资源领域的科技企业。

  在此之前,2018年2月22日,Bello在微信公号发布了一张开工大吉的图片,识别图中二维码进入到Bello制作的H5招聘页面。其在招聘简介中写道,“这款产品能让招聘效率提高5倍,如果你懂招聘行业或者拥有行业头部客户资源,学好新年提加薪|产品人不知道的五大PPT演讲技巧及案例实操,就会知道这意味着什么样的商机。”

  商评君注意到,Bello在H5页面留下了联系方式,其中联系地址为:深圳南山区软件产业基地4B栋2楼创新工场。Bello官网亦显示,其办公地址位于深圳市南山区软件产业基地 4B-204。公开信息显示,上述地址正是创新工场深圳办公室所在地。