彩神APP争霸平台可信不_彩神APP争霸平台可信不官网_ 你以为自己在填验证码,其实你是在给Google义务劳动

  • 时间:
  • 浏览:4
  • 来源:彩神8ios下载_彩神8软件靠谱吗

  欢迎关注“创事记”的微信订阅号:sinachuangshiji

  每次输入验证码,你回会义务劳动

  文/邢逸帆

  来源:硅星人(ID:guixingren123)

  最近,硅星人发现,上网遇见的验证码“如此有内容”了。

  为了证明某些人是个真人,除了要输入方框里的文字,还得做从下面图中挑出路牌、挑出门牌这名连连看似的高级任务。

  在连续干了好几茬回会,硅星人一个劲 醒悟:我这哪里是在填验证码,根本却说在帮别人标注数据,训练AI啊!

  不管是给图片分类:

  给路牌勾边:

  还是把路牌圈出来:

  感觉回会在教无人驾驶的AI认路啊……

  真是 ,“输验证码却说在为AI打工”并回会硅星人想得太大。事实上,亲戚亲戚朋友在输验证码时义务劳动的历史,从古早的文字验证码时期就开使了了。

  每次输入验证码,你回会义务劳动

  今天,应用最广的验证码系统却说reCAPTCHA(Completely Automated PublicT uring Test To Tell Computers and Humans Apart,区分人机的全自动图灵测试系统)了。

  这家如今已被Google收购的公司,承担了世界上大要素网络的人机验证工作(上文给出的4个 例子均来自reCAPTCHA)。

  1507年,reCAPTCHA的创始人之一,卡内基梅隆大学教授路易斯·冯·安(Luisvon Ahn)想到:“可能人类与机器各有擅长,可都可不都可以利用验证码系统,你可都可不都可以类和机器一起处理大问题呢?”

  当时,4个 亟待处理的大问题却说,要怎样把浩如烟海的人类纸质典籍数字化

  回会数字化文本,这名辦法 是手工录入。这名辦法 费时费力,还容易出現 录入错误。另这名辦法 是先扫描文本,再结合光学文字识别技术录入文字。听起来很美,但某些年代久远或这名质量就差的文本扫描出来后真是 是太糊了……

  以至于电脑识别出来的文本漏洞百出,根本如此看。

  为了处理文本数字化的大问题,1507年,路易斯推出了新的验证码系统reCAPTCHA。 

  在 reCAPTCHA验证码系统里,4个 验证码会由两要素构成。

  第一要素和回会一样,是自动生成回会经过变形处理的文字,用来检验你是回会真人。而第二要素,则是从无法识别的文本中截取出来的词。

  可能用户正确输入前半要素,如此 reCAPTCHA就会假设用户输入的后半要素也是正确的,回会把录入结果返回至reCAPTCHA的项目主机。

  结果返回主机后,主机回会把这名结果再埋点给多个用户进行交叉验证,以确保如此不小心或故意输错单词的情形。

  也却说说,真正有效的人机测试在验证码的前半段可能完成,而后半段,却说用户在义务为人类文明做贡献了。

  如此,reCAPTCHA到底做了多大贡献呢?

  1507年推出之初,reCAPTCHA每天都能帮助录入1150万个字符。1508年,这名数字飙升到了15000万个。粗略统计,在今天,全世界每天回会2亿个字符通过 reCAPTCHA录入,最少人类20万小时的工作量。

  也却说说,4个 人要不吃不喝不睡连轴转两年半,都可不都可以完成 reCAPTCHA一天的工作量。

  到今天为止, reCAPTCHA可能录入了从1851年至今的所有《纽约时报》,共计1150万篇文章。除《纽约时报》外,reCAPTCHA还数字化了超过21150万本书,而全球的图书数量约为1.3亿本。

  路易斯在接受媒体TheHustle采访时如此 评价 reCAPTCHA:“我创造了4个 系统,以十秒为单位,数百万小时为增量,来利用世界上最宝贵的资源:人的大脑。

  验证码是在剥削亲戚亲戚朋友么?

  可能reCAPTCHA的故事到这里就开使了了,每某些人回会很开心。但事情没如此简单。

  1509年,Google以最少27150万美元的价格收购了 reCAPTCHA,并开使了利用 reCAPTCHA帮助标注数据。

  正如前文所说,reCAPTCHA的前半段是在验证你是回会真人,后半段却说真人为验证码打工阶段了。

  2012年,Google开使了把Google街景中难以识别的门牌和路牌加入验证码,请用户帮忙标注。

  除了标注门牌路牌,让用户帮忙给数据库分类也是常见的形式之一。比如下图这名请用户“挑出所有有猫的图片”的验证码。

  如今,Google AI可可都可不都可以精确辨认路牌上的文字和数字,准确度和人眼不相上下。

  当有一天亲戚亲戚朋友终于用上Google的自动驾驶技术,依靠AI来辨识路牌和路灯时,这肩上都可不都可以不说如此上千万用户无偿标注的苦劳。

  对于这名目的,Google也之好多好多 有避讳。在 reCAPTCHA官网上,Google公开说明了 reCAPTCHA集众人之力标注数据、训练AI的“众包”模式。

  回会仍有用户对这名点感到不满。

  一位真是 验证码不道德的Reddit用户写到:“这就好像让几百万某些人每人为你干5秒钟活儿,回会一分钱回会给一样,这最少么!”

  验证码的前世今生

  验证码提出之初,是为了处理4个 很糙真是 的大问题。

  网络世界如此大,你要怎样知道网线另一端是回会十根狗(可能机器人)?

  在公开版面上,刷评机器人可都可不都可以用几瓶垃圾评论和广告淹没真人用户留下的有价值的信息;在金融交易平台,脚本多线程 可都可不都可以靠不停试验来暴力破解密码;在票务网站,我敢说你就算有十只手也抢不过自动刷票的黄牛……

  要怎样选取网络请求是真人发送的,成了维护网络环境和保护用户安全的大大问题。

  1502年,正是路易斯·冯·安提出了这名切实可行的处理方案,能分清网线对面“是人是狗”。

  真是 计算机的算数和分析能力比人类强得多,回会当时的计算机连“一只小猫在奔跑”这名难不倒三岁小孩儿的图都认沒有来。基于这名思想,路易斯和某些同事公司合作 者开发了reCAPTCHA的祖宗 CAPTCHA,也却说亲戚亲戚朋友俗称的验证码。

  初代验证码一般是某些经过扭曲变形的文字或数字。人类可都可不都可以识别哪些文字(尽管偶尔也会出現 连人类也认沒有的情形),但机器难以理解字符的含义。

  回会,验证码也经历了算数题、选取题,甚至植入广告等类型的迭代,但都掩盖不住4个 最致命的大问题:真是  CAPTCHA可能是相对比较好的处理方案,但也之好多好多 有铁板一块。

  通过撞库、人工智能识别图像、甚至是把验证码图片返回给人工再批量输入等辦法 ,黑客们总能为垃圾脚本找到可乘之机。

  更别提某些验证码,连真人都搞不定!

附加题:请点击图中所有的范伟

  正可能验证码浪费时间,辨识难度大,回会对于执行某些特定行为(比如爬数据或做学术研究)的人类用户而言极不友好,验证码长期在“互联网时代最烦人科学科学发明 ”榜上名列前茅。

  于是, reCAPTCHA推出了更科学的验证系统。这名验证系统会检测用户的客户端环境,追踪用户的鼠标和键盘操作轨迹,提高了机器人的模拟成本。用户再却说还都可不都可以苦哈哈地识别歪歪扭扭的文字,只还都可不都可以在对话框里点击“我回会机器人”,就能通过验证。