登陆

失败者仍是啦啦队长? AI能辨认自拍照给人分类了

admin 2019-11-12 199人围观 ,发现0个评论

早在2009年,美国斯坦福大学和普林斯顿大学的科学家就曾提出想象,期望教授计算机辨认国际上的任何物体。为了完成这个方针,他们需求许多图片,除了猫、狗、苹果、叉子、勺子等,还需求很多人类的图片。

这些图片被区分为不同的类别,然后被展现给机器学习算法。跟着时刻的推移,算法将渐渐学会怎么分辨出勺子和叉子的差异。研讨人员建立了包含1400多万张图片的数据集ImageNet,所有失败者仍是啦啦队长? AI能辨认自拍照给人分类了这些图片被分红2万多个类别,每个类别均匀有1000张图片。

现在,ImageNet现已成为国际上被引证最多的物体辨认数据集,在研讨论文中被引证超越1.2万次。不过,ImageNet不仅仅包含物体方针,它还有近3000个专门用于人的类别,包含运用相对无害的术语描绘这些人类,如“啦啦队长”或“明星”。

可是,经过亚马逊渠道Mechanical Turk运用人力众包,许多分类描绘令人深感不安。这些类别包含“坏人”、“伪君子”、“失败者”和“胆小鬼”等,并且每个类别中都有很多图片,它们是从Flickr和其他交际媒体网站上搜集而来的,且未经图片所有者的赞同就被运用。

失败者仍是啦啦队长? AI能辨认自拍照给人分类了

ImageNet和其他类型练习数据集是米兰普拉达基金会(Prada Foundation)新展览的主题。这个名为“练习人类”的展览由特雷弗帕格伦(Trevor Paglen)和教授兼研讨员凯特克劳福德(Kate Crawford)策划。它展现了组成ImageNet等数据集的图片,并向拜访者展现了为计算机视觉和面部辨认体系供给支撑的各类图片。

其间ImageNet遭到特别对待,它在画廊里有自己的展厅,人们的相片在那里被粘贴到卡片上,而卡片上印有它们的类别标签。这与曩昔拟定科学卡片目录的方法类似,就像昆虫标本被定在印有它们学名的卡片上那样。

关于不能拜访米兰的人,帕格伦和克劳福德创立了名为ImageNet Roulette的在线东西,该东西针对ImageNet的人类分类功用进行练习。它能够让你用网络摄像头拍照相片,运用链接或许上传某个人的任何相片,然后它向你供给ImageNet对该相片中方针人物的分类。

帕格伦和克劳福德在本年早些时候奥斯汀的South by Southwest会议上演示了该东西,并附上了一些相片。里奇是帕格伦作业室的开发者,但他的一些相片被以为是“马屁精”,克劳福德的头像则获得了“女英雄”的分类。

当我(本文作者,Fastcompany记者凯瑟琳施瓦布(Katharine Schwab))用电脑的网络摄像头亲身测验时,ImageNet确认我是个“心思语言学家”,原因尚不清楚。帕格伦说:“我以为,天天向上20130816总体上来说,对人类进行分类是一件值得进行更多检查的作业。”

帕格伦将机器学习的鼓起和人们对其算法是否客观的观点比作19世纪末20世纪初的拍摄史,其时许多人以为这些别致的图画天然生成便是中立的。他说:“当拍摄被发明时,人们以为它是客观和中立的,并鼓舞咱们现在以为的那群伪科学学者丈量人们的面部,以确认他们是不是罪犯。”

当然,现在咱们现已能够确认,拍摄带有片面认识,帕格伦和克劳福德期望提醒当今人工智能(AI)体系的本相,改动人们的遍及观点,即它们在某种程度上是中立的,由于它们是用数学模型构建的。克劳福德解说称:“不管构建什么样的体系对人类进行分类,它总是具有片面性,并有一种内涵的调查方法。”失败者仍是啦啦队长? AI能辨认自拍照给人分类了

这次展览失败者仍是啦啦队长? AI能辨认自拍照给人分类了可能是许多人第一次瞥见算法体系的基础练习图画,但有些最重要的相片却不见了。尽管“练习人类”展览包含开源或可供研讨运用的数据集,但它排除了咱们这个年代某些最强大数据会集的图画,如Facebook上的很多图画。

克劳福德还想着重,这些杂乱的技能体系的本源在于人们日常日子中的尘俗形象。他说:“它们不是那些没有人能了解的极端笼统的数学体系,而是咱们日常日子中的实在反映,它们现已被摄取到这些大型体系中,以使AI更好地进行面部辨认或进行‘情感检测’。”

但这并不意味着它们是无害的。面部辨认是极具争议性的,而情感辨认的本相也开端被科学家戳穿。

展览中包含的数据集之一是1997年的日本女人面部表情数据集,其间有213张相片,被分为六种面部表情,这些表情被以为与心里的心情状况相对应,分别是高兴、惊奇、哀痛、讨厌、愤恨和惊骇。克劳福德指出,这是个典型例子,标明仅仅用六个类别来表达人类情感肯定不行。

另一个被称为FERET的数据集是由美国中情局在20世纪90年代末赞助创立的,它运用了在德克萨斯大学奥斯汀实验室作业的研讨人员、实验室助理和看门人的图画来练习检测人脸的算法。

尽管许多机器学习数据集都有很大的缺点,但不管是学术研讨人员仍是公司都在布置它们。但克劳福德关于怎么更好地对数据集的固有误差进行编目有自己的主意,这样未来的AI科学家运用它们时,他们至少会认识到这个问题。

2018年,克劳福德与其他八名研讨人员协作进行了一个项目,该项目为练习集创立标签,其间包含关于图画来自何处、人口统计学区分、创立者、图画受试者是否赞同、任何隐私问题以及数据集的原始目的等信息。这些“数据集的数据表”现已在职业中得到了部分选用,这是研讨人员向了解他们AI数据意义迈出的一小步。

关于帕格伦来说,能够做些什么来削减机器学习练习集的简单化和彻底禁绝确是个更大的问题,由于他信任技能永久不可能是中立的,他以为这些体系的设计者应该质疑对人类进行分类是否真的是他们想要做的作业的一部分。他说:“你想日子在一个什么样的国际里?这是首要需求弄清楚的问题。”

极彩娱乐官网版下载-“扇贝疑团”岂可没完没了

2019-12-06
  •   蔡名照在宗旨讲演中说,近年来,国际传媒业发作了巨大革新,

  • 极彩娱乐官网版下载-国际媒体峰会第四次主席团会议在上海举办

    2019-12-06
  •   据悉,正在拟定的举动计划中,将在推进混合所有制变革、加强国资国企监管、增强研制立异才能、强化财政硬束缚、减少和标准补助、完善鼓励机制、进步劳动生产率和资金回报率等关键范畴和要害环节,提出明晰的使命举动,拟定可量化、可查核的详细方针,推进国有企业变革在重要范畴和要害环节获得决定性效果。记者近期调研一起得悉,多家央企和国有企业也在拟定各自的变革计划和举动计划,以全面增强国有经济竞争力、立异力、操控力、影响力、抗危险才能为方针,推进国有企业变革向纵深开展。

      自2015年开端,国企变革向纵深开展,以顶层规划为指引,构成了以《深化国有企业变革辅导定见》为统领、若干配套文件为支撑的1+N方针文件系统,为国企变革供给了准则系统和方针根据。从“四项试极彩娱乐官网版下载-国企变革三年举动计划加快酝酿 变革要点范畴和关键环节将拟定可量化详细目标点”到“十项试点”,从单项变革举动到归老倪除除乐纳性变革“双百举动”企业、区域性国资国企归纳变革、培养具有国际一流竞争性企业,国有企业变革现已由点到面全面铺开,进入落地施工期。

      记者了解到,近期中

    极彩娱乐官网版下载-国企变革三年举动计划加快酝酿 变革要点范畴和关键环节将拟定可量化详细目标

    2019-12-06
  •   全国卫生检疫规范化技能委员会

    全国卫生检疫标准化技能委员会建立

    2019-12-06
  • 请关注微信公众号
    微信二维码
    不容错过
    Powered By Z-BlogPHP