第四章 岌岌可危的白领工作

2015-06-15 14:33:13

  2009年10月11日,洛杉矶天使队在美国职业棒球大联盟季后赛的较量中战胜了波士顿红袜队,将与纽约扬基队争夺联赛冠军,并获得进入世界系列冠军赛的机会。这场胜利让天使队格外激动,因为仅仅在六个月前,他们当中最有前途的球员和投手——尼克•亚登哈特(Nick Adenhart)被一名醉酒司机驾车撞死。一位体育记者在文章开头这样描述了这场比赛:

  天使队第九局一度落后2分,形势十分不妙,但基米尔•格雷罗(Vladimir Guerrero)关键的一记安打使洛杉矶看到了希望,最终在周日于芬威公园以7:6战胜波士顿红袜队。

  格雷罗为天使队拿下2分,4次击球,打出3个安打。

  格雷罗说在接受采访时说:“如果要纪念尼克•亚登哈特,还有阿纳海姆4月发生的一切,我可能会用(我的职业生涯中)这最漂亮的一击,因为我要将它献给我的前队友,那个去世的家伙。”

  格雷罗在整个赛季的本垒表现都很出色,尤其是白天的比赛。在白天的比赛中,格雷罗的攻击指数达到.794 (OPS)。他在白天的26场比赛中,打出了5个本垒打,拿下13分。

  该文的作者可能不会马上就得到任何写作的奖项。但文章却仍是个了不起的成就:不是因为它可读性强、语法正确,或是对棒球比赛有着准确的描述,而是因为作者是一项计算机程序。

  提到的这款软件叫做“StatsMonkey”,由西北大学智能信息实验室的学生和研究人员创建。StatsMonkey通过将一场特定比赛的客观数据进行加工,能自动编写出一篇体育报道文章。该系统不只是简单地罗列事实,它还融入体育记者同样会加入的各种关键要素。StatsMonkey通过统计分析,识别出比赛期间发生的显著事件,然后它会生成一篇自然的文章,总结出整场比赛的动态,同时还关注比赛的关键点和关键球员。

  2010年,西北大学负责监管计算机科学和新闻专业StatsMonkey学生开发团队的研究人员筹集到了风险投资,并成立了一家新公司“自动写作技术公司”(Narrative Sciences, Inc.),欲将这项技术商业化。公司聘请了一批顶尖的计算机科学家和工程师,然后抛弃了原来的StatsMonkey计算机代码,建立了更强大、更全面的人工智能引擎,命名“鹅毛笔”(Quill)。

  自动写作技术已被包括《福布斯》在内的顶级新闻媒体所使用,其自动生成文章涵盖各种领域,包括体育、商业和政治等。该公司的软件大约每30秒钟生成一篇新闻故事,其中很多发表在不想承认使用过该服务的知名网站上。在2011年的行业大会上,《连线》杂志作家史蒂芬•列维(Steven Levy)希望自动写作技术公司联合创始人克里斯蒂安•哈蒙德(Kristian Hammond)预测一下未来十五年由程序写出的新闻文章的比例,他的答案是:90%以上。

  自动写作技术公司将目光远远投向新闻行业之外。“鹅毛笔”被设计成一个通用的分析和叙述写作引擎,能够创作出一系列行业内外所需的高质量报告。“鹅毛笔”首先通过各种渠道收集数据,包括交易数据库、财务和销售报告系统、网站,甚至是社交媒体等。然后开始分析,梳理出最重要、最有趣的事实和观点。最后,它将所有信息汇总成一篇连贯文章,声称能赶得上最好的人工分析师。“鹅毛笔”系统一旦配置成功,能几乎在瞬间生成业务报告并能不间断提供,完全不需要人工干预。公司最早的支持者之一是中央情报局的风险投资商In-Q-Tel。公司的软件可能会被用来把美国情报机构收集的原始数据流自动转换成容易理解的语言格式。

  “鹅毛笔”技术向我们证明,曾经只有受过大学教育的熟练专业技术人员才能驾驭的领域在自动化面前是何等的脆弱。当然,知识型工作通常需要各方面的能力。除此之外,分析师可能还需要知道如何从各种系统中获取信息,进行统计或财务建模,然后写成看得懂的报告和介绍。毕竟,写作既是科学,也是艺术,似乎是最不能用自动化完成的事情之一。但它还是实现了自动化,而且程序算法还在迅速提高。事实上,因为知识型工作仅仅使用软件就能实现自动化,所以在很多情况下,这些工作职位比需要体力操作的低技能工作更容易受到影响。

  还有,写作也恰好是雇主们总是抱怨大学生能力不足的领域。最近对雇主所做的一项调查显示,约有一半新雇用的两年制大学毕业生和超过四分之一的四年制学位毕业生写作能力较差,有的甚至阅读技能也很糟糕。如果智能软件真能如自动写作技术公司所说,比得上最有能力的人工分析师,那未来所有大学毕业生要实现知识型就业增长就更令人怀疑了,尤其对那些根本没有做好准备的人来说。

  大数据和机器学习

  “鹅毛笔”写作引擎是正在开发的众多新的应用软件中的一种,用以利用全球企业、机构和政府收集和储存的庞大数据。据估计,全球存储的数据总量现在要以上万艾字节测量(一艾字节等于十亿千兆字节),而该数据还有自己摩尔定律似的加速增长,大约每三年加倍一次。几乎所有数据现在都以数字格式储存,因此可由计算机直接操作访问。仅谷歌的服务器每天就要处理大约24拍字节(一拍字节等于一百万千兆字节)的信息量,主要是数百万用户每天在搜索的信息。

  所有这些数据都有多种不同的来源。单就互联网来说,来源就包括网站访问、搜索查询、电子邮件、社交媒体互动和广告点击等。企业来源包括交易、客户联系、内部沟通,还有财务、会计和销售系统的数据等。在现实世界中,传感器还会不断捕捉工厂、医院、汽车、飞机、以及无数其他消费电子设备和工业设备的实时运行数据。

  这些数据的绝大多数都是计算机科学家所称的“非结构化”数据。换言之,捕捉的数据以各种格式存在,往往难以匹配或比较。这与传统的关系型数据库系统有很大的不同,传统系统的信息行列一致,整齐排列在一起,使搜索与检索快速、可靠和精准。大数据的非结构化性质引领了专门用于理解各种渠道收集的信息的新工具开发。这个领域的迅速发展,至少在有限意义上,只是计算机开始染指人类独有能力的一个例子。毕竟,能够连续处理我们环境资源中的大量信息是人类特别擅长的事情之一。当然,不同之处在于,在大数据领域,计算机能够规模化处理信息,而这对一个人来说是不可能的。大数据正对包括商业、政治、医学和几乎每一个自然和社会科学领域都产生着革命性的影响。

  大型零售商依靠大数据对单个消费者购买偏好的洞悉到了前所未有的水平,让他们能做出精确定位,在增加收入的同时也有助于建立客户忠诚度。全球范围内的警察系统都在运用算法分析来预测犯罪最有可能发生的时间和地点,然后相应地部署力量。芝加哥的城市门户网站可以让用户看到大城市中沉浮生活的历史和实时数据,包括一定时期内能源的使用、犯罪、交通性能指标、学校和医疗保健,甚至坑洞的填补数量等。从社交媒体互动和各种门、转门和自动扶梯的内置传感器收集数据,并将这些数据进行可视化处理的新工具,可以让城市规划和管理者们看到城市环境中人们如何移动、工作和交流的生动图景,这种发展可能使城市更加高效和宜居。

  但是,数据应用的发展也有不好的一面。目标公司(Target, Inc.)为如何利用数量浩大且非常详细的客户资料提供了一个有争议的例子。该公司的一位数据科学家发现一组复杂的相互关系,即从女性购买的25种不同的健康和美容产品能对怀孕早期精准预测。该公司的分析甚至能高精度估算出女人的预产期。目标公司在这样的早期阶段就开始对女人们进行妊娠相关产品的推销,而在某些情况下,准妈妈们还没与她们的直系亲属分享怀孕的消息呢。

  2012年初《纽约时报》上发表的一篇文章中,报道了一个案例,一名少女的父亲向卖场管理部门投诉送到他家的邮件,后来才知道,原因是目标公司比他知道的都多。一些批评人士担心,这个让人毛骨悚然的故事仅仅是个开始,而大数据将越来越多地被用于进行预测,可能将侵犯隐私,甚至自由。

  我们从大数据中获得的东西通常全部来自一种相互关系,它并不能告诉我们现象的原因。计算机算法可能会发现,如果A为真,B很可能也为真。但它不能说A导致了B或B导致了A,再或者也许A和B是由某些外部因素导致的。但在很多情况下,尤其是在商业领域,成功的最终衡量标准是盈利能力和效率,不是深入的理解,单靠相关关系就能创造非凡的价值。大数据可以让管理层前所未有得掌握各个领域的情况:从一台机器的操作,到一个跨国公司的整体运作,这些都能进行分析,且详细程度在过去是不可能实现的。

  日益增长的数据大山正越来越被人们视为具有开采价值的资源,无论对现在还是将来而言。正如采掘行业,如石油和天然气,从技术进步中不断获益,我们可以相信,计算能力的加速发展和软件分析技术的不断改进将使公司发掘出新的策略,带来利润的直接增加。事实上,大概是投资者对此的预期使得像“脸书”(Facebook)这样的数据密集型公司产生了巨大的市场估值。

  机器学习,是计算机对数据进行摸索,然后将它发现的统计关系写成自己程序的一种技术,它是获得数据价值最有效的手段之一。机器学习一般包括两个步骤:首先对已知数据进行算法训练,然后用新信息来解决相似的问题。机器学习的一个普遍应用是垃圾邮件过滤器。算法训练方式可能是通过对上百万封邮件进行预归类,分为垃圾邮件和非垃圾邮件,软件可以完成这样的工作。结果,能自动识别绝大部分垃圾邮件的应用程序经不断改进和调适,还可以在今后有更广泛的用途。基于相同原则的机器学习算法还能推荐亚马逊上的书,网飞的电影以及默契网(Match.com)上可能的那个人。

  谷歌的在线语言翻译工具最能证明机器学习能力,当它问世时也最为激动人心。它是通过分析和比较几百万页已被翻译成多国语言的文本,并采用一种可能叫做“罗塞塔石碑”(Rosetta Stone)的方法来工作的。谷歌的开发团队一开始专注于联合国编写的正式文件,然后将视线延伸至互联网,公司的搜索引擎能够在那里找到大量满足其自主学习算法的素材。用于训练系统的文件数量之多让以往的训练都相形见绌。领头人计算机科学家弗朗茨•奥赫(Franz Och)指出,团队已经建立了“非常非常大的语言模型,远远大于人类历史上任何人所建。”

  2005年,谷歌系统参加了年度机器翻译竞赛,该竞赛由美国国家标准与技术局举办,它是美国商务部公布计量标准的一个机构。谷歌的机器学习算法轻松地超越了竞争对手,它通常雇佣语言专家,尝试使翻译系统走出语言矛盾和不一致的语法规则的泥潭。这里学到的主要一点是,当数据组足够大的时候,数据中所包含的知识甚至能胜过最好的程序员。谷歌的系统与熟练的翻译人员相比还不具竞争力,但它提供了超过500对语言之间的双向转换。它代表了通信能力真正颠覆性的进步:人类历史上第一次,几乎任何人都可以立即免费得到几乎任何语言任何文件的简单翻译。

  虽然机器学习的方法有很多种,但其中最强大也最吸引人的方法之一是使用人工神经网络的技术,或是与人的大脑基本操作原理相同的系统。大脑中含有多达1000亿个神经元细胞,还有细胞之间数万亿的神经连接,但用配置更基本的模拟神经元也是可以构建强大学习系统的。

  单个神经元的活动有点像年幼儿童喜欢的塑料弹出式玩具。当孩子按下按钮,一个彩色的人物就会弹出,可能是卡通人物或动物。轻轻地触碰按钮则什么也不会发生;稍使劲一些也是一无所获。但是只要超过一定的力度按下,人物就会弹出来。神经元的工作原理与此基本相同,所不同的是,按压按钮的行为可以由多种输入结合在一起来完成。

  为了让神经网络形象化,可以想象一台鲁布•戈德堡(Rube Goldberg)式的机器,里面有很多这种弹出式玩具被成行地放在平台上。三个机械手伸向每个玩具的激活按钮按压。接下来不是一个人物弹出来,而是玩具被设置成当一个玩具被激活时,它会使下一行玩具的几个机械手指按下自己的按钮。神经网络学习能力的关键是每个手指按压各自按钮时的力度可以进行调整。

  要训练神经网络,你需要将已知数据输入第一行神经元中。比如,想象输入手写信件的视觉图像。输入的数据会让机械手指根据它们自己的调节以不同的力度按下按钮。有些激活的神经元又继而按下下一行神经元的按钮。最后的输出或结果就从最后一行的神经元那里收集。在这个例子中,输出将是一个二进制码,能识别与字母表字母对应的输入图像。最初的答案是错的,但我们的机器还有一个比较和反馈机制。输出会与已知的正确答案相比较,然后每一行的机械手指会进行自动调整,反过来又改变了激活的神经元的序列。在网络接受了上万次已知图像的训练,然后机械手指按压力度不断进行校准之后,网络在给出正确答案方面将越来越得心应手。当答案无法再改进时,网络就已经得到了有效的训练。

  这实际上是神经网络识图、发声、翻译或执行各种其他任务的方式。其结果就是一个程序,基本上列出了机械手指对神经元激活按钮所做的所有调整,该程序可以用来配置新的神经网络,且都能从新数据中自动生成答案。

  人工神经网络的想法最初是在20世纪40年代末的时候设想和试验的,而且长期以来一直被用来承担识别任务。然而,在过去的几年里,技术的重大突破带来了性能的显著进步,尤其当人们采用了多层神经元这项被称为“深度学习”的技术以后。深度学习系统已经支持了苹果Siri的语音识别,正准备在依赖模式分析与识别的更广泛领域加速进步。比如,2011年,瑞士卢加诺大学的科学家设计了一个深度学习神经网络,能够准确识别出某个交通标志大型数据库中99%以上的图像,准确程度超过了与之较量的专家。“脸书”的研究人员也同样开发了一个包含九层人工神经元的实验系统,它能在照明条件和面部方向各异的情况下,正确判断出两张照片是否是同一个人,准确度达97.25%。与此相比,人类观察员的准确度要稍高一些,为97.53%。

  多伦多大学的杰弗里•辛顿(Geoffrey Hinton)是该领域的主要研究者之一,他指出深度学习技术“得到了很好的扩展。基本上你只需使它保持更快、更强大,它就会变得更好。” 换句话说,即使未来设计上不做改进,单一个摩尔定律也肯定能使深度学习网络支持下的机器学习系统拥有持续显著的进步。

  大数据及伴随它的智能算法正对工作场所和老板们产生直接的影响,尤其是大公司,越来越多地对雇员的工作和他们的社会交往进行大量的评估和统计。公司比以往都要依靠所谓的“人员分析”来雇用、解雇、评估和晋升员工。收集到的个人及其所从事工作的数据量是惊人的。有些公司捕捉了每个员工键盘敲击的每个字。在无论员工知情与否的情况下,还可能收集到他们的电子邮件、通话记录、网络搜索、数据库查询、文件存取、设备进出,以及无数其他类型的数据信息。虽然所有的这些数据收集和分析最初一般是为了实现更有效的管理和员工绩效考核,但它最终可能被用作其他用途,其中包括开发软件将大多正在执行的工作自动化。

  大数据革命可能会对知识型职业产生两个特别重要的影响。首先,在很多情况下,捕捉的数据会直接带来特定任务和工作的自动化。正如一个人可能会学习历史记录,然后通过具体任务的练习来了解新的工作,智能算法基本通过相同的方法也能做得到。例如,2013年11月,谷歌为其能自动生成个性化电子邮件和社交媒体回复的系统申请了专利。该系统的工作原理是首先分析一个人过去的电子邮件和社交媒体互动。在这个分析的基础上,系统会对未来的邮件、推特或博客自动编写回复,并且会带上这个人一贯的写作风格和语气。很容易想象,该系统最终会用于实现大量日常交流的自动化。

  谷歌的自动汽车于2011年首次展示,它同样为自动化未来发展路径提供了重要的思路。谷歌的汽车并没有复制人类驾驶的方式,事实上,这会超出人工智能现有的能力。它设计了一个强大的数据处理系统,再放到轮子上来使其简化。谷歌的汽车依靠GPS的精确定位和十分详细的地图数据进行导航。当然,车上也有雷达、激光测距仪,以及其他连续提供实时信息的其他系统。这样,车子能够适应新的环境,比如遇到一个行人走下路缘的情形。驾驶可能不是一个白领职业,但谷歌所用的一般策略可以扩展到很多其他领域。首先,运用大量历史数据创造一个大致的“地图”,作为完成日常任务的路径。接着,装入能适应各种变化或不可预见情况的自学系统。得到的结果可能是一款智能软件,能够执行很多知识型工作任务,而且十分可靠。

  对知识型工作的第二点影响,可能也是更显著的影响是,大数据会改变公司及其管理方式。大数据和预测算法有潜力改变所有组织和行业的知识型工作的性质和数量。基于数据总结的预测将越来越多地替代人的经验和判断力。随着高层管理者更多地依靠自动工具产生的数据来做决策,因而对人员分析与管理部门的需求将不断萎缩。虽然,今天有一批知识工作者为多个领导层收集信息、做出分析,但可能最终只剩下一个经理和一个强大的算法程序就能完成了。各个机构组织可能都会压缩精简。中层管理将蒸发,而现在文职人员和技术分析师等很多岗位将会直接消失。

  WorkFusion是一家总部设在纽约的新创公司,它为白领工作自动化对企业产生的巨大影响给出了一个特别生动的例子。公司为大型企业提供一个智能软件平台,该平台通过将众包模式与自动化结合,几乎能完全管理和执行曾经高度劳动密集的项目。

  该WorkFusion软件最初先分析项目,确定哪些任务可以直接自动化,哪些可以众包,还有哪些必须由内部的专业人员完成。然后,它可以在如eLance或克雷格(Craigslist)这样的网站上自动发布招聘公告,并负责对符合条件的自由职业者进行招聘和选拔。一旦员工准备就绪,软件就会分配任务和评估绩效,有时会采用让员工回答问题的方式测试他们的能力。软件会跟踪如打字速度这类的生产率,并自动匹配与个人能力相当的任务。如果某个人无法完成给定的任务,系统会自动将任务提交到有所需技能的人手中。

  虽然软件几乎能全程自动管理项目,大大减小了对内部员工的需要,但这个方式也为自由职业者创造了新的机遇。不过,整个过程还尚未结束。当员工完成给定任务后,WorkFusion的机器学习算法会继续寻找机会使这一过程进一步自动化。换句话说,当自由职业者在系统指导下工作时,他们还同时产生着训练数据,而这些数据将逐渐实现全自动化,最终代替他们。

  公司最初接到的一个项目是要检索有用信息来更新大约4万条记录。以前,该客户企业要依靠内部员工来完成这项工作,平均每条记录更新的成本约4美元,而且只能每年更新一次。在有了WorkFusion平台之后,客户能每月都更新记录,而且每条记录的成本只有20美分。WorkFusion发现,随着该系统的机器学习算法的自动化逐步加深,运行第一年后成本通常下降约50%,而且运行的第二年会继续下降25%。


本文摘自《技术、工作与经济的未来》


   未来的工作会是什么样的?还有多少工作机会是属于你的? 你可能会想象或希望这一场机器人工业革命将像上次那样展开:即使一些工作被淘汰,但会有更多的工作被创造出来以满足新时代新的创新。在《机器人时代》中,硅谷企业家马丁R26;福特认为,你的想法完全错了,因为情况绝非如此。 随着技术发展的不断加快和机器自动化的发展,对人的需求将会减少。人工智能已经在大步迈进,所谓的“好工作”将会过时:很多律师助理、记者、上班族,甚至电脑程序员将被机器人和智能软件取代。随着技术的进一步发展,蓝领和白领工作都将蒸发,使工薪家庭和中产阶级家庭受到进一步挤压。同时,人们的家庭还要经受生活成本上涨的冲击,尤其是教育成本和医疗保健成本的上涨。到目前为止,这两个领域尚未被信息技术改造。这一切的后果很可能是大范围的失业和经济状况的不平等,还有消费经济本身的崩溃。 在《机器人时代》中,福特详细说明了机器智能与机器人可以完成的事情,并且恳请雇主、学者和政策制定者都来面对由此带来的问题。过去应对技术干扰的解决方案,特别是培训和教育的强化是行不通的,我们必须现在就决定,将来是要看到全面的经济繁荣还是灾难性的经济不平等和不稳定。对那些想要了解技术发展的加速对自己和子孙,以及整个社会到底意味着什么的人来说,《机器人时代》是一本必读不可的书。

 承诺与声明

兄弟财经是全球历史最悠久,信誉最好的外汇返佣代理。多年来兄弟财经兢兢业业,稳定发展,获得了全球各地投资者的青睐与信任。历经十余年的积淀,打造了我们在业内良好的品牌信誉。

本文所含内容及观点仅为一般信息,并无任何意图被视为买卖任何货币或差价合约的建议或请求。文中所含内容及观点均可能在不被通知的情况下更改。本文并未考 虑任何特定用户的特定投资目标、财务状况和需求。任何引用历史价格波动或价位水平的信息均基于我们的分析,并不表示或证明此类波动或价位水平有可能在未来 重新发生。本文所载信息之来源虽被认为可靠,但作者不保证它的准确性和完整性,同时作者也不对任何可能因参考本文内容及观点而产生的任何直接或间接的损失承担责任。

外汇和其他产品保证金交易存在高风险,不适合所有投资者。亏损可能超出您的账户注资。增大杠杆意味着增加风险。在决定交易外汇之前,您需仔细考虑您的财务目标、经验水平和风险承受能力。文中所含任何意见、新闻、研究、分析、报价或其他信息等都仅 作与本文所含主题相关的一般类信息.

同时, 兄弟财经不提供任何投资、法律或税务的建议。您需向合适的顾问征询所有关于投资、法律或税务方面的事宜。