机器学习简史

最近学习的重点不在机器学习上面,但是现代的学科就是这么奇妙,错综复杂,玩着玩着,你发现又回到了人工智能这一块。所以干脆好好整理下当下令很多人如痴如醉,但又不容易入门的机器学习。一来给大多数还没有入门的人一点宏观概念,二来让我自己以后找解决办法的时候更有头绪。故此文不是给想快速上手的工程师的菜单,更像一篇娓娓道来的武侠小说,看看人工智能世界的先驱们是如何开宗创派的。

一、从人工智能说起

机器学习属于人工智能的一块,先简要回顾一下。关于什么是“智能”,就问题多多了。这涉及到其它诸如意识(consciousness)、自我(self)、心灵(mind)(包括无意识的精神(unconscious_mind))等等问题。人唯一了解的智能是人本身的智能,这是普遍认同的观点。但是我们对我们自身智能的理解都非常有限,对构成人的智能的必要元素也了解有限,所以就很难定义什么是“人工”制造的“智能”了。因此人工智能的研究往往涉及对人的智能本身的研究。其它关于动物或其它人造系统的智能也普遍被认为是人工智能相关的研究课题。下图展示了人工智能的发展路线:

在20世纪40年代和50年代,来自不同领域(数学,心理学,工程学,经济学和政治学)的一批科学家开始探讨制造人工大脑的可能性。1956年,人工智能被确立为一门学科。

IBM 702:第一代AI研究者使用的电脑.

最初的人工智能研究是30年代末到50年代初的一系列科学进展交汇的产物。神经学研究发现大脑是由神经元组成的电子网络,其激励电平只存在“有”和“无”两种状态,不存在中间状态。维纳的控制论描述了电子网络的控制和稳定性。克劳德·香农提出的信息论则描述了数字信号(即高低电平代表的二进制信号)。图灵的计算理论证明数字信号足以描述任何形式的计算。这些密切相关的想法暗示了构建电子大脑的可能性。这一阶段的工作包括一些机器人的研发,例如W。Grey Walter的“乌龟(turtles)”,还有“约翰霍普金斯兽”(Johns Hopkins Beast)。这些机器并未使用计算机,数字电路和符号推理;控制它们的是纯粹的模拟电路。

Walter Pitts和Warren McCulloch分析了理想化的人工神经元网络,并且指出了它们进行简单逻辑运算的机制。他们是最早描述所谓“神经网络”的学者。马文·闵斯基是他们的学生,当时是一名24岁的研究生。1951年他与Dean Edmonds一道建造了第一台神经网络机,称为SNARC。在接下来的五十年中,闵斯基是AI领域最重要的领导者和创新者之一。

1951年,Christopher Strachey使用曼彻斯特大学的Ferranti Mark 1机器写出了一个西洋跳棋(checkers)程序;Dietrich Prinz则写出了一个国际象棋程序。[31]Arthur Samuel在五十年代中期和六十年代初开发的西洋棋程序的棋力已经可以挑战具有相当水平的业余爱好者。游戏AI一直被认为是评价AI进展的一种标准。

1950年,图灵发表了一篇划时代的论文,文中预言了创造出具有真正智能的机器的可能性。由于注意到“智能”这一概念难以确切定义,他提出了著名的图灵测试:如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么称这台机器具有智能。这一简化使得图灵能够令人信服地说明“思考的机器”是可能的。论文中还回答了对这一假说的各种常见质疑。图灵测试是人工智能哲学方面第一个严肃的提案。

50年代中期,随着数字计算机的兴起,一些科学家直觉地感到可以进行数字操作的机器也应当可以进行符号操作,而符号操作可能是人类思维的本质。这是创造智能机器的一条新路。
1955年,Newell和(后来荣获诺贝尔奖的)Simon在J. C. Shaw的协助下开发了“逻辑理论家(Logic Theorist)”。这个程序能够证明《数学原理》中前52个定理中的38个,其中某些证明比原著更加新颖和精巧。Simon认为他们已经“解决了神秘的心/身问题,解释了物质构成的系统如何获得心灵的性质。”(这一断言的哲学立场后来被John Searle称为“强人工智能”,即机器可以像人一样具有思想。)

1956年达特矛斯会议的组织者是Marvin Minsky,John McCarthy和另两位资深科学家Claude Shannon以及Nathan Rochester,后者来自IBM。会议提出的断言之一是“学习或者智能的任何其他特性的每一个方面都应能被精确地加以描述,使得机器可以对其进行模拟。”与会者包括Ray Solomonoff,Oliver Selfridge,Trenchard More,Arthur Samuel,Newell和Simon,他们中的每一位都将在AI研究的第一个十年中作出重要贡献。会上纽厄尔和西蒙讨论了“逻辑理论家”,而McCarthy则说服与会者接受“人工智能”一词作为本领域的名称。1956年达特矛斯会议上AI的名称和任务得以确定,同时出现了最初的成就和最早的一批研究者,因此这一事件被广泛承认为AI诞生的标志。

现如今AI世界已经枝繁叶茂,被认为最广泛的综合学科,也是未来最有希望的学科的之一。

涉及学科

  • 哲学和认知科学
  • 数学
  • 心理学
  • 计算机科学
  • 控制论
  • 决定论
  • 不确定性原理

研究范畴

  • 自然语言处理(NLP; Natural Language Processing)
  • 知识表现(Knowledge Representation)
  • 智能搜索(Intelligent Search)
  • 推理
  • 规划(Planning)
  • 机器学习(Machine Learning)
  • 增强式学习(Reinforcement Learning)
  • 知识获取
  • 感知问题
  • 模式识别
  • 逻辑程序设计
  • 软计算(Soft Computing)
  • 不精确和不确定的管理
  • 人工生命(Artificial Life)
  • 人工神经网络(Artificial Neural Network)
  • 复杂系统
  • 遗传算法
  • 资料挖掘(Data Mining)
  • 模糊控制

上面列举了一下维基上面的解释,可以说现代工程上的很多问题,都可以从上述研究范畴找到解决方案。可以想见,在未来人工智能发展会经历以下几个阶段:

★★★应用阶段(1980年至今):在这一阶段里,人工智能技术在军事、工业和医学等领域中的应用显示出了它具有明显的经济效益潜力。适合人们投资的这一新天地浮出了水面。

★★★融合阶段(2010—2020年)
★在某些城市,立法机关将主要采用人工智能专家系统来制定新的法律
★人们可以用语言来操纵和控制智能化计算机、互联网、收音机、电视机和移动电话,远程医疗和远程保健等远程服务变得更为完善。
★智能化计算机和互联网在教育中扮演了重要角色,远程教育十分普及。
★随着信息技术、生物技术和纳米技术的发展,人工智能科学逐渐完善。
★许多植入了芯片的人体组成了人体通信网络(以后甚至可以不用植入任何芯片)。比如,将微型超级计算机植入人脑,人们就可通过植入的芯片直接进行通信。
★量子计算机和DNA计算机会有更大发展,能够提高智能化水平的新型材料会不断问世。
抗病毒程序可以防止各种非自然因素引发灾难。(H7N9大家小心 🙂 )
★随着人工智能的加速发展,新制定的法律不仅可以用来更好地保护人类健康,而且能大幅度提高全社会的文明水准。比如,法律可以保护人们免受电磁烟雾的侵害,可以规范家用机器人的使用,可以更加有效地保护数据,可以禁止计算机合成技术在一些文化和艺术方面的应用(比如禁止合成电视名人),可以禁止编写具有自我保护意识的计算机程序。

★★★自我发展阶段(2020—2030年)
★智能化计算机和互联网既能自我修复,也能自行进行科学研究,还能自己生产产品。
★一些新型材料的出现,促使智能化向更高层次发展。
★用可植入芯片实现人类、计算机和鲸目动物之间的直接通信,在以后的发展中甚至不用植入芯片也可实现此项功能。
★制定“机器人法”等新的法律来约束机器人的行为,使人们不受机器人的侵害。
★高水准的智能化技术可以使火星表面环境适合人类居住和发展。
升华阶段(2030—2040年):
信息化的世界进一步发展成全息模式的世界。(参见Ingress——现实虚拟化游戏
★人工智能系统可从环境中采集全息信息,身处某地的人们可以更容易地了解和知晓其他地方的情况。
★人们对一些目前无法解释的自然现象会有更清楚的认识和更完善的解释,并将这些全新的知识应用在医疗、保健和安全等领域。
★人工智能可以模仿人类的智能,因此会出现有关法律来规范这些行为。

关于 “机器学习简史” 的 2 个意见

发表评论

电子邮件地址不会被公开。 必填项已用*标注