AI概念初导(小白版)

Abstract:本文以简短通俗的语言阐释AI的几个基本概念。AI本质是函数。

1.人工智能

  • AI:让机器具备类似人的智能,从而替代人类去完成某些工作和任务
  • 强AI:像人类一样去思考和推理,且具备知觉和自我意识(发展处于停滞状态)
  • 弱AI:看起来像是智能的,但不会具备知觉和意识
  • AI实现:
    • 基于规则进行编程:让机器能按照程序中存在的逻辑处理特点任务,从结果上看机器是智能的
    • 机器学习:喂给机器大量针对某一任务的数据,让机器自己去学习,继而挖掘出规律,从而具备完成某一任务的智能

如识别狗:

1.基于规则:告诉机器狗的特征,机器去识别出满足这些规则的东西

2.机器学习:不告诉机器狗的特征,但喂给机器10万张狗的图片,机器自己从图片中学习到狗的特征,从而具备识别狗的智能

2.机器学习

从模型层次结构角度划分:浅层学习和深度学习

浅层学习(shadow Learning)

  • 模型层次较浅,通常无隐藏层或只有一层隐藏层(hidden layer)

  • 常见算法:线性回归,逻辑回归,随机森林,SVM,K-means,RBM,AutoEncoder,PCV,SOM等

深度学习(Deep Learning)

  • 深:有较多的隐藏层(使得深度学习网络拥有表达更复杂函数的能力,能够识别更复杂的特征,完成更复杂的任务)
  • CNN与RNN
  • CNN(Convolutional Neural Networks): 计算机视觉最主要的算法
    • Prisma:图像风格迁移
    • 美颜相机:滤镜
    • 交通监控视频识别:识别车牌号
    • 商场监控视频:识别人脸
    • 无人车:用CV去观察和理解世界
  • RNN(Recurrent Neural NetWorks): 循环神经网络
    • RNN衍生算法:LSTM、GRU(Gated Recurrent Unit),其拥有时间记忆功能,可用来处理一些具有时间序列属性的数据,适合处理语言、文字
    • 应用:语音识别、机器翻译、合成音乐
    • 如:对话机器人、讯飞输入法(TTS)

3.AI的本质——函数

AI其实就是我们喂给机器目前已有的数据,机器就会从这些数据里去找出一个最能满足(此处用“拟合”或可提升逼格)这些数据的函数,当有新的数据需要预测的时候,机器就可以通过这个函数去预测出这个新数据对应的结果是什么。

一个具备智能的模型具备三要素:

  • 数据:大数据量(只有数据量足够大,模型才能够学习到足够多且准确的区分猫和狗的特征,才能在区分猫狗这个任务上表现出足够高的准确性)
  • 算法:神经网络架构的设计(构建模型时我们打算用浅层的网络还是深层的,如果是深层的话我们要用多少层,每层有多少神经元、功能是什么,etc)

相当于我们确定了我们的预测函数应该大致结构是什么样的,我们用Y=f(W,X,b)来表示这一函数X是已有的用来训练的数据(猫和狗的图片),Y是已有的图片数据的标签(该图片是猫还是狗),函数里的W(权重)和b(偏差)是需要机器学习后自己找出来的,找的过程也就是模型训练的过程。

  • 模型: 我们把数据带入到算法中进行训练,机器就会去不断地学习,当机器找到最优W(权重)和b(偏差)后,我们就说这个模型是train成功了,这个时候我们的函数Y=f(W,X,b)就完全确定下来了。
拿钱去买猫粮和狗粮嗷 ~