百度搜索什么关键词能搜到网站,wordpress添加作者名字,做网站兼容ie,简单的logo设计图片第四章 机器学习
一、人工智能概述
1. 什么是人工智能
人工智能#xff08;Artificial Intelligence#xff09;是计算机科学的一个分支学科#xff0c;主要研究用计算机模拟人的思考方式和行为方式#xff0c;从而在某些领域代替人进行工作。
2. 人工智能的学科体系
…第四章 机器学习
一、人工智能概述
1. 什么是人工智能
人工智能Artificial Intelligence是计算机科学的一个分支学科主要研究用计算机模拟人的思考方式和行为方式从而在某些领域代替人进行工作。
2. 人工智能的学科体系
以下是人工智能学科体系图 机器学习Machine Learning人工智能的一个子学科研究人工智能领域的基本算法、原理、思想方法机器学习研究的内容在其它子学科都会用到计算机视觉Computer Vision研究计算机处理、识别、理解图像、视频的相关技术自然语言处理Natural Language Processing研究计算机理解人类自然语言的相关技术语言处理研究计算机理解识别、理解、合成语音的相关技术
3. 人工智能与传统软件的区别
传统软件执行人的指令和想法在执行之前人已经有了解决方案无法超越人的思想和认识范围
人工智能尝试突破人的思想和认识范围让计算机学习到新的能力尝试解决传统软件的难题 二、机器学习基本概念
1. 什么是机器学习
1975 年图灵奖获得者、1978 年诺贝尔经济学奖获得者、著名学者赫伯特.西蒙Herbert Simon曾下过一个定义如果一个系统能够通过执行某个过程就此改进了它的性能那么这个过程就是学习。由此可看出学习的目的就是改善性能。
卡耐基梅隆大学机器学习和人工智能教授汤姆.米切尔Tom Mitchell在他的经典教材《机器学习》中给出了更为具体的定义对于某类任务Task简称 T和某项性能评价准则Performance简称 P如果一个计算机在程序 T 上以 P 作为性能度量随着经验Experience简称 E的积累不断自我完善那么我们称计算机程序从经验 E 中进行了学习。 例如篮球运动员投篮训练过程球员投篮任务 T以准确率为性能度量P随着不断练习经验 E准确率不断提高这个过程称为学习。
2. 为什么需要机器学习
程序自我升级
解决那些算法过于复杂甚至没有已知算法的问题
在机器学习的过程中协助人类获得事物的洞见
3. 机器学习的形式
3.1 建模问题
所谓机器学习在形式上可近似等同于在数据对象中通过统计、推理的方法来寻找一个接受特定输入 X并给出预期输出 Y 功能函数 f即 Y f ( x ) Y f(x) Yf(x)。这个函数以及确定函数的参数被称为模型。
3.2 评估问题
针对已知的输入函数给出的输出预测值与实际输出目标值之间存在一定误差因此需要构建一个评估体系根据误差大小判定函数的优劣。
3.3 优化问题
学习的核心在与改善性能通过数据对算法的反复锤炼不断提升函数预测的准确性直至获得能够满足实际需求的最优解这个过程就是机器学习。
4. 机器学习的分类重点
4.1 有监督、无监督、半监督学习
4.1.1 有监督学习
在已知数据输出经过标注的的情况下对模型进行训练根据输出进行调整、优化的学习方式称为有监督学习。 在训练数据中有输出数据类别标签的为有监督学习。
4.1.2 无监督学习
没有已知输出的情况下仅仅根据输入信息的相关性进行类别的划分。 在训练数据中没有输出数据类别标签的为无监督学习。
4.1.3 半监督
先通过无监督学习划分类别再人工标记通过有监督学习方式来预测输出.例如先对相似的水果进行聚类再识别是哪个类别。 4.1.4 强化学习
通过对不同决策结果的奖励、惩罚使机器学习系统在经过足够长时间的训练以后越来越倾向于接近期望结果的输出。
4.2 批量学习、增量学习
4.2.1 批量学习
将学习过程和应用过程分开用全部训练数据训练模型然后再在应用场景中进行预测当预测结果不够理想时重新回到学习过程如此循环。
4.2.2 增量学习
将学习过程和应用过程统一起来在应用的同时以增量的方式不断学习新的内容边训练、边预测。
4.3 基于模型学习、基于实例学习
4.3.1 基于模型的学习
根据样本数据建立用于联系输出和输出的某种数学模型将待预测输入带入该模型预测其结果。例如有如下输入输出关系
输入x输出y12243648
根据数据得到模型 y 2 x y 2x y2x
预测输入 9 时输出是多少
4.3.2 基于实例的学习
根据以往经验寻找与待预测输入最接近的样本以其输出作为预测结果从数据中心找答案。例如有如下一组数据
学历(x1)工作经验(x2)性别(x3)月薪(y)本科3男8000硕士2女10000博士2男15000
预测本科3男 薪资
5. 机器学习的一般过程重点
5.1 数据收集
手段如手工采集、设备自动化采集、爬虫等
5.2 数据清洗
数据规范、具有较大误差的、没有意义的数据进行清理
注以上称之为数据处理包括数据检索、数据挖掘、爬虫…
5.3 选择模型算法
5.4 训练模型
5.5 模型评估
5.6 测试模型
注3~6 步主要是机器学习过程包括算法、框架、工具等…
5.7 应用模型
5.8 模型维护
6. 机器学习的典型应用
股价预测
推荐算法
自然语言处理
语音处理语音识别、语音合成
图像识别、人脸识别
……
7. 机器学习的基本问题重点
7.1 回归问题
根据已知的输入和输出寻找某种性能最佳的模型将未知输出的输入代入模型得到连续的输出。例如
根据房屋面积、地段、修建年代以及其它条件预测房屋价格根据各种外部条件预测某支股票的价格根据农业、气象等数据预测粮食收成计算两个人脸的相似度
预测值为连续值
7.2 分类问题
根据已知的输入和输出寻找性能最佳的模型将未知输出的输入带入模型得到离散的输出。例如
手写体识别10 个类别分类问题水果、鲜花、动物识别工业产品瑕疵检测良品、次品二分类问题识别一个句子表达的情绪正面、负面、中性
预测值为离散值
7.3 聚类问题
根据已知输入的相似程度将其划分为不同的群落例如
根据一批麦粒的数据判断哪些属于同一个品种根据客户在电商网站的浏览和购买历史判断哪些客户对某件商品感兴趣判断哪些客户具有更高的相似度
7.4 降维问题
在性能损失尽可能小的情况下降低数据的复杂度数据规模缩小都称为降维问题.
8. 机器学习大纲