怎么用机器学习模型做时间序列预测

2024-05-17 16:15

1. 怎么用机器学习模型做时间序列预测

SVM理论是在统计学习理论的基础上发展起来的,由于统计学习理论和SVM方法对有限样本情况下模式识别中的一些根本性的问题进行了系统的理论研究,很大程度上解决了以往的机器学习中模型的选择与过学习问题、非线性和维数灾难、局部极小点问题等。应用SVM进行回归预测的步骤具体如下:
1)实验规模的选取,决定训练集的数量、测试集的数量,以及两者的比例;2)预测参数的选取;3)对实验数据进行规范化处理;4)核函数的确定;5)核函数参数的确定。其中参数的选择对SVM的性能来说是十分重要的,对于本文的核函数使用RBF核函数,对于RBF核函数,SVM参数包括折衷参数C、核宽度C和不敏感参数E。目前SVM方法的参数、核函数的参数选择,在国际上都还没有形成统一的模式,也就是说最优SVM算法参数选择还只能是凭借经验、实验对比、大范围的搜寻和交叉检验等进行寻优。实际应用中经常为了方便,主观设定一个较小的正数作为E的取值,本文首先在C和C的一定范围内取多个值来训练,定下各个参数取值的大概范围,然后利用留一法来具体选定参数值
股价时间序列的SVM模型最高阶确定
股价数据是一个时间序列,从时间序列的特征分析得知,股价具有时滞、后效性,当天的股价不仅还与当天各种特征有关,还与前几天的股价及特征相关,所以有必要把前几天的股价和特征作为自变量来考虑。最高阶确定基本原理是从低阶开始对系统建模,然后逐步增加模型的阶数,并用F检验对这些模型进行判别来确定最高阶n,这样才能更客观反映股票价格的时滞特性。具体操作步骤如下:假定一多输入单输出回归模型有N个样本、一个因变量(股价)、m- 1个自变量(特征),由低阶到高阶递推地采用SVM模型去拟合系统(这儿的拓阶就是把昨天股价当做自变量,对特征同时拓阶),并依次对相邻两个SVM模型采用F检验的方法判断模型阶次增加是否合适[ 7]。对相邻两模型SVM ( n)和SVM ( n+ 1)而言,有统计量Fi为:Fi=QSVR (n)- QSVR( n+1)QSVR (n)1N - m n - (m -1)mi =1,2,,, n(1)它服从自由度分别为m和(N - m n - (m -1) )的F分布,其中QSVR (n)和QSVR( n+1)分别为SVR ( n)和QSVR( n+1)的剩余离差平方和,若Fi< F(?,m, N-m n- (m-1) ),则SVM (n )模型是合适的;反之,继续拓展阶数。
前向浮动特征筛选
经过上述模型最高阶数的确定后,虽然确定了阶数为n的SVM模型,即n个特征,但其中某些特征对模型的预测精度有不利影响,本文采用基于SVM和留一法的前向浮动特征特征筛选算法选择对提高预测精度有利影响的特征。令B= {xj: j=1,2,,, k}表示特征全集, Am表示由B中的m个特征组成的特征子集,评价函数MSE (Am)和MSE (Ai) i =1,2,,, m -1的值都已知。本文采用的前向浮动特征筛选算法如下[9]:1)设置m =0, A0为空集,利用前向特征筛选方法寻找两个特征组成特征子集Am(m =2);2)使用前向特征筛选方法从未选择的特征子集(B -Am)中选择特征xm +1,得到子集Am+1;3)如果迭代次数达到预设值则退出,否则执行4);4)选择特征子集Am+1中最不重要的特征。如果xm+1是最不重要的特征即对任意jXm +1, J (Am +1- xm+1)FJ(Am +1- xj)成立,那么令m = m +1,返回2) (由于xm+1是最不重要的特征,所以无需从Am中排除原有的特征);如果最不重要的特征是xr( r =1,2,,, m )且MSE (Am+1- xr) < MSE (Am)成立,排除xr,令A'm= Am+1- xr;如果m =2,设置Am= A'm,J (Am) = J (A'm), ,返回2),否则转向步骤5);5)在特征子集A'm中寻找最不重要的特征xs,如果MSE (A'm- xs)EM SE (Am-1),那么设置Am= A'm, MSE (Am)= MSE (A'm),返回2);如果M SE (A'm- xs) < M SE (Am -1),那么A'm从中排除xs,得到A'm-1= Am- xs,令m = m -1;如果m =2,设置Am= A'm, MSE (Am) = MSE (A'm)返回2),否则转向5)。最后选择的特征用于后续建模预测。
预测评价指标及参比模型
训练结果评估阶段是对训练得出的模型推广能力进行验证,所谓推广能力是指经训练后的模型对未在训练集中出现的样本做出正确反应的能力。为了评价本文模型的优劣,选择BPANN、多变量自回归时间序列模型( CAR)和没有进行拓阶和特征筛选的SVM作为参比模型。采用均方误差(mean squared error, MSE)和平均绝对误差百分率(mean ab-solute percentage error, MAPE)作为评价指标。MSE和MAP定义如下:M SE=E(yi- y^i)2n( 2)MAPE=E| yi- y^i| /yin( 3)其中yi为真值, y^i为预测值, n为预测样本数。如果得出M SE, MAPE结果较小,则说明该评估模型的推广能力强,或泛化能力强,否则就说明其推广能力较差

怎么用机器学习模型做时间序列预测

2. 用机器学习怎样进行盈利预测？能否具体举一个例子

做盈利预测，首先有一系列特征，并且每条数据都有一个标签值，特征可以包括收入，支出等等数据，标签值可以对应盈利和非盈利，采用神经网络可以对数据进行拟合

3. 如何运用机器学习解决复杂系统的预测问题

现实生活中预测通常难做到精准，比如股市，自然灾害， 长久的天气预测。

在市场这种系统里， 有两个关键要素， 一个是个体和个体之间的互相作用（博弈），一个是系统与外部环境（地球资源）之间的相互作用（反馈），因此而形成复杂模式（Pattern）， 这种模式通常很难预测。
而这种类型的系统我们通常定义为复杂系统： 由大量单元互相作用组成的系统， 由于集体行为的非线性（总体不等于个体之和）， 而形成具备无数层级的复杂组织。或者称为涌现性。
复杂科学即研究复杂系统的一套联系不同尺度现象的数学方法。在人类试图理解那些和自身生存最相关的东西时，而经典物理学的还原论（把整体拆成部分）思维的却不适用。物理预测的核心方法是动力学方法, 即人们由实验出发抽象出引起运动改变的原因, 把这些原因量化为变量，用微分方程来描述, 从而取得对整个未来的精确解，如麦克斯韦方程组可以预测从光波的速度到磁线圈转动发电任何的电磁学现象。而你却无法通过了解市场上每个人的特性就很好的预测整个市场走势。
复杂系统难以预测的原理可以从以下几方面理解：
1， 高维诅咒: 构成现实生活的系统往往被大量未知变量决定， 比如生物由无数的细胞组成。 基因，是由无数独立的单元组成的， 市场， 由无数的交易者组成， 这些用物理的描述方法来预测， 就是极高维度空间的运动问题。维度，首先使得再简单的方程形式都十分复杂难解。
此处补充维度的科学定义： 维度是一个系统里可以独立变化的变量个数， 一个有非常多变量的系统，如复杂网络，假如每个变量不是互相独立，也可以是低维系统。 比如一个军营里的方阵，即使人数众多， 也会因为大家都做着一模一样的动作，而只有一个独立变量，成为一维系统。
2， 非线性诅咒：高维度系统的维度之间具有复杂的相互作用，导致我们不能把系统分解为单一维度然后做加法的方法研究。 高维加上非线性我们将得到对初级极为敏感的混沌系统。

非线性的一个重要推论是组织的产生， 因为非线性，1+1可以大于2或小于2， 为组织的产生提供了理论基础。
3， 反馈诅咒： 复杂系统中反馈无处不在， 即使是一个简单的一维系统， 反馈也可以使得系统的特性很丰富， 最典型的反馈是某种记忆效应， 使得系统产生复杂的路径依赖， 此刻你的现实与历史深刻关联，而关联方法导致复杂的模式产生。
反身性是一种由预测产生的特殊反馈， 当你预测股市的价格， 会引起你的交易策略变化从而影响你的预测， 是为反身性。
4， 随机诅咒: 复杂系统往往含有不包含确定规律的随机噪声，加上这些噪声， 系统的行为更加难预测， 而很多时候， 我们也无法区分一个系统里发现的模式是噪声导致还是由于元件之间的相互作用。
这四大诅咒是这些系统难以理解和预测的原因， 而这个时候， 复杂系统和机器学习的方法论可以作为一种非常有力的手段帮我们从复杂性中挖掘模式。
第一种方法叫模型驱动（Model approch）， 即想办法找到事物变化的原因， 用一种降维的思路列出微分方程， 即从非常繁复的要素中化简出最重要的一个或者两个， 从而化繁琐为简单，不管三七二十一先抓住主要矛盾。其中的范例便是非线性动力学。
注： 此处我们有两个基本假设让非线性动力学得到简化，一个是只讨论连续变量，另一个是不考虑系统内的随机性（无噪声项）。
1， 如果一个系统可以化简到一维， 那么你只需要研究其内部存在的反馈性质并描述它即可。 负反馈导致稳定定点产生， 正反馈导致不稳定性。 很多事物多可以抽象为一维系统，包括简单环境下的人口增长问题。
2， 如果一个系统可以化简到二维， 那么你需要研究两个维度间的相互作用，最终可以互为负反馈而稳定下来，互为正反馈而爆发，或者产生此消彼长的周期轨道。 比如恋爱中的男女是个二维系统， 互为负反馈就回到普通朋友， 互为正反馈在爱欲中爆发-比如罗密欧与朱丽叶， 此消彼长那是玩捉迷藏的周期游戏。
3， 如果一个系统是三维的， 则混沌可能产生。 混沌即对初值极为敏感的运动体系。 你一旦偏离既定轨道一点， 即几乎无法回去。
4， 如果一个系统大于三维， 那么你需要用一个复杂网络描述它的运动， 这个时候我们可以得到我们复杂系统的主角- collective phenomena & emergence。 复杂网络的性质主要取决于单体间相互作用的方式， 以及系统与外界交换能量的方法， 这两者又息息相关。 最终我们得到涌现。

复杂网络的动力学往往混沌难以预测，对于高维混沌系统， 第一个方法也只能给出对事物定性的描述， 而我们可以祭出我们的第二种方法: 先不管数据背后错综复杂的动因，而是直接以数据驱动我们的预测。
这其中的哲学内涵即贝叶斯分析框架： 即先不预测， 而是列出所有可能的结果及根据以往知识和经验每种结果发生的可能性（先验概率），之后不停吸收新观测数据， 调整每种可能结果的概率大小（后验概率），将想得到的结果概率最大化（MAP）最终做出决策。
如果你把贝叶斯分析的框架自动化， 让电脑完成， 你就得到机器学习的最基本框架。
机器学习如果可以进入一个问题中， 往往要具备三个条件：
1， 系统中可能存在模式
2， 这种模式不是一般解析手段可以猜测到的。
3， 数据可以获取。
如果三点有一点不符，都很难运用机器学习。
机器学习的一个核心任务即模式识别， 也可以看出它和刚才讲的复杂系统提到的模式的关系。我们讲复杂系统难以通过其成分的分析对整体进行预测，然而由于复杂系统通常存在模式， 我们通常可以模式识别来对系统进行归类， 并预测各种可能的未来结果。比如一个投行女因为工作压力过大而自杀了， 那么在她之前的活动行为数据（比如点击手机的某些app的频率）里是否可能存在某种模式? 这种模式是否可以判定她之后的行为类型？ 并且这个过程可否通过历史数据由计算机学习？如果都可以，这就是一个机器学习问题。
刚才讲的几大诅咒， 高维， 非线性， 复杂反馈，随机性也称为机器学习需要核心面对的几大困难， 由此得到一系列机器学习的核心算法。

机器学习在现实生活中被用于非常多的方面， 最常见的如商务洞察（分类，聚类， 推荐算法）， 智能语音语义服务（时间序列处理，循环网络）， 各种自动鉴别系统如人脸识别，虹膜识别 ，癌症检测（深度卷积网络）， 阿尔法狗，机器人控制（深度强化学习算法）。 而由方法论分， 又可以分成有监督学习， 无监督学习， 和强化学习。

在八月份的巡洋舰科技的《机器学习vs复杂系统特训课》中，我着重讲了几种机器学习的基本方法：
1. 贝叶斯决策的基本思想：
你要让机器做决策， 一个基本的思路是从统计之前数据挖掘已有的模式（pattern）入手， 来掌握新的数据中蕴含的信息。 这个pattern在有监督学习的例子里， 就是把某种数据结构和假设结论关联起来的过程，我们通常用条件概率描述。 那么让机器做决策， 就是通过不停的通过新数据来调整这个数据结构（特征）与假设结果对应的条件概率。通常我们要把我们预先对某领域的知识作为预设（prior），它是一个假设结果在数据收集前的概率密度函数，然后通过收集数据我们得到调整后的假设结果的概率密度函数， 被称为后验概率（posterior），最终的目标是机器得到的概率密度函数与真实情况最匹配， 即 Maximum a posterior(MAP)， 这是机器学习的最终目标。
2， 朴素贝叶斯分类器到贝叶斯网络：
分类，是决策的基础，商业中要根据收集客户的消费特征将客户分类从而精准营销。 金融中你要根据一些交易行为的基本特征将交易者做分类。 从贝叶斯分析的基本思路出发我们可以迅速得到几种分类器。
首当其冲的朴素贝叶斯分类器，它是机器学习一个特别质朴而深刻的模型：当你要根据多个特征而非一个特征对数据进行分类的时候，我们可以假设这些特征相互独立（或者你先假设相互独立），然后利用条件概率乘法法则得到每一个分类的概率， 然后选择概率最大的那个作为机器的判定。
图： 朴素贝叶斯分类器的基本框架， c是类别， A是特征。
如果你要根据做出分类的特征不是互相独立，而是互相具有复杂关联，这也是大部分时候我们面临问题的真相， 我们需要更复杂的工具即贝叶斯网络。 比如你对某些病例的判定， 咳嗽， 发烧， 喉咙肿痛都可以看做扁条体发炎的症候， 而这些症候有些又互为因果， 此时贝叶斯网络是做出此类判定的最好方法。构建一个贝叶斯网络的关键是建立图模型 ， 我们需要把所有特征间的因果联系用箭头连在一起， 最后计算各个分类的概率。

图：贝叶斯网络对MetaStatic Cancer的诊断，此处的特征具有复杂因果联系
贝叶斯分析结合一些更强的假设，可以让我们得到一些经常使用的通用分类器， 如逻辑斯提回归模型，这里我们用到了物理里的熵最大假设得到玻尔兹曼分布， 因此之前简单贝叶斯的各个特征成立概率的乘积就可以转化为指数特征的加权平均。 这是我们日常最常用的分类器之一。 更加神奇的是， 这个东西形式上同单层神经网络。

图： logistic函数，数学形式通玻尔兹曼分布， 物理里熵最大模型的体现
3, 贝叶斯时间序列分析之隐马模型：
贝叶斯时间序列分析被用于挖掘存储于时间中的模式，时间序列值得是一组随时间变化的随机变量，比如玩牌的时候你对手先后撒出的牌即构成一个时间序列。 时间序列模式的预设setting即马尔科夫链， 之前动力学模式里讲到反馈导致复杂历史路径依赖，当这种依赖的最简单模式是下一刻可能出现的状态只与此刻的状态有关而与历史无关， 这时候我们得到马尔科夫链。
马尔科夫链虽然是贝叶斯时间序列分析的基准模型，然而现实生活中遇到的时间序列问题， 通常不能归于马尔科夫链，却可以间接的与马尔科夫链关联起来，这就是隐马过程，所谓含有隐变量的马尔科夫过程。

图： 隐马过程示意

语音识别就是一类特别能利用隐马过程的应用， 在这里语音可以看做一组可观测的时间序列， 而背后的文字是与之关联的马尔科夫链， 我们需要从可观测的量， 按照一定的概率分布反推不可观测的量， 并用马尔科夫链的观点对其建模， 从而解决从语音到文字的反推过程。 当今的语音识别则用到下面紧接讲的深度学习模型。
4， 深度学习
刚刚讲的分类问题， 只能根据我们已知的简单特征对事物进行分类， 但假设我们手里的数据连需要提取的特征都不知道， 我们如何能够对事物进行分类呢？ 比如你要从照片识别人名， 你都不知道选哪个特征和一个人关联起来。 没关系， 此时我们还有一个办法， 就是让机器自发学习特征， 因此祭出深度学习大法。通常在这类问题里， 特征本身构成一个复杂网络，下级的特征比较好确定， 而最高层的特征， 是由底层特征的组合确定的， 连我们人类自己都不能抽象出它们。
深度学习即数据内涵的模式（特征）本身具备上述的多层级结构时候，我们的机器学习方法。 从以毒攻毒的角度看， 此时我们的机器学习机器也需要具有类似的多级结构，这就是大名鼎鼎的多层卷积神经网络。深度学习最大的优势是具有更高级的对“结构”进行自动挖掘的能力，比如它不需要我们给出所有的特征，而是自发去寻找最合适对数据集进行描述的特征。 一个复杂模式-比如“人脸” 事实上可以看做一个简单模式的层级叠加， 从人脸上的轮廓纹理这种底层模式， 到眼睛鼻子这样的中级模式， 直到一个独特个体这样最高级的复杂模式， 你只有能够识别底层模式，才有可能找到中级模式， 而找到中级模式才方便找到高级模式， 我们是不能从像素里一步到达这种复杂模式的。 而是需要学习这种从简单模式到复杂模式的结构， 多层网络的结构应运而生。
图： 从具体特征到抽象特征逐级深入的多级神经网络
6， RNN和神经图灵机
如果时间序列数据里的模式也包含复杂的多层级结构， 这里和我之前说的复杂系统往往由于反馈导致复杂的时间依赖是一致的， 那么要挖掘这种系统里的模式， 我们通常的工具就是超级前卫的循环神经网络RNN，这种工具对处理高维具有复杂反馈的系统有神效， 因为它本身就是一个高维具有复杂时间反馈的动力学系统。
图： 循环神经网络， 过去的信息可以通过循环存储在神经元之间
当一个复杂时间序列的问题里面， 每个时间点的信息都可以对未来以任何方式产生复杂影响， 那么处理这种复杂性的一个办法就是用循环神经网络，让它自发学习这种复杂结构。 比如一个城市里的交通流， 或者人与人之间的对话。
神经图灵机是在多层卷积神经网络或递归网络基础上加上一个较长期的记忆单元， 从而达到处理需要更复杂时间关联的任务， 比如对话机器人。 而神经图灵机最厉害的地方在于他可以通过机器学习传统的梯度下降法反向破译一个程序， 比如你写了一个python程序， 你用很多不同的输入得到很多对应的输出， 你可以把它给神经图灵机训练， 最终本来对程序丝毫无所知的神经图灵机居然可以如同学会了这个程序。

如何运用机器学习解决复杂系统的预测问题

4. 如何使用Amazon Machine Learning构建机器学习预测模型

　　本月上旬，AWS宣布推出亚马逊机器学习服务(Amazon Machine Learning)，声称这项新的AWS服务来自于亚马逊内部的数据科学家用于创建机器学习模型的技术，可以帮助你使用你所收集到的所有数据来提高你决策的质量。你可以使用大量数据来建立并微调预测模型，然后大规模使用亚马逊机器学习进行预测(在批处理模式下或者在实时模式下)。即使没有统计学高级文凭或者对于建立、运行、维护你自己的处理和存储基础架构不熟悉，你也能从机器学习中受益。AWS首席布道者Jeff Barr撰写了一篇博文，一步一步地介绍了如何使用亚马逊机器学习服务构建预测模型。  　　机器学习基础  　　为了从机器学习中受益，你需要有一些可以用于训练的现有数据。把训练数据想象成数据库或电子表格的行是有一定帮助的。每一行代表一个单独的数据元素(一个购买，一次发货，或者一个目录项)。列表示该元素的属性：客户邮政编码，购买价格，信用卡类型，项目的大小，等等。  　　该训练数据必须包含实际结果的例子。例如，用行代表完成的交易，不论是合法还是欺诈，每一行必须包含一列作为目标变量来表示结果。这个数据是用来创建一个机器学习模型，当给拟议中的交易提交新数据时将返回有关其有效性的预测。亚马逊机器学习支持三种不同类型的预测：二元分类，多类分类和回归分析。让我们来看看每一个：  　　二元分类用于预测两种可能的结果中的一个。这是合法的交易吗?客户将购买此产品吗?送货地址是公寓大楼吗?  　　多类分类用于预测三个或更多可能的结果中的一个，以及每一个的可能性。这件产品是关于服装的一本书，一部电影，还是一篇文章?这部电影是喜剧片，纪录片，还是惊悚片?哪一类产品让这个客户最感兴趣呢?  　　回归分析被用于预测一个数字。库存应放置多少27寸显示器?我们应该为此花费多少钱呢?其中有百分之多少有可能作为礼品出售?  　　一个适当培训和调整过的模型可以用来回答上述问题之一。在某些情况下，使用相同的训练数据来建立两个或两个以上的模型是合适的。  　　你应该计划着花费一些时间来丰富你的数据，以确保它能很好的匹配你的训练过程。举个简单的例子，你可能会以基于邮政编码的位置数据开始。经过一番分析，你很可能发现你可以使用包含或大或小的分辨率不同的位置表示来提高结果的质量。机器学习的训练过程是反复的，你需要明确的计划来花一些时间了解和评估你最初的结果，然后用它们来充实你的数据。  　　你可以利用提供给你的一组性能指标来衡量你的每个模型的质量。例如，曲线下面积(AUC)标准显示了二元分类的性能。这是在0.0到1.0范围内的一个浮点值，它表示了模型每隔多久在没训练过的数据上预测结果。随着模型质量的上升，数值从0.5上升到1.0。0.5的值不比随机猜测要好，而0.9在大多数情况下是一个很好地模型数据。但是0.9999的数值太过于好而让人难以相信，并且这个值可能意味着训练数据出现了问题。  　　当你建立你的二进制预测模型时，你将需要花一些时间观察结果并且调整截止值。它代表该预测是正确的概率;在特定情况下，你可以根据假阳性(预测应该是假的，但被预测为真)和假阴性(预测应该是真实的，但被预测为假)的相对重要性将值调整高或者低。如果你正在为电子邮件建设一个垃圾邮件过滤器，假阴性会将垃圾邮件投递到你的收件箱中，而假阳性会将你的合法邮件丢弃到垃圾文件夹中。在这种情况下，假阳性是不理想的。假阳性和假阴性之间的权衡是要依赖于你的业务问题以及你打算如何在生产中利用该模型。  　　亚马逊机器学习实操  　　利用AWS Machine Leaning API，开发人员能够在Amazon RDS中创建新的模型，利用来自Amazon S3、Amazon Redshift或者MySQL数据库中的数据。让我们漫步在创建一个模型的过程中，并且按照亚马逊机器学习开发人员教程部分中描述的步骤来产生一些预测。你可以注册亚马逊机器学习，然后如果你愿意的话你可以按照向导中的步骤来使用。该指南使用一个略有增强的副本，该副本是来自加州大学欧文分校的机器学习库的可公开获得的营销银行的数据集。我们即将完成的模型将回答“用户将要订阅我们的新产品吗?”

5. 数据分析和机器学习是什么关系，两者的前景如何

数据分析、数据挖掘、机器学习之间的关系

数据分析和机器学习是什么关系，两者的前景如何

6. 如何运用机器学习方法预测矩阵，matlab

knn分类器还是很容易写的吧。自己写一个咯。。至于老师让你做这个分类器干嘛？你是要跑多大的数据？数据小的话就用传统的方法了。数据大了像kd树这样的构造。就是觉得楼主问的很奇怪。。
还有就是入门的话个人觉得斯坦福大学andrew ng大牛的machine learning 很好。。。

7. 机器学习中的各种算法适用于哪些预测

1.决策树(Decision Trees)： 
　　决策树是一个决策支持工具，它使用树形图或决策模型以及序列可能性。包括各种偶然事件的后果、资源成本、功效。下图展示的是它的大概原理： 
　　  
  
　　从业务决策的角度来看，大部分情况下决策树是评估作出正确的决定的概率最不需要问是/否问题的办法。它能让你以一个结构化的和系统化的方式来处理这个问题，然后得出一个合乎逻辑的结论。 
　　2.朴素贝叶斯分类(Naive Bayesian classification)： 
　　朴素贝叶斯分类是一种十分简单的分类算法，叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素，朴素贝叶斯的思想基础是这样的：对于给出的待分类项，求解在此项出现的条件下各个类别出现的概率，哪个最大，就认为此待分类项属于哪个类别。 
　　  
  
　　它的现实使用例子有： 
　　将一封电子邮件标记(或者不标记)为垃圾邮件 
　　将一篇新的文章归类到科技、政治或者运动 
　　检查一段文本表达的是积极情绪还是消极情绪 
　　脸部识别软件 
　　3.最小二乘法(Ordinary Least Squares Regression)： 
　　如果你懂统计学的话，你可能以前听说过线性回归。最小二乘法是一种计算线性回归的方法。你可以把线性回归当做在一系列的点中画一条合适的直线的任务。有很多种方法可以实现这个，“最小二乘法”是这样做的 —你画一条线，然后为每个数据点测量点与线之间的垂直距离，并将这些全部相加，最终得到的拟合线将在这个相加的总距离上尽

机器学习中的各种算法适用于哪些预测

8. 用机器学习已经训练好了模型，求问下一步怎么使用？ PS:就是输入一行数据，让模型输出需要预测的Y值

去看api啊
一般就是model.predict(x)
但一般来说，x要转化为训练时候的数据格式
少数情况下，不一定，比如深度学习环节时，训练和预测的数据，可以不经过同样的处理方式