当前位置:资讯 > 正文

当前关注:决策树是什么(什么是决策树)

2023-05-18 09:46:42  来源:热点网

本文目录一览:

1、什么是决策树?为什么要用决策树?2、什么是决策树

什么是决策树?为什么要用决策树?

"机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测。


(资料图片)

从数据产生决策树的机器学习技术叫做决策树学习, 通隐洞俗说就是决策树。

一个决策树包含三种类型的节点:

决策节点:通常用矩形框来表示

机会节点:通常用圆圈来表示

终结点:通常用三角形来表示

决策树学习也是资料探勘中一个普通的方法。在这里,每个决策树都表述了一种树型结构,它源备由它的分支来对该类型的对象依靠属性进行分类。每个决策树可以依靠对源数据库的分割进行数据测试。这个过程可以递归式的对树进行修剪。 当不能再进行分割或一个单独的类可以被应用于某一分支时,递归过程就完成了。另外,随机森林分类器将许多决策树结合起来以提升分类的正确率。

决策树同时也可以依靠计算条件概率来构造。

决策树如果依靠数学的计算方法可以取得更加理想的效果。 数据库已如下所示:

(x, y) = (x1, x2, x3…, xk, y)

相关的变量 Y 表示我们尝试去理解,分类或者更一般化的结果。 其他雹携毁的变量x1, x2, x3 等则是帮助我们达到目的的变量。"

什么是决策树

决策树是用二叉树形图来表示处理逻辑的一种工具。可以直观、清晰地表达加工的逻辑要求。特别适合于判断因素比较少、逻辑组合关系不复杂的情况。

决策树提供了一种展示类似在什么条件下会得到什么值这类规则的方法。比如,在贷款申请中,要对申请的风险大小做出判断,图是为了解决这个问题而建立的一棵决策树,从中我们可以看到决策树的基本组成部分:决策节点、分支和叶子。

决策树中最上面的节点称为根节点,是整个决策树的开始。本例中根节点是“收入¥40,000”,对此问题的不同回答产生了“是”和“否”两个分支。

决策树的每个节点子节点的个数与决策树在用的算法有关。如CART算法得到的决策树每个节点有两个分支,这种树称为二叉树。允许节点含有多于两个子节点的树称为多叉树。

每个分支要么是清搏一个新的决策节点,要么是树的结尾,称为叶子。在沿着决策树从上到下遍历的过程中,在每个节点都会遇到一个问题,对每个节点上问题的不同回答导致不同的分支,最后会到达一个叶子节点。这个过程就是利用决策树进行分类的过程,利用几个变量(每个变量对应一个问题)来判断所属的类别(最后每个叶子会对应一个类别)。

假如负责借贷的银行官员利用上面这棵决策树来决定支持哪些贷款和拒绝哪些贷款,那么他就可以用贷款申请表来运行这棵决策树,用决策树来判断风险的大小。“年收入¥40,00”和“高负债”的用户被认为是“高风险”,同时“收入¥40,000”但“工作时间5年”的申请,则被认为“低风险”而建议贷款给他/她。

数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测(就像上面的银行官员用他来预测贷款风险)。常用的算法有CHAID、 CART、 Quest 和C5.0。

建立决策树的过程,即树的生长过程是不断的把数据进行切分的过程,每次切分对应一个问题,也对应着一个节点。对每个切分都要求分成的组之间的“差异”最大。

各种决策树算法之间的主要区别就是对这个“差异”衡量方式的区别。对具体衡量方式算法的讨论超出了本文的范围,在此我们只需要把切分看成是把一组数据分成几份,份与份之间尽量不同,而同一份内的数据尽量相同。这个切分的过程也可称为数据的“纯化”。看我们的例子,包含两个类别--低风险和高风险。如果经过一次切分后得到的分组,每个分组中的数据都属于同一个类别,显然达到这样效果的切分方法就是我们所追求的。

到现在为止我们所讨论的例子都是非常简单的,树也容易理解,当然实际中应用的决策树可能非常复杂。假定我们利用历史数据建立了一个包含几百个属性、输出的类有十几种的决策树,这样孝州的一棵树对人来说可能太复杂了,但每一条从根结点到叶子节点的路径所描述的含义仍然是可以理解的。决策树的这种易理解性对数据挖掘的使用者来说是一个显著的优点。

然而决策树的这种明确性可能带来误导。比如,决策树每个节点对应分割的定义都是非常明确毫不含糊的,但在实际生活中这种明确可能带来麻烦(凭什么说年收入¥40,001的人具有较小的信用风险而¥40,000的人就没有)。

建立一颗决策树可能只要对数据库进行几遍扫描之后就能完成,这也意味着需要的计算资源较少,而且可以很容易的处理包含很多预测变量的情况,因此决策树模型可以建立得很快,并适合应用到大量的数据上。

对最终要拿给人看的决策树来说,在建立过程中让其生长的太“枝繁叶茂”是没有必要的,这样既降低了树的可理解性和可用性,同时也使决策树本身对历史数据的依赖性增大,也就是说这是这棵决策树对此历史数据可能非常准确,一旦应用到新的数据时准确性却急剧下降,我们称这巧正蔽种情况为训练过度。为了使得到的决策树所蕴含的规则具有普遍意义,必须防止训练过度,同时也减少了训练的时间。因此我们需要有一种方法能让我们在适当的时候停止树的生长。常用的方法是设定决策树的最大高度(层数)来限制树的生长。还有一种方法是设定每个节点必须包含的最少记录数,当节点中记录的个数小于这个数值时就停止分割。

与设置停止增长条件相对应的是在树建立好之后对其进行修剪。先允许树尽量生长,然后再把树修剪到较小的尺寸,当然在修剪的同时要求尽量保持决策树的准确度尽量不要下降太多。

对决策树常见的批评是说其在为一个节点选择怎样进行分割时使用“贪心”算法。此种算法在决定当前这个分割时根本不考虑此次选择会对将来的分割造成什么样的影响。换句话说,所有的分割都是顺序完成的,一个节点完成分割之后不可能以后再有机会回过头来再考察此次分割的合理性,每次分割都是依赖于他前面的分割方法,也就是说决策树中所有的分割都受根结点的次分割的影响,只要次分割有一点点不同,那么由此得到的整个决策树就会完全不同。那么是否在选择一个节点的分割的同时向后考虑两层甚至更多的方法,会具有更好的结果呢?目前我们知道的还不是很清楚,但至少这种方法使建立决策树的计算量成倍的增长,因此现在还没有哪个产品使用这种方法。

而且,通常的分割算法在决定怎么在一个节点进行分割时,都只考察一个预测变量,即节点用于分割的问题只与一个变量有关。这样生成的决策树在有些本应很明确的情况下可能变得复杂而且意义含混,为此目前新提出的一些算法开始在一个节点同时用多个变量来决定分割的方法。比如以前的决策树中可能只能出现类似“收入¥35,000”的判断,现在则可以用“收入(0.35*抵押)”或“收入¥35,000或抵押150,000”这样的问题。

决策树很擅长处理非数值型数据,这与神经网络只能处理数值型数据比起来,就免去了很多数据预处理工作。

甚至有些决策树算法专为处理非数值型数据而设计,因此当采用此种方法建立决策树同时又要处理数值型数据时,反而要做把数值型数据映射到非数值型数据的预处理。

以上就是小编对决策树是什么的相关信息分享,希望能对大家有所帮助。

关键词:

推荐阅读

飞龙股份002536今日主力资金流向 飞龙股份002536主力控盘分析

飞龙股份002536今日主力资金流向【飞龙股份(002536)】 今日主力资金流向,资金净流入105 11万元,今日超大单净流入296 82万元,大单净流入 【详细】

中国获得诺贝尔奖的人汇总 ​诺贝尔奖介绍

中国获得诺贝尔奖的人汇总截至目前为止,我国获得诺贝尔奖的人一共有十一个1、杨振宁,美籍华人,1957年获诺贝尔物理学奖。2、李政道,美籍 【详细】

祝融号传火星照片 怎么把照片传到地球的?

祝融号传火星照片让人对星辰大海充满了期待,接下来我们就来看看具体是什么样的照片吧。祝融号于北京时间2021年5月18日7:18降落在火星表面 【详细】

云南蝴蝶大爆发的消息引起热议 云南蝴蝶大爆发一般什么时候出现?

云南蝴蝶大爆发的消息引起热议许多去过云南旅游的人都听说过蝴蝶谷的大名,这次蝴蝶大爆发即将出现,那么这是什么原因?一般什么时候出现?蝴 【详细】

B站将离世用户账号列为纪念账号咋回事 B站公司简介

B站将离世用户账号列为纪念账号咋回事现在对于B站的了解相信已经不是停留在二次元圈子了,现在各类学习视频以及各类搞笑剪辑视频都在B站上 【详细】

相关新闻

当前关注:决策树是什么(什么是决策树)

本文目录一览:1、什么是决策树?为什么要用决策树?2、什么是决策树什么是决策树?为什么要用决策树? " 【详细】

全球首个!5G异网漫游是什么,如何使用?-微资讯

具体在费用上面,付亮认为,“消费者不用考虑如何结算的事情,产生5G异网漫游时依然会优先使用消费者套餐内 【详细】

嫦娥五号返回舱贴满了暖宝宝 嫦娥五号返回舱何时回来

嫦娥五号返回舱贴满了暖宝宝嫦娥五号:听说你们都以为我身上贴满了暖宝宝?……没错!是这样的!12月17日1时59分,探月工程嫦娥五号返回器在内 【详细】

悦诗风吟按摩膏怎么用 悦诗风吟舒缓修护膏使用步骤-每日快讯

悦诗风吟按摩膏使用第一步:卸妆洁面在使用按摩膏之前一定要卸妆清洁,让肌肤保持一个干净的状态,最好使用 【详细】

嫦娥五号完成首次月地转移轨道修正 影响嫦娥五号月底转移因素有哪些?

嫦娥五号完成首次月地转移轨道修正北京时间12月14日11时13分,嫦娥五号轨道飞行器和返回器组合上的两台25N发动机工作了约28秒,成功完成了 【详细】

怀档

1、怀挡即汽车变速杆位于方向盘下方,因换挡时将变速杆往怀中拨所以形象的称之为怀挡,其挡位排列模式与普 【详细】

徐翔带领散户先赢一局?华丽家族股东大会21项议案全被否,交易所下发监管函 独家焦点

华丽家族(600503 SH)近日成为市场焦点,而“上海滩大佬”王伟林对阵“宁波敢死队”徐翔的这场股东权利之 【详细】

浅试文心一言 世界热推荐

自从OpenAI公司的模型出现后,AI领域掀起了一股热潮,引发了众多技术爱好者的关注和探索,国内无法及时体验 【详细】

“羊了个羊”被点名,回应了-天天关注

“羊了个羊”游戏开发者北京简游科技有限公司近日发布声明回应此前被工信部点名。工信部指出,其应用程序涉 【详细】

杜康指什么(杜康是什么意思)-聚焦

本文目录一览:1、何以解忧,唯有杜康,杜康指什么?2、杜康是什么呢3、杜康指的是什么4、杜康是什么意 【详细】

飞龙股份002536今日主力资金流向 飞龙股份002536主力控盘分析

飞龙股份002536今日主力资金流向【飞龙股份(002536)】 今日主力资金流向,资金净流入105 11万元,今日超大单净流入296 82万元,大单净流入 【详细】

今年以来银行理财亏本纠纷增多|环球今头条

2022年四季度以来,理财市场频繁震荡,不少市民购买的理财产品出现了亏本,从而导致金融消费纠纷数量不断走 【详细】

中国获得诺贝尔奖的人汇总 ​诺贝尔奖介绍

中国获得诺贝尔奖的人汇总截至目前为止,我国获得诺贝尔奖的人一共有十一个1、杨振宁,美籍华人,1957年获诺贝尔物理学奖。2、李政道,美籍 【详细】

2012汽车销量 2020年的汽车销量是多少?

2012汽车销量全年产销量均超过1900万辆,汽车产销量分别为1927 18万辆和1930 64万辆,同比分别增长4 63%和4 33%;乘用车的表现优于商用车, 【详细】

青海省旅游客运服务系统便捷出行 全球视点

“青A96698,请减速慢行,注意行车安全。”“收到,车上乘客已系好安全带。”5月17日,在青海圣途国际旅行 【详细】

什么样的prompt能自动化教你玩Midjourney

它会一步步根据官方参数引导你做出你想要的图片。在人工智能领域的最新进展中,我们为您带来了一项创新成果 【详细】

iPhone 15刷新边框纪录,小米13危?数码博主:大戏逐渐精彩起来了_世界播资讯

为了进一步证实iPhone15ProMax边框变窄这个消息,我还托神秘好友了解到iPhone15跟iPhone15Plus屏 【详细】

重大进展!欧盟开绿灯,微软暴雪收购案即将完成?

距离微软宣布斥资687亿美元收购动视暴雪已经过去一年多,双方依旧没能如愿结合。各国监管机构的严格审查, 【详细】

世界今亮点!ofo小黄车创始人戴威去美国卖咖啡了,你的押金退了吗?

最近有个热点话题:ofo小黄车创始人戴威跑去美国卖咖啡重新创业了。你是不是也用过ofo小黄车,还交了199的 【详细】

折叠屏手机是噱头还是真实用,是否值得购买?

我觉得不管别人怎么说,或者你也看了某一些手机厂商介绍了折叠屏手机,例如有折叠悬停可以更好地当化妆镜, 【详细】

关于我们  |  联系方式  |  免责条款  |  招聘信息  |  广告服务  |  帮助中心

联系我们:85 572 98@qq.com备案号:粤ICP备18023326号-40

科技资讯网 版权所有