逻辑回归
逻辑回归是一种统计分析方法,用于预测数据值基于之前的观察数据集。逻辑回归已成为学科的重要工具机器学习。该方法允许算法在机器学习应用程序中用于根据历史数据对传入数据进行分类。随着更多相关数据的加入,该算法应该能够更好地预测数据集内的分类。逻辑回归也可以发挥作用数据准备活动,允许在提取、转换、加载(ETL),以便将信息分阶段进行分析。
logistic回归模型预测A依赖的数据变量通过分析一个或多个现有自变量之间的关系。例如,逻辑回归可以用来预测一个政治候选人是否会在选举中获胜或失败,或者一个高中生是否会被某所大学录取。
所得到的分析模型可以考虑多个输入条件。在被大学录取的情况下,该模型可以考虑学生的平均绩点、SAT成绩和课外活动的数量等因素。基于历史数据对于涉及相同输入标准的早期结果,它会根据新病例落入特定结果类别的概率进行评分。
逻辑回归的目的和例子
逻辑回归是最常用的机器学习算法之一用于二值分类问题,这是两个类别值的问题,包括预测,如“这或那”,“是或否”和“A或b”
逻辑回归的目的是估计事件的概率,包括确定特征和特定结果的概率之间的关系。
这方面的一个例子是,当学习所花费的小时数作为一个特征提供,并且响应的变量有两个值:及格和不及格时,预测学生将通过还是不通过考试。
组织可以使用来自逻辑回归输出的见解来增强他们的业务战略,这样他们就可以实现他们的业务目标,包括减少费用或损失和增加ROI例如,在营销活动中。
一个电子商务向客户发送昂贵促销优惠的公司想知道某个特定客户是否可能对这些优惠作出反应。例如,他们想知道消费者是“响应者”还是“不响应者”。在市场营销中,这被称为响应建模倾向。
同样,信用卡公司开发一个模型来决定是否发行信用卡客户是否将试图预测客户是否会违约或不是信用卡年收入等特点的基础上,每月信用卡支付和违约。用银行业的说法,这被称为违约倾向建模。
logistic回归的使用
逻辑回归在网络广告领域尤为流行,它可以让营销人员预测特定网站用户点击特定广告的可能性,并将其作为是或否的百分比。
Logistic回归还可用于:
- 卫生保健部门识别疾病的风险因素并计划预防措施。
- 天气预报应用程序预测降雪和天气状况。
- 投票应用程序来确定选民是否会投票给某个特定的候选人。
- 根据特定标准,如性别、年龄和体格检查,预测投保人在保单期限届满前死亡的可能性。
- 根据年收入、过去的违约情况和过去的债务预测贷款申请人是否会违约的可能性。
逻辑回归和线性回归
逻辑回归和线性回归的主要区别在于逻辑回归提供恒定的输出,而线性回归提供连续的输出。
在逻辑回归中,结果(如因变量)只有有限的可能值。然而,在线性回归中,结果是连续的,这意味着它可以有无限个可能的值中的任何一个。
当响应变量是分类的,如是/否,真/假和通过/失败时,使用Logistic回归。当响应变量为连续变量时,如小时数、身高、体重,则采用线性回归。
例如,给定一个学生花在学习上的时间和该学生的考试成绩的数据,logistic回归和线性回归可以预测不同的事情。
使用逻辑回归预测,只允许特定的值或类别。因此,logistic回归可以预测学生是通过还是不通过。由于线性回归预测是连续的,比如一个范围内的数字,它可以预测学生的考试成绩(0 -100分)。