机器学习实战(五)Logistic回归

Logistic回归是一种简单的分类算法,提到“回归”,很多人可能觉得与分类没什么关系,Logistic回归通过对数据分类边界的拟合来实现分类。而“回归”也就意味着最佳拟合。要进行最佳拟合,则需要寻找到最佳的拟合参数,一些最优化方法就可以用于最佳回归系数的确定。     阅读全文
安 阳's avatar
安 阳 12月 01, 2017

机器学习实战系列

人生苦短,我用Python。 Python是门优雅的语言,在机器学习领域有着很高的造诣,虽然不太会,边写边学吧。 这一系列是我在学习《机器学习实战》这本书记的笔记,主要是代码,另外给这些代码加了些自己的注释,包括Python的api用法、某些科学计算库的用法、还有一些自己的理解。希望大家来指正,共同学习。     阅读全文
安 阳's avatar
安 阳 9月 09, 2017

机器学习实战(四)朴素贝叶斯(NaivaBayes)

基于概率论的分类方法:朴素贝叶斯。(条件概率) 朴素贝叶斯:朴素贝叶斯是一种简单但是非常强大的线性分类器。它在垃圾邮件分类,疾病诊断中都取得了很大的成功。它只所以称为朴素,是因为它假设特征之间是相互独立的,但是在现实生活中,这种假设基本上是不成立的。那么即使是在假设不成立的条件下,它依然表现的很好,尤其是在小规模样本的情况下。但是,如果每个特征之间有很强的关联性和非线性的分类问题会导致朴素贝叶斯模型有很差的分类效果。     阅读全文
安 阳's avatar
安 阳 9月 08, 2017

机器学习实战(三)决策树

决策树是一种简单高效并且具有强解释性的模型,广泛应用于数据分析领域。其本质是一颗由多个判断节点组成的树,在使用模型进行预测时,根据输入参数依次在各个判断节点进行判断游走,最后到叶子节点即为预测结果。     阅读全文
安 阳's avatar
安 阳 9月 08, 2017

机器学习实战(二)k-近邻算法

k-近邻算法:KNN是通过测量不同特征值之间的距离进行分类。它的的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。     阅读全文
安 阳's avatar
安 阳 9月 08, 2017

机器学习实战(一)NumPy函数库基础

NumPy函数库基础。 机器学习实战这本书的第一章,下面是这章的代码,添加了些本人的注释,欢迎指正。     阅读全文
安 阳's avatar
安 阳 9月 08, 2017