异常检测
Post by Joey Huang under ml on 2015-12-15(Tuesday) 23:11. Tags: machine-learning,
高斯分布是自然界最常见的分布形态,高斯分布用来做异常检测是非常合适的模型。枪打出头鸟,那些分布在正态分布两端的小概率事件,要么好的出奇(右边),要么差得离谱(右边)。据说认真看完这篇文章并点赞的人基本上是分布在高斯分布的右侧。
高斯分布是自然界最常见的分布形态,高斯分布用来做异常检测是非常合适的模型。枪打出头鸟,那些分布在正态分布两端的小概率事件,要么好的出奇(右边),要么差得离谱(右边)。据说认真看完这篇文章并点赞的人基本上是分布在高斯分布的右侧。
PCA 算法主要是把高维度的数据降为低维度数据。典型地应用包括数据压缩和数据可视化。本文介绍 PCA 算法及其典型应用。
本文介绍如何使用 Sublime + PlantUML 的插件画流程图,状态图,时序图等
K 均值算法是一种典型的无监督学习算法,用来对数据进行分类。
什么是核函数?核函数的作用是什么?怎么样把核函数和支持向量机结合起来?怎么样使用支持向量机来解决分类问题?怎么样在逻辑回归算法,支持向量机,神经网络这三个分类算法里选择使用哪个算法来解决实际问题?本文就是回答这些疑问的。
支持向量机算法 SVM 是 Support Vector Machine 的缩写,它是工业和学术界都有广泛应用的强大的算法。
本文以设计一个垃圾邮件过滤系统为例,谈谈如何设计一个机器学习系统。同时介绍查准率,召回率以及 F1Score 来评价算法的性能。
本文介绍机器学习算法的性能评估的方法,包括算法高偏差还是高方差的诊断,学习曲线等。
本文接着介绍神经网络,包括成本函数,以及向后传播算法,用来计算神经网络成本函数的微分项。最后总结神经网络的架构设计和训练步骤。
神经网络模拟人的神经系统,是比逻辑回归更复杂的机器学习算法。本文介绍神经网络的模型和模拟逻辑运算方面的简单应用。