正定矩阵

发布时间:2016-04-24  栏目:机器学习  评论:0 Comments

在线性代数里,正定矩阵 (英文:positive definite matrix) 有时会简称为正定阵。在双线性代数中,正定矩阵的性质类似复数中的正实数。与正定矩阵相对应的线性算子是对称正定双线性形式(复域中则对应埃尔米特正定双线性形式)。   广义定...

希尔伯特空间

发布时间:2016-04-24  栏目:机器学习  评论:0 Comments

在数学中,希尔伯特空间是欧几里德空间的一个推广,其不再局限于有限维的情形。与欧几里德空间相仿,希尔伯特空间也是一个内积空间,其上有距离和角的概念(及由此引申而来的正交性与垂直性的概念)。此外,希尔伯特空间还是一个完备的空间,其...

堆排序

发布时间:2016-04-22  栏目:软件算法  评论:0 Comments

    参考: http://blog.csdn.net/morewindows/article/details/6709644/

KKT条件

发布时间:2016-04-22  栏目:机器学习  评论:0 Comments

1. 最优化理论(Optimization Theory) 最优化理论是研究函数在给定一组约束条件下的最小值(或者最大值)的数学问题. 一般而言, 一个最优化问题具有如下的基本形式: min.:f(x) s.t.:gi(x)≤0,i=1,2,...,p,hj(x)=0,k=1,2,...,q,x∈Ω⊂Rn ...

协同过滤推荐算法

发布时间:2016-04-13  栏目:机器学习  评论:0 Comments

相似度的计算 关于相似度的计算,现有的几种基本方法都是基于向量(Vector)的,其实也就是计算两个向量的距离,距离越近相似度越大。在推荐的场景中,在用户 – 物品偏好的二维矩阵中,我们可以将一个用户对所有物品的偏好作为一个向量来...

【转】最大似然估计、MAP及贝叶斯估计

发布时间:2016-04-11  栏目:机器学习, 深度学习  评论:0 Comments

以PLSA和LDA为代表的文本语言模型是当今统计自然语言处理研究的热点问题。这类语言模型一般都是对文本的生成过程提出自己的概率图模型,然后利用观察到的语料数据对模型参数做估计。有了语言模型和相应的模型参数,我们可以有很多重要的应用,比...

pycharm

发布时间:2016-04-08  栏目:Python  评论:0 Comments

pycharm 添加本地第三方库 找到pycharm中其他库的本地路径,把新的第三方库复制过去即可

Spark RDD API

发布时间:2016-04-08  栏目:Spark  评论:0 Comments

RDD是什么? RDD是Spark中的抽象数据结构类型,任何数据在Spark中都被表示为RDD。从编程的角度来看,RDD可以简单看成是一个数组。和普通 数组的区别是,RDD中的数据是分区存储的,这样不同分区的数据就可以分布在不同的机器上,同时可以被并行处...

t-distributed stochastic neighbor embedding

发布时间:2016-04-07  栏目:机器学习  评论:0 Comments

t-distributed stochastic neighbor embedding (t-SNE) is a machine learning algorithm for dimensionality reduction developed by Laurens van der Maaten and Geoffrey Hinton. It is a nonlinear dimensionality reduction technique that...

主成分分析PCA

发布时间:2016-04-07  栏目:机器学习  评论:0 Comments

降维的必要性 1.多重共线性–预测变量之间相互关联。多重共线性会导致解空间的不稳定,从而可能导致结果的不连贯。 2.高维空间本身具有稀疏性。一维正态分布有68%的值落于正负标准差之间,而在十维空间上只有0.02%。 3.过多的变量会妨碍查...

机器学习基础知识回顾-贝叶斯估计

发布时间:2016-04-06  栏目:机器学习  评论:0 Comments

贝叶斯估计,是在给定训练数据D时,确定假设空间H中的最佳假设。 最佳假设:一种方法是把它定义为在给定数据D以及H中不同假设的先验概率的有关知识下的最可能假设。贝叶斯理论提供了一种计算假设概率的方法,基于假设的先验概率、给定假设下观察...

【转】深度学习7: 自我学习

发布时间:2016-04-05  栏目:深度学习  评论:0 Comments

综述 如果已经有一个足够强大的机器学习算法,为了获得更好的性能,最靠谱的方法之一是给这个算法以更多的数据。机器学习界甚至有个说法:“有时候胜出者并非有最好的算法,而是有更多的数据。” 人们总是可以尝试获取更多的已标注数据,但是这样...

相册集

pix pix pix pix pix pix

关于自己

杨文龙,微软Principal Engineering Manager, 曾在各家公司担任影像技术资深总监、数据科学团队资深经理、ADAS算法总监、资深深度学习工程师等职位,热爱创新发明,专注于人工智能、深度学习、图像处理、机器学习、算法、自然语言处理及软件等领域,目前发明有国际专利19篇,中国专利28篇。

联系我

个人技术笔记

290125097@qq.com

2015 in Shanghai