推荐系统总结。

前段时间看了一些论文,总结一下。

推荐系统分为1,content-based:用户或者商品的显式profile,比如年龄,性别,职业等。弊端:但是这些数据不容易获得。我觉得这个挺困难的,哪有那么多数据啊。

2,Collaborative Filtering:包括neighborhood model,以及latent factor model。又可分为概率CF(比如贝叶斯网络,这个没深入研究过)以及非概率CF(近邻模型就是非概率的)。

neighborhood model又分为user-based(根据同趣用户购买的商品做推荐,比如甲的好基友买了个打篮球用的护腕,于是甲也可能想买)和item-based(比如甲买了个护腕,结果发现再买个护膝就能更帅了,所以就可能再买个护膝)

latent factor model主要是基于矩阵分解的技术。关于矩阵分解的技术,数学上有三大矩阵分解技术:LU,SVD,QR。其中LU分解是将一个矩阵分为下三角矩阵*上三角矩阵(过段时间我把这个c++代码贴出来,其实实际中用不上的),主要用在数值分析中,比如用来求线性方程的解。SVD,这个貌似是推荐系统中一个经典算法,在LSA(论文在此http://www.stat.cmu.edu/~cshalizi/350/2008/readings/Deerwester-et-al.pdf)中,就是用的纯粹的SVD,之所以说它纯粹,是因为论文中用到的是纯正的数学分解方法,然后再利用SVD的分解结果。