欢迎来到 常识词典网 , 一个专业的常识知识学习网站!
[ Ctrl + D 键 ]收藏本站
答案 1:
不好意思,没办法回答的非常详细。基本上是一个半监督的学习过程,会给每个博客计算profile确定分类,同时对博客里的文章再计算profile进行调整。豆瓣的一个优势是拥有比较完整的用户兴趣数据,因此可以不必局限于博客和文章的文本进行分类。把用户的兴趣数据利用起来可以收到比较好的效果。答案 2:
你说的两种方式都不是非此即彼的,完全切词后也需要特征提取(找一个特殊词词典),特定词是否出现其实就是决策树方法的一个特例,两个方式都需要机器学习,说到机器学习,那就是一个方法了,只是算法选择有差异罢了。下一篇:还记得年少时的梦吗? 下一篇 【方向键 ( → )下一篇】
上一篇:你会购买MOTO的平板电脑 XOOM吗? 上一篇 【方向键 ( ← )上一篇】
快搜