当前位置: 首页 > 编程笔记 >

Java编程实现基于用户的协同过滤推荐算法代码示例

楚灿
2023-03-14
本文向大家介绍Java编程实现基于用户的协同过滤推荐算法代码示例,包括了Java编程实现基于用户的协同过滤推荐算法代码示例的使用技巧和注意事项,需要的朋友参考一下

协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。

协同过滤又可分为评比(rating)或者群体过滤(social filtering)协同过滤以其出色的速度和健壮性,在全球互联网领域炙手可热

UserCF的核心思想即为根据用户数据模拟向量相似度,我们根据这个相似度,来找出指定用户的相似用户,然后将相似用户买过的而指定用户没有买的东西推荐给指定用户,推荐度的计算也是结合了相似用户与指定用户的相似度累加。注意这里我们默认是用户的隐反馈行为,所以每一个物品的影响因子默认为1。

package cn.csu.CFUtils;
import java.util.HashMap;
import java.util.HashSet;
import java.util.Iterator;
import java.util.Map;
import java.util.Map.Entry;
import java.util.Scanner;
import java.util.Set;
/** 
 * 基于用户的协同过滤推荐算法实现 
A a b d 
B a c 
C b e 
D c d e 
 * @author Administrator 
 * 
 */
public class UserCF {
	public static void main(String[] args) {
		/** 
   * 输入用户-->物品条目 一个用户对应多个物品 
   * 用户ID 物品ID集合 
   * A  a b d 
   * B  a c 
   * C  b e 
   * D  c d e 
   */
		Scanner scanner = new Scanner(System.in);
		System.out.println("Input the total users number:");
		//输入用户总量 
		int N = scanner.nextint();
		int[][] sparseMatrix = new int[N][N];
		//建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】 
		Map<String, Integer> userItemLength = new HashMap<>();
		//存储每一个用户对应的不同物品总数 eg: A 3 
		Map<String, Set<String>> itemUserCollection = new HashMap<>();
		//建立物品到用户的倒排表 eg: a A B 
		Set<String> items = new HashSet<>();
		//辅助存储物品集合 
		Map<String, Integer> userID = new HashMap<>();
		//辅助存储每一个用户的用户ID映射 
		Map<Integer, String> idUser = new HashMap<>();
		//辅助存储每一个ID对应的用户映射 
		System.out.println("Input user--items maping infermation:<eg:A a b d>");
		scanner.nextLine();
		for (int i = 0; i < N ; i++){
			//依次处理N个用户 输入数据 以空格间隔 
			String[] user_item = scanner.nextLine().split(" ");
			int length = user_item.length;
			userItemLength.put(user_item[0], length-1);
			//eg: A 3 
			userID.put(user_item[0], i);
			//用户ID与稀疏矩阵建立对应关系 
			idUser.put(i, user_item[0]);
			//建立物品--用户倒排表 
			for (int j = 1; j < length; j ++){
				if(items.contains(user_item[j])){
					//如果已经包含对应的物品--用户映射,直接添加对应的用户 
					itemUserCollection.get(user_item[j]).add(user_item[0]);
				} else{
					//否则创建对应物品--用户集合映射 
					items.add(user_item[j]);
					itemUserCollection.put(user_item[j], new HashSet<String>());
					//创建物品--用户倒排关系 
					itemUserCollection.get(user_item[j]).add(user_item[0]);
				}
			}
		}
		System.out.println(itemUserCollection.toString());
		//计算相似度矩阵【稀疏】 
		Set<Entry<String, Set<String>>> entrySet = itemUserCollection.entrySet();
		Iterator<Entry<String, Set<String>>> iterator = entrySet.iterator();
		while(iterator.hasNext()){
			Set<String> commonUsers = iterator.next().getValue();
			for (String user_u : commonUsers) {
				for (String user_v : commonUsers) {
					if(user_u.equals(user_v)){
						continue;
					}
					sparseMatrix[userID.get(user_u)][userID.get(user_v)] += 1;
					//计算用户u与用户v都有正反馈的物品总数
				}
			}
		}
		System.out.println(userItemLength.toString());
		System.out.println("Input the user for recommendation:<eg:A>");
		String recommendUser = scanner.nextLine();
		System.out.println(userID.get(recommendUser));
		//计算用户之间的相似度【余弦相似性】 
		int recommendUserId = userID.get(recommendUser);
		for (int j = 0;j < sparseMatrix.length; j++) {
			if(j != recommendUserId){
				System.out.println(idUser.get(recommendUserId)+"--"+idUser.get(j)+"相似度:"+sparseMatrix[recommendUserId][j]/Math.sqrt(userItemLength.get(idUser.get(recommendUserId))*userItemLength.get(idUser.get(j))));
			}
		}
		//计算指定用户recommendUser的物品推荐度 
		for (String item: items){
			//遍历每一件物品 
			Set<String> users = itemUserCollection.get(item);
			//得到购买当前物品的所有用户集合 
			if(!users.contains(recommendUser)){
				//如果被推荐用户没有购买当前物品,则进行推荐度计算 
				double itemRecommendDegree = 0.0;
				for (String user: users){
					itemRecommendDegree += sparseMatrix[userID.get(recommendUser)][userID.get(user)]/Math.sqrt(userItemLength.get(recommendUser)*userItemLength.get(user));
					//推荐度计算
				}
				System.out.println("The item "+item+" for "+recommendUser +"'s recommended degree:"+itemRecommendDegree);
			}
		}
		scanner.close();
	}
}

结果:

Input the total users number:
6
Input user--items maping infermation:<eg:A a b d>
aassdd
djshgjh
2415231424
dsjkj dklsjf ladkjsf
df8g78dfg78 8787 
48787 sdfasd
{dklsjf=[dsjkj], sdfasd=[48787], 8787=[df8g78dfg78], ladkjsf=[dsjkj]}
{aassdd=0, df8g78dfg78=1, 48787=1, 2415231424=0, djshgjh=0, dsjkj=2}
Input the user for recommendation:<eg:A>
aassdd
0
aassdd--djshgjh相似度:NaN
aassdd--2415231424相似度:NaN
aassdd--dsjkj相似度:NaN
aassdd--df8g78dfg78相似度:NaN
aassdd--48787相似度:NaN
The item dklsjf for aassdd's recommended degree:NaN
The item sdfasd for aassdd's recommended degree:NaN
The item 8787 for aassdd's recommended degree:NaN
The item ladkjsf for aassdd's recommended degree:NaN

总结

以上就是本文关于Java编程实现基于用户的协同过滤推荐算法代码示例的全部内容,希望对大家有所帮助。如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

 类似资料:
  • SimRank是基于图论的,如果用于推荐算法,则它假设用户和物品在空间中形成了一张图。而这张图是一个二部图。所谓二部图就是图中的节点可以分成两个子集,而图中任意一条边的两个端点分别来源于这两个子集。一个二部图的例子如下图。从图中也可以看出,二部图的子集内部没有边连接。对于我们的推荐算法中的SimRank,则二部图中的两个子集可以是用户子集和物品子集。而用户和物品之间的一些评分数据则构成了我们的二部

  • 1.矩阵分解用于推荐算法要解决的问题     在推荐系统中,我们常常遇到的问题是这样的,我们有很多用户和物品,也有少部分用户对少部分物品的评分,我们希望预测目标用户对其他未评分物品的评分,进而将评分高的物品推荐给目标用户。比如下面的用户物品评分表: 用户物品 物品1 物品2 物品3 物品4 物品5 物品6 物品7 用户1 3 5 1 用户2 2 4 用户3 4 用户4 2 1 用户5 1 4   

  • 目前为止我们描述的都是基于用户的协同过滤算法。我们将一个用户和其他所有用户进行对比,找到相似的人。这种算法有两个弊端: 扩展性 上文已经提到,随着用户数量的增加,其计算量也会增加。这种算法在只有几千个用户的情况下能够工作得很好,但达到一百万个用户时就会出现瓶颈。 稀疏性 大多数推荐系统中,物品的数量要远大于用户的数量,因此用户仅仅对一小部分物品进行了评价,这就造成了数据的稀疏性。比如亚马逊有上百万

  • 本文向大家介绍用Python实现协同过滤的教程,包括了用Python实现协同过滤的教程的使用技巧和注意事项,需要的朋友参考一下 协同过滤 在 用户 —— 物品(user - item)的数据关系下很容易收集到一些偏好信息(preference),比如评分。利用这些分散的偏好信息,基于其背后可能存在的关联性,来为用户推荐物品的方法,便是协同过滤,或称协作型过滤(collaborative filte

  • 本文向大家介绍Java编程实现A*算法完整代码,包括了Java编程实现A*算法完整代码的使用技巧和注意事项,需要的朋友参考一下 前言 A*搜寻算法俗称A星算法。这是一种在图形平面上,有多个节点的路径,求出最低通过成本的算法。常用于游戏中 通过二维数组构建的一个迷宫,“%”表示墙壁,A为起点,B为终点,“#”代表障碍物,“*”代表算法计算后的路径 本文实例代码结构: 算法理论 算法的核心公式为:F=

  • 1:联系用户兴趣和物品的方式 2:标签系统的典型代表 3:用户如何打标签 4:基于标签的推荐系统 5:算法的改进 6:标签推荐 一:联系用户兴趣和物品的方式 推荐系统的目的是联系用户的兴趣和物品,这种联系方式需要依赖不同的媒介。目前流行的推荐系统基本上是通过三种方式联系用户兴趣和物品。 1:利用用户喜欢过的物品,给用户推荐与他喜欢过的物品相似的物品,即基于item的系统过滤推荐算法 2:利用用户和