SQL-选择最相似的产品

唐运诚

2023-03-14

问题内容：

好的，我有一个关系，该关系存储两个键，一个产品ID和一个属性ID。我想弄清楚哪种产品与给定的产品最相似。（属性实际上是数字，但这会使示例更加混乱，因此已将其更改为字母以简化视觉表示。）

Prod_att

Product | Attributes  
   1   |    A     
   1   |    B  
   1   |    C  
   2   |    A  
   2   |    B  
   2   |    D  
   3   |    A  
   3   |    E  
   4   |    A

最初，这似乎很简单，只需选择产品具有的属性，然后计算每个产品共享的属性数。然后将其结果与一个产品具有的属性数量进行比较，我可以看到两个产品的相似程度。这适用于相对于其比较产品具有大量属性的产品，但是当产品具有很少的属性时会出现问题。例如，产品3几乎与其他所有产品都有联系（因为A很常见）。

SELECT Product, count(Attributes)  
FROM Prod_att  
WHERE Attributes IN  
(SELECT Attributes  
FROM prod_att  
WHERE Product = 1)  
GROUP BY Product
;

关于如何解决此问题或对当前查询进行改进的任何建议？
谢谢！

*编辑：产品4将为所有产品返回count（）= 1。我想展示产品3更相似，因为它具有更少的不同属性。

问题答案：

试试这个

SELECT 
  a_product_id, 
  COALESCE( b_product_id, 'no_matchs_found' ) AS closest_product_match
FROM (
  SELECT 
    *,  
    @row_num := IF(@prev_value=A_product_id,@row_num+1,1) AS row_num,
    @prev_value := a_product_id
  FROM 
    (SELECT @prev_value := 0) r
    JOIN (
        SELECT 
         a.product_id as a_product_id,
         b.product_id as b_product_id,
         count( distinct b.Attributes ),
         count( distinct b2.Attributes ) as total_products
        FROM
          products a
          LEFT JOIN products b ON ( a.Attributes = b.Attributes AND a.product_id <> b.product_id )
          LEFT JOIN products b2 ON ( b2.product_id = b.product_id )
       /*WHERE */
         /*  a.product_id = 3 */
        GROUP BY
         a.product_id,
         b.product_id
        ORDER BY 
          1, 3 desc, 4
  ) t
) t2 
WHERE 
  row_num = 1

上面query获取了closest matches所有产品的，您可以product_id在最里面的查询中包含，以获取特定的结果product_id，我已经使用过了LEFT JOIN，即使aproduct没有匹配项，它的显示

SQLFIDDLE

希望这可以帮助

SQL-选择最相似的产品

相关阅读

相关文章

相关问答

相关工具

相关文档