当前位置: 首页 > 面试题库 >

如何建立一个“相关问题”引擎?

宇文迪
2023-03-14
问题内容

我们较大的网站之一的区域中,用户可以将问题发送给网站所有者,该问题由其工作人员亲自评估。当经常弹出相同的问题时,他们可以将此特定问题添加到常见问题解答中。

为了防止他们每天收到数十个类似的问题,我们希望提供与本网站上“相关问题”类似的功能(堆栈溢出)。

有什么方法可以构建这种功能?我知道我应该以某种方式评估问题并将其与常见问题解答进行比较,但是这种比较是如何进行的?是否提取了关键字?

可能值得一提的是,该站点建立在LAMP堆栈上,因此这些都是可用的技术。

谢谢!


问题答案:

我不知道Stack
Overflow的工作原理,但我想它使用标签来查找相关问题。例如,在此问题上,与之相关的前几个问题都带有标记recommendation- engine。我想稀有标签上的匹配比普通标签上的匹配更重要。

您可能还希望查看术语“频率-反向文档频率”。



 类似资料:
  • 在workerman中建立udp服务很简单,类似如下代码 $udp_worker = new Worker('udp://127.0.0.1:9090'); $udp_worker->onMessage = function($connection, $data){ var_dump($data); $connection->send('get'); }; Worker::runA

  • 网站搭建萌新,有些疑惑希望大佬们可以解答: nginx、tomcat与云服务器(如阿里云、腾讯云等)、机房实体服务器有啥区别? 搭建网站的时候什么时候用nginx和tomcat,以及详细原因(比如为啥tomcat大多用于前端到后端的中间件,而nginx为啥大多用于用户到浏览器的中间件?) 搭建网站,前后端分别部署在不同服务器上,以前端访问后端为例,在已实现跨域的前提下,能否通过 前端向后端服务器的

  • 本页列出注解相关常见问题,欢迎大家补充。 如何忽略一些我不想被扫描到的类? 在项目配置文件中配置: return [ // 忽略扫描的命名空间 'ignoreNamespace' => [ 'Imi\Test\Component\Annotation\A\*', // 忽略扫描该命名空间下所有类 'Imi\Test\Component\A

  • 如何获取QQ登录的unionId? 在AuthConfig中设备unionId为true AuthRequest authRequest = new AuthQqRequest(AuthConfig.builder() .clientId("clientId") .clientSecret("clientSecret") .redirectUri("

  • 升级到1.9.3+版本后编译失败 主要明显的就是IpUtils.getIp和request的.state报错。 这是因为从v1.9.3版本开始,对项目进行了一些优化,具体优化内容参考:v1.9.3 (opens new window)和v1.9.4 (opens new window)。 新版本的使用方式,参考JustAuth-demo (opens new window) @RequestMap

  • 我目前正在努力加深对CMake的理解。我试着用http://libqglviewer.com/introduction.html]LibQGLViewer是我的一个C项目中的第三方库。 相关子目录中的CMakeLists.txt看起来像下面的部分,我有问题是add_libary部分,为了清晰起见,省略了一些头文件和源文件 我的应用程序运行,一切都很好。 但是,我读到,应该只包含ADDILL库的源文