问题：

Keras-负余弦邻近损失

益麻雀

2023-03-14

我在Keras有小神经网络：

contextTrain, contextTest, utteranceTrain, utteranceTest = train_test_split(context, utterance, test_size=0.1, random_state=1)
model = Sequential()
model.add(LSTM(input_shape=contextTrain.shape[1:], return_sequences=True, units=300, activation="sigmoid", kernel_initializer="glorot_normal", recurrent_initializer="glorot_normal"))
model.add(LSTM(return_sequences=True, units=300, activation="sigmoid", kernel_initializer="glorot_normal", recurrent_initializer="glorot_normal"))
model.compile(loss="cosine_proximity", optimizer="adam", metrics=["accuracy"])
model.fit(contextTrain, utteranceTrain, epochs=5000, validation_data=(contextTest, utteranceTest), callbacks=[ModelCheckpoint("model{epoch:02d}.h5", monitor='val_acc', save_best_only=True, mode='max')])

上下文和话语是具有形状的数组，例如(100，15，300)。fisrt LSTM的Input_shape应为（15,300）。

Train on 90 samples, validate on 10 samples

Epoch 1/5000 90/90 [==============================] - 5s 52ms/step - loss: -0.4729 - acc: 0.0059 - val_loss: -0.4405 - val_acc: 0.0133

Epoch 2/5000 90/90 [==============================] - 2s 18ms/step - loss: -0.5091 - acc: 0.0089 - val_loss: -0.4658 - val_acc: 0.0133

Epoch 3/5000 90/90 [==============================] - 2s 18ms/step - loss: -0.5204 - acc: 0.0170 - val_loss: -0.4829 - val_acc: 0.0200

Epoch 4/5000 90/90 [==============================] - 2s 20ms/step - loss: -0.5296 - acc: 0.0244 - val_loss: -0.4949 - val_acc: 0.0333

Epoch 5/5000 90/90 [==============================] - 2s 20ms/step - loss: -0.5370 - acc: 0.0422 - val_loss: -0.5021 - val_acc: 0.0400

这是什么意思？而可能的原因又是什么呢？

共有1个答案

东方宜

2023-03-14

您的损失函数cosine_proximity确实可以取负值；根据Keras的创建者Francois Chollet的说法，它通常是负面的（Github评论）：

损失只是一个你试图最小化的标量。不应该是阳性的！例如，余弦接近度损失通常为负值（试图通过最小化负标量来使接近度尽可能高）。

下面是另一个使用余弦接近度的例子，其中的值也是负值。

类似资料：

k近邻

k近邻（k-Nearest Neighbors）采用向量空间模型来分类，是一种常用的监督学习方法。它的工作原理为：给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个训练样本，然后基于这k个“邻居”的信息来进行预测。通常，在分类任务中可使用“投票法”，即选择这k个样本中出现最多的类别标记作为预测结果；在回归任务中可使用“平均法”，即将这k个样本的实值输出标记的平均值作为预测结果；还可基于距离
余弦相似度

问题内容：我计算了两个文档的tf / idf值。以下是tf / idf值：这些文件就像：如何使用这些值来计算余弦相似度？我知道我应该计算点积，然后找到距离并除以点积。如何使用我的值来计算？还有一个问题：两个文档的字数相同是否重要？问题答案： a * b是点积一些细节：是。在某种程度上，a和b必须具有相同的长度。但是a和b通常具有稀疏表示，您只需要存储非零条目，就可以更快地计算范数
用单精度浮点逼近[0,pi]上的余弦

我目前正在研究余弦的近似值。由于最终的目标设备是一个使用32位浮点ALU/LU的自开发设备，并且有一个专门的C编译器，所以我不能使用C库的数学函数(cosf，...)。我的目标是编写在精度和指令/周期数量方面不同的各种方法。我已经尝试了很多不同的近似算法，从fdlibm开始，taylor展开，pade近似，remez算法使用maple等等.... 但是一旦我只使用浮点精度来实现它们，精度就会有很
邻近搜索

问题内容：应用程序如何执行邻近搜索？例如，用户输入邮政编码，然后应用程序按距离排序列出20英里内的所有企业。我想在PHP和MySQL中构建类似的东西。这种方法正确吗？获取我感兴趣的位置的地址并将其存储在数据库中使用Google的地理编码服务对所有地址进行地理编码编写包含Haversine公式的数据库查询以进行邻近搜索和排序这个可以吗？在第3步中，我将计算每个查询的接近度。有一个PROX
1.6. 最近邻

校验者: @DataMonk2017 @Veyron C @舞空翻译者: @那伊抹微笑 sklearn.neighbors 提供了 neighbors-based (基于邻居的) 无监督学习以及监督学习方法的功能。无监督的最近邻是许多其它学习方法的基础，尤其是 manifold learning (流行学习) 和 spectral clustering (谱聚类)。 neighbors-bas
计算Keras中两个张量之间的余弦相似度

问题内容：我一直在遵循一个教程，该教程显示了如何制作word2vec模型。本教程使用以下代码：（未提供其他信息，但我想这来自）现在，我已经对该方法进行了一些研究，但对此却知之甚少。据我了解，它已被许多功能取代。我应该使用什么？有，它有一个参数（似乎正确），但没有参数。在这种情况下我可以使用什么？问题答案： Keras文档中有一些尚不清楚的事情，我认为了解这些至关重要：对于keras

Keras-负余弦邻近损失

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档