最新的“评估”问题-堆栈溢出

1 投票

1 回答

29 意见

为什么循环中classification_report和precision_recall_fscore_support的敏感度（召回）值不同？

我正在处理一个使用make_classification从sklearn.datasets生成的合成数据集，该数据集包含5个类。我已经针对这些数据训练了一个RandomForest分类器，并正在评估其性能。。。

阿塔瓦·拉萨内

23

问昨天

0 投票

0 答案

16 意见

计算精确度和召回率的问题

我需要计算精度和召回来评估我的模型性能，所以我使用这段代码执行推断，用结果类注释图像并计算精度和。。。

安雅

11

问6月22日10:58

0 投票

0 答案

113 意见

预测前k个元素的平均倒数秩（MRR）理解

我从一篇论文中获得了以下代码，他们使用一些机器学习模型实现了MRR来推荐top-k元素。定义MRR（test_y，pred_y，k=5）：预测=pd.DataFrame（[]）...

安培1590

103

问5月11日21:21

0 投票

0 答案

35 意见

意外的搜索结果：Gmail搜索如何解释高级查询，以及我如何使用这些信息来实现精度？

考虑以下过滤器记住这个过滤器（也在查询表中提供）。我们稍后再谈。发件人：｛domain1 domain2 email1 email2｝主题：{+“精确字符串1”+“。。。

穆西索斯3000

549

问5月10日18:25

-2 投票

1 回答

43 意见

如何用一些操作符解释零平衡表达式的优先级计算？

以下代码运行良好。在null平衡之后，加法+被评估的逻辑是什么？？？这怎么可能？医生在哪里解释？整数？t可为空=2；...

埃里克·欧莱特

11.5万

问5月8日15:38

1 投票

1 回答

19 意见

为什么二进制分类的catboost自定义eval_metric的近似变量包含负值？

为了使用catboost为二进制分类创建个人评估函数，我使用了这里提到的示例：如何为catboost创建自定义评估指标？然而，我有消极的。。。

用户23571732

11

问4月29日15:57

0 投票

0 答案

17 意见

如何在下面的代码中添加每个历元的验证准确性？

定义列车（）：seed_val=42标准=余弦相似性损失（）criteria=（设备）的标准random.seed（seed_val）火炬手动进给（seed_val）我们将存储大量数据，例如培训和。。。

达乌德·阿斯加扎德

1

问4月22日8:16

1 投票

1 回答

58 意见

确保Python函数中的等效性：了解实现影响

在定义功能等效性时，有几个因素起作用：产生同等结果共享相同（非）终止行为类似地，变异（非本地）内存保持一致。。。

阿德里安

121

问4月19日15:23

三投票

三答案

145 意见

C++标准是否规定了“函数的副作用在评估之前进行排序”？

我在评估顺序中没有找到相关术语。那么函数g的行为在下面的代码中是未定义的吗？整数x；int f（）{return x++；}无效g（）{x=f（）；}我在……上编译了代码。。。

纳勒米

63

问4月17日10:17

0 投票

0 答案

88 意见

句子转换框架中每个历元的模型损失值

我正在尝试使用句子变换器来微调预先训练的语言模型。我使用的模型是基于伯特的。我使用的方法是通过siam网络进行精细运行，因此为了。。。

达乌德·阿斯加扎德

1

问4月15日13:43

0 投票

0 答案

18 意见

如何Span查询arize phoenix中的评估

我正在制作一个RAG应用程序，并使用arize phoenix作为我的日志。我可以进行评估，但似乎无法进行查询，以获取数据帧中的评估结果。有人有。。。

流离失所

1

问4月9日12:45

0 投票

0 答案

20 意见

测试和评估互连软件服务的潜在复杂系统

如何用科学引文对互连的软件服务进行整体测试和评估？我希望通过了解确定性、增加可预测性和考虑更多因素来最小化风险。。。

穆阿扎里

127

问4月5日2:05

0 投票

0 答案

37 意见

如何为带有Minimax+alpha-beta修剪的Drawts/Checkers游戏生成有效的Evaluation函数？

为一个学术项目制作跳棋游戏，并努力制定有效的评估方法来推动某些场景。我的游戏逻辑看起来很好，所有功能都很好。。。

阿勒法湾

1

问3月20日23:37

0 投票

0 答案

30 意见

scikit-learn中的交叉验证和/或train_test_split？

如果我使用交叉验证技术，你能解释一下我是否还需要进行train_test split吗？如果我这样做，我应该只在火车组上使用交叉验证吗？最佳实践是什么。。。

安娜·格罗莫维奇

9

问3月17日7:32

堆栈溢出上的Collections™

标记为[评估]的问题

为什么循环中classification_report和precision_recall_fscore_support的敏感度（召回）值不同？

计算精确度和召回率的问题

预测前k个元素的平均倒数秩（MRR）理解

意外的搜索结果：Gmail搜索如何解释高级查询，以及我如何使用这些信息来实现精度？

如何用一些操作符解释零平衡表达式的优先级计算？

为什么二进制分类的catboost自定义eval_metric的近似变量包含负值？

如何在下面的代码中添加每个历元的验证准确性？

确保Python函数中的等效性：了解实现影响

C++标准是否规定了“函数的副作用在评估之前进行排序”？

句子转换框架中每个历元的模型损失值

推荐系统中的评估

如何Span查询arize phoenix中的评估

测试和评估互连软件服务的潜在复杂系统

如何为带有Minimax+alpha-beta修剪的Drawts/Checkers游戏生成有效的Evaluation函数？

scikit-learn中的交叉验证和/或train_test_split？

热门网络问题

堆栈溢出上的Collections™

标记为[评估]的问题

相关标签