Loss Function in Machine Learning

About 129,000,000 results

Open links in new tab

Any time

zhihu.com
https://www.zhihu.com › tardis › zm › art
损失函数｜交叉熵损失函数 - 知乎
1.3 Cross Entropy Loss Function（交叉熵损失函数） 1.3.1 表达式 (1) 二分类在二分的情况下，模型最后需要预测的结果只有两种情况，对于每个类别我们的预测得到的概率为和，此时表达式为（的底 …
zhihu.com
https://www.zhihu.com › question
深度学习的多个loss如何平衡？ - 知乎
多个loss引入pareto优化理论，基本都可以涨点的。例子： Multi-Task Learning as Multi-Objective Optimization 可以写一个通用的class用来优化一个多loss的损失函数，套进任何方法里都基本会涨点 …
zhihu.com
https://www.zhihu.com › tardis › bd › art
十分钟读懂旋转编码（RoPE） - 知乎
Sep 23, 2025 · 旋转位置编码（Rotary Position Embedding，RoPE）是论文 Roformer: Enhanced Transformer With Rotray Position Embedding 提出的一种能够将相对位置信息依赖集成到 self …
zhihu.com
https://www.zhihu.com › question › answers › updated
深度学习模型训练的时候，一般把epoch设置多大？ - 知乎
在机器学习中，epoch 数量是指整个训练集通过模型的次数。一个Epoch意味着训练数据集中的每个样本都有机会更新内部模型参数。 Epoch由一个或多个Batch组成。选择合适的 epoch 数量是一个关键 …
zhihu.com
https://www.zhihu.com › question
深度学习的loss一般收敛到多少？ - 知乎
看题主的意思，应该是想问，如果用训练过程当中的loss值作为衡量深度学习模型性能的指标的话，当这个指标下降到多少时才能说明模型达到了一个较好的性能，也就是将loss作为一个evaluation metrics …
zhihu.com
https://www.zhihu.com › question
神经网络训练结束后，模型保存的参数是损失最小那个epoch的吗还是 …
例如我训练100轮第90轮的loss=0.6552之后的几轮损失逐渐变大到19.7265。训练结束后我的模型的权重是损失最低的那一轮的还是最后一轮的？
zhihu.com
https://www.zhihu.com › question
训练3D医学分割网络，BCE loss正常下降，Dice Loss一直不下降，最后 …
不是医学分割，我做的是一个条带状地图目标的分割。24年1月29日，凌晨3点睡不着起来写代码，发现dice_loss下降尤其慢。我不认为修改dice_loss的比例能解决问题，到时候消融实验都不好做，以 …
zhihu.com
https://www.zhihu.com › question
我打游戏的时候一直丢包，想问怎么确定是路由器，运营商还是电脑问 …
你ping的是网关，丢包，那么就是和网关之间存在问题。如果是有线连接那么是线的问题或者路由器本身的质量问题，是否用了太久？比如十年？二十年？如果是无线连接大概率是无线连接，有线连 …
zhihu.com
https://www.zhihu.com › question
神经网络模型train_loss下降，val_loss一直上升是什么原因？ - 知乎
train_loss 不断下降， test_loss 不断上升，和第2种情况类似说明网络过拟合了。应对神经网络过拟合的方法包括：简化模型。通过减少神经网络层数或神经元数量来降低模型复杂度，从而减少过拟合风 …
zhihu.com
https://www.zhihu.com › question
diffusion model的loss下降趋势是什么样的？ - 知乎
diffusion model的loss下降趋势是什么样的？扩散模型的loss（l1，l2）下降有收敛性吗？我在跑扩散模型的时候发现loss并没有下降的趋势，一直在一个范围内反复震荡（可能在开始的时候会有下降的… …

Pagination
- 1
- 2
- 3
- Next