04 2025 档案
摘要:前情提要 DeepSeek V3是一个MOE结构的模型,本文仅解读文中介绍的序列内负载均衡损失:Complementary Sequence-Wise Auxiliary Loss,至于序列间负载均衡Auxiliary-Loss-Free Load Balancing,由于简单易懂本文不做解读,但是
阅读全文
摘要:本文主要记录twitch使用OBS直播时的推流链接,因为这个链接在官网找不到很全的,这里记录一下,内容来自于:https://www.julydate.com/post/3500430050/ twitch直播推流服务器地址在这里找: https://ingest.twitch.tv/ingests
阅读全文
摘要:0. 背景介绍 许多B站主播在直播手机游戏时面临诸多不便:手机端Bilibili APP直播功能有限、无法自定义直播间布局,且直播控制窗口会遮挡游戏画面。本文将详细介绍通过scrcpy实现手机投屏电脑直播的解决方案,有效解决上述问题。 1. 准备工作 1.1 硬件要求 安卓手机(系统需Android
阅读全文
摘要:0. 动机 我们在使用vscode调试python文件时,经常需要将一个shell脚本中的命令填写到launch.json文件中,这在参数特别多的时候是个非常费劲的工作。 比如,有如下shell脚本,需要调试: python -m train.py \ --model_name ${MODEL} \
阅读全文

浙公网安备 33010602011771号