• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
思想人生从关注生活开始
博客园    首页    新随笔    联系   管理    订阅  订阅
上一页 1 2 3 4 5 6 7 8 9 ··· 121 下一页
2025年4月8日
三个关键应标文件-投标函、开标一览表和投标价格体系表详解
摘要: 一、投标函(Bid Letter) 定义:投标函是投标人向招标方提交的正式书面文件,表明参与投标的意愿,并承诺遵守招标文件的要求。 作用: 法律效力:是投标文件的核心部分,具有法律约束力。 明确承诺:确认投标人对招标文件的响应(如工期、质量、价格等)。 格式要求:通常按招标文件提供的模板填写,需签字 阅读全文
posted @ 2025-04-08 15:36 JackYang 阅读(354) 评论(0) 推荐(0)
基于量子观点来看关税痛苦指数的多维感知重构:基于民众真实感受的量化模型
摘要: 一、感知维度解构框架 1. 核心感知维度分类 四维分析空间构建逻辑 将关税引发的社会经济影响拆解为两类正交维度,形成可量化的感知坐标系: 维度正交分解示意图 ^ | 主观感知强度 |(情绪放大效应) 高情绪敏感区 | [社交媒体焦虑指数 > 0.7] (如中国/越南) |______________ 阅读全文
posted @ 2025-04-08 11:16 JackYang 阅读(81) 评论(0) 推荐(0)
2025年4月2日
强化学习算法解析:PPO(Proximal Policy Optimization)
摘要: PPO(近端策略优化)是OpenAI于2017年提出的一种策略梯度类算法,以其高效性、稳定性和易实现性成为强化学习领域的主流算法。以下从核心原理、数学推导、代码实现到应用场景进行系统解析。 一、PPO 的核心设计思想 问题背景传统策略梯度方法(如TRPO)存在两大痛点: 更新步长敏感:步长过大易导致 阅读全文
posted @ 2025-04-02 15:49 JackYang 阅读(3916) 评论(0) 推荐(0)
RLHF(人类反馈强化学习)
摘要: 定义与核心思想 基于人类反馈的强化学习(reinforcement learning with human feedback)是一种结合传统强化学习与人类主观判断的机器学习范式。其核心思想是通过人类对智能体行为的直接评价(如偏好排序、评分或修正),动态调整模型的优化目标,使智能体在复杂、模糊的任务中 阅读全文
posted @ 2025-04-02 11:55 JackYang 阅读(374) 评论(0) 推荐(0)
人类反馈强化学习(RLHF)
摘要: 定义与核心思想 人类反馈强化学习(RLHF)是一种结合传统强化学习与人类主观判断的机器学习范式。其核心思想是通过人类对智能体行为的直接评价(如偏好排序、评分或修正),动态调整模型的优化目标,使智能体在复杂、模糊的任务中逐步逼近人类期望的行为模式。与传统强化学习依赖预设的数学化奖励函数不同,RLHF 阅读全文
posted @ 2025-04-02 11:40 JackYang 阅读(277) 评论(0) 推荐(0)
2025年4月1日
详解英语中的不定代词之some、any、many、much、few、little、a few、a little、all、both、each、every、something、anything、nothing、somebody、anybody、other、another、none、one
摘要: 不定代词是英语语法中的一个重要概念,它们不指代任何特定的人、事、物,而是具有泛指或不确定的含义。以下是对不定代词的详细说明,包括其定义、种类、用法及注意事项等方面。 一、不定代词的定义 不定代词(Indefinite pronouns)是指那些不指明代替任何特定名词或形容词的代词。它们在句子中可以作 阅读全文
posted @ 2025-04-01 19:42 JackYang 阅读(545) 评论(0) 推荐(0)
详解英语中物主代词my、your、his、her、its、our、your、 their、mine、yours、his、hers、ours、 yours、theirs
摘要: 物主代词详细说明 物主代词是英语中用于表示所有关系的一类代词,它们用于指明事物或行为的归属者。物主代词主要分为形容词性物主代词和名词性物主代词两大类,它们在句子中扮演着不同的角色,具有各自的用法和特点。以下是对物主代词的详细说明。 一、物主代词的定义与分类 定义:物主代词是表示所有关系的代词,用于指 阅读全文
posted @ 2025-04-01 18:44 JackYang 阅读(1116) 评论(0) 推荐(0)
javascript的正则表达式常用方法replace、split、test、exec、match、matchAll、search、compile、RegExp.$1、RegExp.$9
摘要: 一、正则表达式概述 正则表达式(Regular Expression,简称 Regex)是一种强大的工具,用于描述、匹配和操作字符串。它的核心功能是通过模式匹配来查找或验证目标字符串中的特定内容。为了更好地理解正则表达式的匹配机制以及 .test() 方法的工作原理,我们可以将其分为以下几个部分进行 阅读全文
posted @ 2025-04-01 10:31 JackYang 阅读(133) 评论(0) 推荐(0)
2025年3月31日
正则表达式匹配的基本过程与 .test() 方法的工作原理
摘要: 正则表达式(Regular Expression,简称 Regex)是一种强大的工具,用于描述、匹配和操作字符串。它的核心功能是通过模式匹配来查找或验证目标字符串中的特定内容。为了更好地理解正则表达式的匹配机制以及 .test() 方法的工作原理,我们可以将其分为以下几个部分进行详细阐述。 1. 正 阅读全文
posted @ 2025-03-31 19:45 JackYang 阅读(135) 评论(0) 推荐(0)
正则表达式匹配流程解析
摘要: 1. 编译阶段 正则表达式会被编译成 确定性有限自动机(DFA) 或 非确定性有限自动机(NFA),不同引擎实现不同。JavaScript 使用 回溯型 NFA 引擎(特点:支持复杂语法,但可能效率低)。 示例: const regex = /a+b/; // 编译为内部状态机 2. 匹配过程 2. 阅读全文
posted @ 2025-03-31 19:39 JackYang 阅读(69) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 9 ··· 121 下一页
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3