Fork me on GitHub
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 37 下一页
摘要: 1 修饰属性或变量 无论属性是基本类型、引用类型,都使变量里存放的“值”不可变。 常和static关键字协作,作为常量: 基本类型,变量放的是实实在在的值,如1,“abc” 引用类型,变量放的是个地址,所以final修饰引用类型变量指里面的地址不能变,即它只能指向初始时指向的那个对象,不关心指向的对 阅读全文
posted @ 2025-04-08 10:50 公众号-JavaEdge 阅读(212) 评论(0) 推荐(0)
摘要: 0 要点总结 Meta发布 Llama 4 系列的首批模型,帮用户打造更个性化多模态体验 Llama 4 Scout 是有 170 亿激活参数、16 个专家模块的模型,同类中全球最强多模态模型,性能超越以往所有 Llama 系列模型,能在一张 NVIDIA H100 GPU 上运行。该模型支持业界领 阅读全文
posted @ 2025-04-06 23:03 公众号-JavaEdge 阅读(184) 评论(0) 推荐(0)
摘要: 这个错误 ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate 指出 Python 在尝试建立安 阅读全文
posted @ 2025-04-04 15:40 公众号-JavaEdge 阅读(512) 评论(0) 推荐(0)
摘要: 0 前言 null,表示无引用指向或没有指针,若操作该变量会引发空指针异常,即NullPointerException,NPE。 当线上发生该异常,说明代码健壮性不足,如何才能避免NPE?NPE虽烦,但易定位,关键在null到底意味啥: client给server一个null,是其本意就想给个空值, 阅读全文
posted @ 2025-04-03 16:29 公众号-JavaEdge 阅读(69) 评论(0) 推荐(0)
摘要: DeepSeek-R1 会推理,GPT-4o 会看。能否让 1 LLM既能看又能推理? DeepSeek-R1取得很大成功,但它有个问题——无法处理图像输入。 1.1 DeepSeek模型发展 自2024.12,DeepSeek已发布: DeepSeek-V3(2024.12):视觉语言模型(VLM 阅读全文
posted @ 2025-03-27 22:08 公众号-JavaEdge 阅读(108) 评论(0) 推荐(1)
摘要: 0 前言 LLM凭借其生成连贯文本、翻译语言甚至进行对话的能力,彻底改变人工智能领域。然而,尽管这些模型表现出色,它们在推理和理解复杂上下文方面仍然面临重大挑战。 这些模型擅长识别并模仿训练数据中的模式,但当任务需要真正的理解和逻辑推理时,它们往往遇困。可能导致: 长对话中的不一致 难以关联分散的信 阅读全文
posted @ 2025-03-24 22:54 公众号-JavaEdge 阅读(153) 评论(0) 推荐(0)
摘要: 0 前言 自从 OpenAI 在 2023 年推出函数调用(Function Calling),我一直思考,咋能真正解锁 AI Agent与工具的生态系统。随基础模型越来越智能,AI Agent与外部工具、数据和 API 的交互方式却变得越来越碎片化——开发者需针对每一个系统单独编写业务逻辑,让Ag 阅读全文
posted @ 2025-03-23 22:11 公众号-JavaEdge 阅读(360) 评论(0) 推荐(0)
摘要: 1 啥是注意力? 人类观察事物,能快速判断一种事物,是因为大脑能很快把注意力放在事物最具辨识度的部分从而作出判断,而非从头到尾一览无遗观察一遍才能有判断。基于这样的观察实践,产生了注意力机制(Attention Mechanism)。 想象你在人群中找一个穿红衣服的人。你不会一一检查每个人的鞋子、裤 阅读全文
posted @ 2025-03-18 16:51 公众号-JavaEdge 阅读(131) 评论(0) 推荐(0)
摘要: 1 回译增强的核心机理 1.1 跨语言语义重构原理 目前文本数据增强方面效果较好的增强方法。回译数据增强(Back-translation Augmentation)是基于神经机器翻译的文本再生技术,其核心运作流程包含三个关键阶段: 语义编码阶段:源语言文本通过NMT模型编码为中间语义表示 跨语言迁 阅读全文
posted @ 2025-03-16 21:38 公众号-JavaEdge 阅读(152) 评论(0) 推荐(0)
摘要: 1 特征工程的意义 nlp任务中,原始文本经数值映射后形成的词向量序列,难充分表达语言深层语义特征。就需引入文本特征增强技术: 语义信息补全:突破单词语义局限,捕获词序关联特征 模型适配优化:构建符合算法输入规范的矩阵结构 评估指标提升:通过特征增强直接影响模型准确率、召回率等核心KPI 如电商评论 阅读全文
posted @ 2025-03-15 23:47 公众号-JavaEdge 阅读(69) 评论(0) 推荐(0)
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 37 下一页