大模型 - 第19页 - 网站分类

原来用聊天记录就可以创造数字分身！WeClone项目在Lab4AI平台上的复现

01 | WeClone如何创造数字分身拥有一个数字分身可能是很多人的一个愿望。其实通过给大模型喂我们的聊天记录，就可打造出我们的数字分身，当前爆火的Weclone项目采取的就是这种做法。先导出自己的聊天记录，再把聊天记录作为数据用来微调大模型，让模型学习我们的语言风格和习惯，就能打造出专属的数字 ...

实战利用LLM辅助小程序逆向与HTTP报文漏洞挖掘

摘要在Web安全与小程序逆向分析中，传统的自动化扫描器（如AWVS、Nessus）往往是“语法大师，逻辑白痴”——它们能轻易发现SQL注入，却难以理解复杂的业务上下文。本文探讨了一种新的安全审计范式：利用大语言模型（LLM）作为虚拟安全专家，填补自动化工具的广度与人类专家的深度之间的鸿沟。通过婚 ...

Qwen是“源神”？实际上GLM-4.6才是被低估的黑马

在AI科技圈，Qwen因其开源模型数量位居世界第一、模型涵盖各种大小、开销低而表现不俗，被称为“源神（开源界的神）”。这也导致有些人在体验之后，觉得Qwen写的代码质量是国内第一，仅次于Claude、chatGPT、Gemini、grok这些国外大模型之后。但GLM却像是被遗忘了一样，网上对它知之甚 ...

优化需求评审流程论LLM与人工审查协同模式

重新定义需求评审的未来高质量的需求是软件项目成功的基石，然而，传统的需求评审流程往往耗时、繁琐且容易出错。需求文档中的模糊性、不一致性和遗漏是导致项目失败最常见的因素之一。大型语言模型（LLM）作为一种颠覆性技术，为解决这些长期存在的挑战提供了新的可能性。它强大的自然语言处理能力，能够以前所未有的 ...

揭开Claude Opus 4.5神秘面纱

一位对 AI 充满好奇的学习者——揭开 Claude Opus 4.5 的神秘面纱，清晰展示它在软件工程、安全性和多语言处理等领域取得的革命性进步。1. 软件工程领域的“超强大脑”无人能及的工程能力一个令人震撼的事实是：在一项时长2小时、极其困难的内部工程带回测试中，Opus 4.5 的得分“超过了 ...

SWE-smith规模化生成软件工程训练数据

1. 破解软件工程领域AI的数据瓶颈近年来，大型语言模型（LM）Agent在自动化软件工程（Software Engineering, SE）任务方面取得了显著进展。然而，在能力飞速提升的背后，开源社区与掌握海量私有数据的专有模型之间正形成一道日益扩大的鸿沟。其核心症结在于：高质量、大规模训练数据 ...

Gemini3在线构建一个基于女性照片解析的应用

Gemini3在线构建一个基于女性照片解析的应用预览https://ai.studio/apps/drive/1qoagJHJBONxI9dBd-MhYmstFwIM7lCRA在AI Studio中，直接就生成了效果图另一个案例代码在这儿https://github.com/ljylun/Panor ...

CodeWiki评估大型代码库整体文档生成能力思辨

阶段一：收集并审视证据1.1 引言：证据是思辨的基石任何严谨的思辨都始于对证据的无情审视。在对一项技术创新进行评估时，我们必须首先剥离所有的叙事与宣传，直面其最原始、最客观的事实。本章节将专注于从 CodeWiki 论文中提取核心事实、数据和声明，并对其来源、有效性和一致性进行严格的审视。这一过程如 ...

13. Spring AI 的观测性

13. Spring AI 的观测性 @目录13. Spring AI 的观测性观测性为什么Spring AI应用急需可观测性？AI服务成本失控的痛点Spring AI可观测性的价值实战演练：构建可观测的Spring AI翻译应用第一步：Spring AI项目初始化第二步：Spring AI客户端配 ...

Gemini 3发布与小试牛刀

Google Gemini 3 技术范式与生态系统深度研究报告发布日期：2025年11月Gemini 3 架构特性、多模态推理能力、智能体式开发环境（Antigravity）与市场竞争格局分析1. 引言：从对话智能到代理智能的代际跨越 2025年11月18日，Google DeepMind 正式对外 ...

千问快速review评审Java工程代码与异步代码智能体

千问快速review评审Java工程代码与异步代码智能体背景《Effective Java》是由 Joshua Bloch 编写的一本经典 Java 编程指南，被广泛认为是 Java 开发者必读的权威书籍之一。该书通过一系列具体、实用的“条款”（Items），帮助开发者写出更清晰、高效、健壮和可维 ...

基于DeepSeek-R1 15b微调训练自主的领域大模型，附带工程代码

基于DeepSeek-R1模型训练自主的领域大模型，例如打造针对钢铁、矿山、有色、稀土、建材、加工制造等领域的大模型。促进大模型技术在具体领域的应用与落地，助力行业向智能制造转型升级。本文介绍：（1）基础模型DeepSeek-R1-Distill-Qwen-1.5B与微调训练后的deepseek-1... ...

从Transformer到LLaMA：AI大模型工程化实践完整路径解析

完整的大模型技术指南：涵盖Transformer机制详解、主流模型对比分析，实战演示LLaMA/GLM4训练微调与推理部署流程，包含LangChain应用开发、RAG系统实现、Prompt工程技巧，配套多个企业级应用场景的完整代码。 ...

某豪猪发的 “跑通了！Deepseek 自动生成测试用例，太牛了！”，看起来好像很厉害的样子！

写在前面昨天刷手机，偶然刷到篇文章——《跑通了！Deepseek自动生成测试用例，太牛了！》，标题看着就很抓人，立马点进去瞅了瞅。里面配了好几张图，风格先不说，单说文件的类名，居然是中文的…… 这风格，怎么看都像机构号出品。没见过哪个同事写代码这么随意的，中文类名也太出戏了，哈哈。想表达什么 ...

不懂 Attention 不算懂 AI？十大奠基论文（一）：一文读懂《Attention Is All You Need》

摘要《Attention Is All You Need》论文开创性地提出Transformer架构，彻底改变了自然语言处理领域的技术路径。该论文解决了传统RNN/CNN模型的三大痛点：通过自注意力机制实现全局语义捕捉，摆脱了序列处理的低效性；多头注意力设计支持并行计算，大幅提升训练效率；缩放点积... ...

谷歌5天 AI Agents 课程

谷歌5天 AI Agents 谷歌5天 AI Agents 课程太硬核了，前三天连续发布白皮书，每一本都值得慢慢阅读，理论结合最佳实践，对重新理解和真正把 AI Agents 在企业中落地都很有帮助。1. Introduction to Agents https://kaggle.com/white ...

智能制造与AI人工智能落地

今天先到这儿，希望对AI，云原生，技术领导力，企业管理，系统架构设计与评估，团队管理, 项目管理, 产品管理，信息安全，团队建设有参考作用 , 您可能感兴趣的文章:微服务架构设计视频直播平台的系统架构演化微服务与Docker介绍Docker与CI持续集成/CD互联网电商购物车架构演变案例互联网业 ...

大模型基础（一）核心概念规整

基础概念梳理名词/概念词专业解释非专业举例说明参数模型内部可调整的数值，通过在大量数据上训练学习而得。它们是模型知识的载体，决定了模型如何处理输入并产生输出。好比一个超级大脑的神经元连接强度和数量。参数越多，这个“大脑”的结构越复杂，能记住和理解的知识就越多（比如GPT-3有1750亿个参 ...

借助LLM识别每一个物联设备

借助LLM识别每一个物联设备你是否曾在查看家庭Wi-Fi网络时，发现一个名字陌生的设备，心里咯噔一下？或者在入住Airbnb时，担心房间里是否藏着未经授权的监控摄像头？在这些情况下，一个看似简单的问题变得至关重要：“我的网络上到底有什么？” 这个问题不仅关乎好奇心，更直接关系到我们的隐私和安全。过 ...

豆包Seed-Coder编程能力小试

背景最近字节发布doubao-seed-code-preview-251028模型面向Agentic编程任务深度优化 - 支持256K长上下文，让模型轻松处理长代码文件、多模块依赖等复杂场景，更好支持端到端自主编程，在全栈开发中表现良好，前端能力尤为突出。 - 国内首个支持视觉理解能力的编程模型， ...