刷新
词向量笔记 (CS224N-1)

博主头像 传统方式 先探讨一个问题,我们怎么获取一个词语有用的含义? 以前常用的NLP解决方法,使用WordNet,这是一个包含同义词和上位词列表的同义词库 传统NLP中,我们用独热向量作为特征,这导致需要的特征向量维度过大,且由于独热向量都是正交的,所以词与词之间没有关联。 Word2Vec Word2Ve ...

LLM生成代码后,如何一键合并到源代码中(FastApply技术研究)

博主头像 背景 在大语言模型越来越火的今天,越来越多的应用场景开始使用大语言模型来解决实际问题。而辅助编程可以算是大语言模型应用得最成功的场景之一了。早先的时候,更多使用的还是代码补全的能力,但是现在,各家产品都开始支持Chat和Agent的能力了。 之前一直有个疑问,生成的代码明明只是片段,也没有一个很好的 ...

【搜广推打怪升级】1. ItemCF实践

前言:本人开通此博客,期望能够督促自己提升代码能力。 个人情况:本2泛商科专业,9硕在读,较熟悉sql数据处理,仅有一点python皮毛。 今天正式开始搜广推打怪升级之路。 其实在开始今天的博客之路之前,已经基本过了一遍①王树森老师的推荐算法公开课(b站直搜即可),②项亮老师的《推荐系统实践》,③王 ...

Manus爆火,是硬核还是营销?

博主头像 Manus是一款引发热议的通用Agent产品,凭借强大任务处理能力及营销手段备受关注,其爆火带动了开源复刻潮,并为垂直领域智能体开发提供灵感,如图数据库智能体Chat2Graph。 ...

关于我用Claude 3.7 Sonnet模型直接生成小程序

博主头像 关于我用Claude 3.7 Sonnet模型直接生成小程序 前言 最近AI一直是很火的话题,Deepseek也是一夜爆火,但是实际使用下来发现Deepseek好像和其他大模型一样,并没有什么厉害之处,而且官网经常服务器繁忙。 当我使用Claude 3.7 Sonnet之后才算是被惊讶到,在此之前我 ...

一文读懂知识蒸馏

博主头像 一文读懂知识蒸馏 一句话解释:知识蒸馏是一种模型压缩技术(model compression technique),通过让小模型(学生模型)学习大模型(教师模型)的输出或中间表示,以在保持精度的同时减少计算量和存储需求。 传统意义上的知识蒸馏 背景知识及总览 Bucilua等人(2006年)首次提出 ...

从家用显卡到AI文生视频——Wan2.1本地部署教程与一键包分享

博主头像 今天要聊一聊AI文生视频的最新进展。一直以来,AI生成视频对硬件的要求都让人望而却步,尤其是家用显卡,总是感觉“心有余而力不足”。 AI文生视频以前 基本需要的显存大概几十上百G 但最近,阿里开源的 Wan2.1 彻底改变了这一局面!它不仅让普通消费级GPU也能轻松生成视频,还能在短短10分钟左右搞 ...

数据集蒸馏论文速读

博主头像 Dataset Distillation 18年的论文,最早提出数据蒸馏的概念 理论 通常的梯度下降是小批量的 SGD,每次都需要从训练数据中选一个 minibatch 来更新。这篇文章的重点是学习到一个合成数据 \(\hat x=\{\hat x_i\}_{i=1}^M\) 和学习率 \(\hat ...

大模型知识引擎 LKE 新手入门指南:官方文档难懂?看这篇就够了

博主头像 昨天简单体验了一下大模型知识引擎(LKE),总体来说,虽然其功能方面还有一定欠缺,但在一些特定领域,特别是RAG(Retrieval-Augmented Generation)技术的应用上,还是表现出了一些优势。通过这种技术,LKE能够提供相对准确和高效的回答,尤其是在需要快速检索和生成信息的场景下 ...

京准电钟:北斗卫星授时服务,托举医疗系统高效运行

博主头像 京准电钟:北斗卫星授时服务,托举医疗系统高效运行 京准电钟:北斗卫星授时服务,托举医疗系统高效运行 京准电子科技官微——ahjzsz 以下是针对医疗系统的时间同步技术方案的设计框架,旨在满足医疗行业对时间同步的高精度、高可靠性和安全性需求: 1. 需求分析 医疗场景特殊性 医疗设备(如监护仪、影像设 ...

换掉vs code! AI编程时代的「国民神器」要来了!!

博主头像 当代码补全还在依赖插件时,当复杂项目搭建需要熬夜加班时,字节跳动用Trae IDE重新定义了开发者的工作方式。这款国内首个AI原生IDE,正在掀起一场编程效率革命。 一、AI原生的「超级大脑」 Trae IDE的核心竞争力,在于将AI深度融入开发全流程。它不仅能像普通IDE一样编写代码,更能通过自然 ...

干货!北大出品DeepSeek提示词工程和落地场景PPT分享

博主头像 《DeepSeek提示词工程和落地场景》 是北大DeepSeek内部讨论的第二个PPT, 由北京大学AI肖睿团队,联合北大青鸟人工智能研究院、北大计算机学院元宇宙技术研究所、北大教育学院学习科学实验室联合出品的DeepSeek系列PPT。 内容摘要 本次讲座为DeepSeek原理和应用系列研讨的讲座 ...

干货!北大出品DeepSeek与AIGC应用PPT分享

博主头像 干货!北大出品DeepSeek与AIGC应用PPT分享 《北京大学DeepSeek系列-DeepSeek与AIGC应用》 是由北京大学AI肖睿团队,联合北大青鸟人工智能研究院、北大计算机学院元宇宙技术研究所、北大教育学院学习科学实验室联合出品的DeepSeek系列PPT。 内容摘要 本次讲座为Dee ...

当懒惰遇上AI:我如何用Coze让大模型帮我整理2.5万字课程笔记

博主头像 能写代码绝不动手,能用AI绝不写代码 —— AI粉嫩特攻队信条 通过本文学会打造这个AI工具,只有一个要求:识字且会上网! 一个小困扰 有朋友最近在上一位大佬的线上直播课程,感叹道: "老师讲得很好但节奏太快,根本来不及记录详细笔记,只能速记要点。课后想不起完整内容又怕有遗漏,只能来回拖动进度条找对 ...

AI语音转文字:支持视频/音频/批量转换,从日常便利到创作利器,我手搓了一个神器给你

博主头像 在现代生活中,语音转文字是我们触手可及的实用工具。试想一下,开会时,你只需轻轻点开手机录音功能,会议结束后,将音频转化为文字,再丢给AI,几分钟后,一份条理清晰的会议纪要就新鲜出炉。 或者,你是个视频剪辑达人,想要“借鉴”同行文案,只需把他们的视频语音转成文字,喂给AI稍作伪原创,摇身一变,就成了你 ...

<1···222324···29>