会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
wangssd
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
5
6
7
8
9
10
11
12
13
···
32
下一页
2025年8月22日
微信小程序组件
摘要: 常位于同一个目录下,且具有相同的文件名(后缀不同),例如 index.js, index.json, index.wxml, index.wxss。小程序框架会自动将它们关联起来。 1. .js 文件 - 逻辑层 作用:处理页面的业务逻辑、数据、生命周期、用户交互事件等。 它是页面的“大脑”。 数据
阅读全文
posted @ 2025-08-22 20:28 wangssd
阅读(56)
评论(0)
推荐(0)
2025年8月18日
spaCy
摘要: spaCy官方提供了两个中文语言模型:zh_core_web_sm(小型)和zh_core_web_trf(基于Transformer)。 1. zh_core_web_sm (小型模型) 模型架构 基础架构:基于CNN的神经网络管道 组件构成: 分词器:基于规则的中文分词器 词性标注(Tagger
阅读全文
posted @ 2025-08-18 11:38 wangssd
阅读(106)
评论(0)
推荐(0)
2025年8月15日
生成式大模型的预训练流程
摘要: 生成式大语言模型(如GPT系列)的预训练过程主要通过无监督学习从海量文本中捕捉语言规律。 1. 数据集制作 数据来源: 多样化文本:网页(Common Crawl)、书籍(如BookCorpus)、维基百科、代码库等。 数据规模:通常达TB级别,涵盖数十种语言(单语或多语模型)。 预处理: 清洗:过
阅读全文
posted @ 2025-08-15 09:08 wangssd
阅读(112)
评论(0)
推荐(0)
2025年8月14日
前端 html页面中各个元素介绍 head、body
摘要: HTML 文档中,<head> 和 <body> 是两个主要的部分 <head> 元素 作用:包含文档的元数据(metadata),不会直接显示在页面中 包含内容: 文档标题 (<title>) 字符集声明 (<meta charset="utf-8">) 视口设置 (<meta name="vie
阅读全文
posted @ 2025-08-14 11:24 wangssd
阅读(286)
评论(0)
推荐(0)
flask 进行前后端数据交互
摘要: 前端页面用户的输入传递到后端主要通过 HTTP 请求实现,常见的方式包括: 表单提交(GET/POST) AJAX 请求(异步传输) URL 参数(GET 请求) 1.表单提交(GET/POST) 前端(HTML 表单) <!-- templates/form.html --> <form meth
阅读全文
posted @ 2025-08-14 10:23 wangssd
阅读(172)
评论(0)
推荐(0)
2024年2月19日
常用知识点
摘要: 1 介绍下什么是Word2vec 在介绍Word2Vec之前需要先理解Word Embedding,它是将无法直接计算的、非结构化的单词转化为可计算的、结构化的数据-向量; 那么什么是Word2Vec呢? Word2vec 是 Word Embedding 的方法之一。他是 2013 年由谷歌的 M
阅读全文
posted @ 2024-02-19 08:39 wangssd
阅读(232)
评论(0)
推荐(0)
2024年2月18日
数仓分层
摘要: 数仓分层概念: 原始 >明细 >汇总(按汇总程度进行划分 轻度汇总、中度汇总、重度汇总) (如:按天汇总、按累计n天汇总、特征宽表) Sql查询语句 复杂,引入分层,可以方便问题定位,复杂问题简单化。
阅读全文
posted @ 2024-02-18 22:18 wangssd
阅读(49)
评论(0)
推荐(0)
常用算法
摘要: 最长递增子序列长度 给你一个整数数组 nums,找到其中最长严格递增子序列的长度。 子序列 是由数组派生而来的序列,删除(或不删除)数组中的元素而不改变其余元素的顺序。例如,[3,6,2,7] 是数组 [0,3,1,6,2,2,7] 的子序列。 解题思路:找出序列中最长子序列的长度 1.动态规划法
阅读全文
posted @ 2024-02-18 22:08 wangssd
阅读(36)
评论(0)
推荐(0)
2023年9月5日
NLP 概念
摘要: 序列标注,给定一个序列,找出序列中每个元素对应的标签。 中文分词、词性标注、命名实体识别都可以转化为序列标注问题。 词法分析:中文分词、词性标注、命名实体识别 中文分词:将文本分隔为有意义的词语 词性标注:确定每个词语的类别和浅层的歧义消除 命名实体识别:识别出较长的专有名词(人名、地名、机构名、股
阅读全文
posted @ 2023-09-05 11:45 wangssd
阅读(183)
评论(0)
推荐(0)
2023年9月4日
NLP 序列标注
摘要: 转载:https://blog.csdn.net/kevinjin2011/article/details/113939817 序列标注(Sequence labeling)是NLP问题中的基本问题。在序列标注中,我们想对一个序列的每一个元素标注一个标签。一般来说,一个序列指的是一个句子,而一个元素
阅读全文
posted @ 2023-09-04 16:27 wangssd
阅读(323)
评论(0)
推荐(0)
上一页
1
···
5
6
7
8
9
10
11
12
13
···
32
下一页
公告