会员
周边
众包
新闻
博问
闪存
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
又见阿郎
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
3
4
5
6
7
8
9
10
11
···
26
下一页
2023年8月27日
聊聊HuggingFace Transformer
摘要: ## 概述 参见:[聊聊HuggingFace](https://www.cnblogs.com/zhiyong-ITNote/p/17640835.html) ## 项目组件 一个完整的transformer模型主要包含三部分:Config、Tokenizer、Model。 ### Config
阅读全文
posted @ 2023-08-27 10:40 又见阿郎
阅读(1641)
评论(0)
推荐(0)
2023年8月18日
聊聊Hugging Face
摘要: ## 概述 HuggingFace是一个开源社区,提供了开源的AI研发框架、工具集、可在线加载的数据集仓库和预训练模型仓库。HuggingFace提出了一套可以依照的标准研发流程,按照该框架实施工程,能够在一定程度上规避开发混乱、开发人员水平不一致的问题,降低了项目实施的风险及项目和研发人员的耦合度
阅读全文
posted @ 2023-08-18 16:09 又见阿郎
阅读(1043)
评论(0)
推荐(0)
2023年8月17日
聊聊Embedding(嵌入向量)
摘要: 摘要自《深入浅出Embedding》一问。具体详细内容请移步该书。 ## 概述 简单来说,嵌入是用向量表示一个物体,这个物体可以是一个单词、一条语句、一个序列、一件商品、一个动作、一本书、一部电影等,可以说嵌入(Embedding)涉及机器学习、深度学习的绝大部分对象。这些对象是机器学习和深度学习中
阅读全文
posted @ 2023-08-17 15:26 又见阿郎
阅读(913)
评论(0)
推荐(0)
2023年8月11日
聊聊语言模型与知识图谱
摘要: ## 语言模型 语言模型泛指:大语言模型LLM、通用模型GLM。 语言模型也是知识库。基于语言模型下的实现,比如ChatGPT,BERT,ChatGLM等等,这类知识库就像是已经人为处理好、编排好、可直接使用的知识库。 ## 知识图谱 知识图谱的定义由Google公司在2012年提出,被界定为用来提
阅读全文
posted @ 2023-08-11 09:49 又见阿郎
阅读(230)
评论(0)
推荐(0)
2023年8月6日
聊聊自然语言处理NLP
摘要: ## 概述 自然语言处理(NLP)的正式定义:是一个使用计算机科学、人工智能(AI)和形式语言学概念来分析自然语言的研究领域。不太正式的定义表明:它是一组工具,用于从自然语言源(如web页面和文本文档)获取有意义和有用的信息。NLP工具的实现一般是基于机器学习与深度学习、其它算法(Lucene Co
阅读全文
posted @ 2023-08-06 20:06 又见阿郎
阅读(594)
评论(0)
推荐(1)
2023年7月22日
聊聊日志聚类算法及其在工作中的应用场景
摘要: 随着AI模型的普及应用与高速发展,主要的云厂商与AI大厂提供了对应的服务支持,使得业务的应用可以轻松对接AI算法,使其在实际项目中落地。 我个人也是极度推崇在项目中应用AI算法更轻松更数智化的兑现功能。 虽然AI门槛很高,但随着时间的推移与AI模型的发展,我相信对于普通的程序猿来说,还是可以入手且实
阅读全文
posted @ 2023-07-22 19:14 又见阿郎
阅读(837)
评论(0)
推荐(0)
2023年7月15日
聊聊我认为的分布式、集群实现关键点
摘要: 基于常见的中间件(Mysql、ElasticSearch、Zookeeper、Kafka、Redis)等分布式集群设计的机制,自己总结了在在集群设计过程中需要考虑的通用问题。 ### 节点通信机制 主节点的增加、删除、通信机制。 ### 路由算法 即数据路由到哪个节点的策略机制。在集群内有多个节点,
阅读全文
posted @ 2023-07-15 13:55 又见阿郎
阅读(64)
评论(0)
推荐(0)
2023年7月10日
聊聊Zookeeper技术内幕之客户端与SetData请求处理
摘要: 从客户端会话创建到网络连接、请求处理,简单的叙述下流程与逻辑 ### 客户端 客户端是开发人员使用ZooKeeper最主要的途径,ZooKeeper的客户端主要由以下几个核心组件组成。 - ZooKeeper实例:客户端的入口。 - ClientWatchManager:客户端Watcher管理器。
阅读全文
posted @ 2023-07-10 21:21 又见阿郎
阅读(107)
评论(0)
推荐(0)
2023年7月1日
聊聊Kafka的生产者消费者确认机制
摘要: ## 生产者确认机制 消息从生产者客户端发送至broker服务端topic,需要ack确认。`acks`与`min.insync.replicas`是两个配置参数.其中`acks`是producer的配置参数,`min.insync.replicas`是Broker端的配置参数,这两个参数对于生产者
阅读全文
posted @ 2023-07-01 21:32 又见阿郎
阅读(2148)
评论(0)
推荐(1)
2023年6月27日
从kafka与Flink的事务原理来看二阶段提交与事务日志的结合使用
摘要: 两阶段提交的成立要基于以下假设: - 该分布式系统中,存在一个节点作为协调者,其他节点作为参与者,且节点之间可以进行网络通信。 - 所有节点都采用预写式日志,且日志被写入后即被保存在可靠的存储设备上,即使节点损坏也不会导致日志数据的丢失。 - 所有节点不会永久性损坏,即使损坏后也可以恢复。 ###
阅读全文
posted @ 2023-06-27 13:33 又见阿郎
阅读(452)
评论(0)
推荐(0)
上一页
1
···
3
4
5
6
7
8
9
10
11
···
26
下一页
公告