上一页 1 2 3 4 5 6 ··· 13 下一页
摘要: 1. Transformer模型 在Attention机制被提出后的第3年,2017年又有一篇影响力巨大的论文由Google提出,它就是著名的Attention Is All You Need[1]。这篇论文中提出的Transformer模型,对自然语言处理领域带来了巨大的影响,使得NLP任务的性能 阅读全文
posted @ 2021-09-14 00:10 ZacksTang 阅读(6518) 评论(1) 推荐(1) 编辑
摘要: 1. Attention与Transformer模型 Attention机制与Transformer模型,以及基于Transformer模型的预训练模型BERT的出现,对NLP领域产生了变革性提升。现在在大型NLP任务、比赛中,基本很少能见到RNN的影子了。大部分是BERT(或是其各种变体,或者还加 阅读全文
posted @ 2021-09-02 00:45 ZacksTang 阅读(1685) 评论(0) 推荐(0) 编辑
摘要: 1. 循环神经网络 在介绍循环神经网络之前,我们先考虑一个大家阅读文章的场景。一般在阅读一个句子时,我们是一个字或是一个词的阅读,而在阅读的同时,我们能够记住前几个词或是前几句的内容。这样我们便能理解整个句子或是段落所表达的内容。循环神经网络便是采用的与此同样的原理。 循环神经网络(RNN,Recu 阅读全文
posted @ 2021-08-28 17:30 ZacksTang 阅读(1759) 评论(0) 推荐(2) 编辑
摘要: 1. 自然语言处理简介 根据工业界的估计,仅有21% 的数据是以结构化的形式展现的[1]。在日常生活中,大量的数据是以文本、语音的方式产生(例如短信、微博、录音、聊天记录等等),这种方式是高度无结构化的。如何去对这些文本数据进行系统化分析、理解、以及做信息提取,就是自然语言处理(Natural La 阅读全文
posted @ 2021-08-24 20:36 ZacksTang 阅读(3596) 评论(1) 推荐(2) 编辑
摘要: 1. 什么是Debezium Debezium是一个开源的分布式平台,用于捕捉变化数据(change data capture)的场景。它可以捕捉数据库中的事件变化(例如表的增、删、改等),并将其转为事件流,使得下游应用可以看到这些变化,并作出指定响应。 2. Debezium常规使用架构 根据De 阅读全文
posted @ 2021-05-24 23:58 ZacksTang 阅读(3047) 评论(1) 推荐(0) 编辑
摘要: ClickHouse使用操作 这章主要介绍在ClickHouse使用的各个操作的注意点。常规的统一语法不做详细介绍。 1. Join操作 在ClickHouse中,对连接操作定义了不同的精度,包含ALL、ANY和ASOF三种类型,默认为ALL。可以通过join_default_strictness配 阅读全文
posted @ 2021-04-19 14:50 ZacksTang 阅读(3308) 评论(0) 推荐(1) 编辑
摘要: MergeTree系列表引擎 ClickHouse中最核心的引擎当属MergeTree系列引擎,其中基础表引擎为MergeTree,常用的表引擎还有ReplacingMergeTree、SummingMergeTree、AggregatingMergeTree、CollapsingMergeTree 阅读全文
posted @ 2021-04-16 22:41 ZacksTang 阅读(3982) 评论(0) 推荐(0) 编辑
摘要: MergeTree引擎 ClickHouse中有多种表引擎,包括MergeTree、外部存储、内存、文件、接口等,6大类,20多种表引擎。其中最强大的当属MergeTree(及其同一家族中)引擎。我们在前面的建表例子中也使用了MergeTree引擎。 MergeTree系列引擎,在写入一批数据时,数 阅读全文
posted @ 2021-04-14 23:54 ZacksTang 阅读(2312) 评论(1) 推荐(0) 编辑
摘要: ClickHouse使用 ClickHouse是一个面向列存储的OLAP分析数据库,以其强大的分析速度而闻名。有关ClickHouse的介绍可以参考其官网说明[1]。本文主要介绍它的基本使用。 1. 安装 使用的环境为2台 AWS EC2,操作系统为Amazon Linux2。使用的ClickHou 阅读全文
posted @ 2021-04-14 23:28 ZacksTang 阅读(2201) 评论(1) 推荐(1) 编辑
摘要: 使用AWS SageMaker进行机器学习项目 本文主要介绍如何使用AWS SageMaker进行机器学习项目。 1. 题目 使用的题目为阿里天池的“工业蒸汽量预测“,题目地址为: https://tianchi.aliyun.com/competition/entrance/231693/intr 阅读全文
posted @ 2021-04-10 03:10 ZacksTang 阅读(893) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 13 下一页