会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
人不疯狂枉一生
博客园
首页
新随笔
联系
订阅
管理
2024年12月10日
fastgpt尝试智能问数实战
摘要: 1.背景 大模型发展迅猛,各个行业在探索它的使用场景,今天要聊的是使用大模型进行数据查询(NL2SQL),众所周知大模型的训练费用一般公司是无法承受的,所以对于大部分企业只能从提示词和知识库进行入手,我们今天的例子就是结合提示词和知识库一起进行。fastgpt的搭建可以自行百度。2.数据准备根据需求
阅读全文
posted @ 2024-12-10 13:43 人不疯狂枉一生
阅读(1381)
评论(0)
推荐(0)
2024年11月8日
阿里DataWorks注册UDTF函数
摘要: 1.背景 最近有个需求需要解析mongodb里面的json数据,采用的开发平台是dataworks,原始json内容如下: { "id": 0,// 方案ID "premiseDetails": [ { "premiseId": 0,// 楼盘ID "price": 0, // 价格 "pointD
阅读全文
posted @ 2024-11-08 10:57 人不疯狂枉一生
阅读(76)
评论(0)
推荐(0)
2024年10月30日
项目管理知识体系梳理
摘要: 经常在做项目,但项目管理体系在大脑里面是混乱的,今天特意画一个图加深一下印象。 关注公众号了解更多知识:
阅读全文
posted @ 2024-10-30 09:16 人不疯狂枉一生
阅读(17)
评论(0)
推荐(0)
2024年5月31日
Langchain试用百度千帆
摘要: 之前聊了向量数据库,大模型也火了一段时间了,今天特地尝试一下基于Langchain进行百度千帆大模型的使用。Langchain相当于一个LLM编程框架,开发中无需过多关心各个大模型的接入,只需安装相关模型,统一通过Langchain去调用相关大模型进行使用。 1.环境准备 (1)python安装 L
阅读全文
posted @ 2024-05-31 10:17 人不疯狂枉一生
阅读(644)
评论(0)
推荐(0)
2024年5月28日
向量数据库HNSW算法
摘要: 向量数据库构建好embedding后,需要通过相关算法进行检索,它常用到的相似性搜索算法有HNSW,HNSW算法是NSW算法改进而来,它是属于ANN算法中不同类别的图类别中的一种。 节点与节点之间的连接方式可以形成3类图:正则图,随机图,正则和随机结合图(小世界),如下图1: 1.正则图 在图论中根
阅读全文
posted @ 2024-05-28 14:33 人不疯狂枉一生
阅读(604)
评论(0)
推荐(0)
2024年5月24日
向量数据库
摘要: 随着LLM的起飞,向量数据库也跟着火爆,好多做向量数据库的初创企业ppt刚写好,就拿到几千万美元的风投。 向量数据库是一种特殊的数据库,它是存储了一堆浮点数,这些浮点数排列到一起就像一个数组,这些浮点数在向量数据库里面被称为维度,通过这些维度向量数据库可以存储和检索海量的高维数据,支持复杂查询和分析
阅读全文
posted @ 2024-05-24 15:20 人不疯狂枉一生
阅读(162)
评论(0)
推荐(0)
2024年5月23日
Flink双流Join
摘要: Flink双流Join分为window join、internal join、connect、维表广播等方法,其中window join又分为Tumbling Window Join、Sliding Window Join、Session Window Join;connect只能连接两个流,并且数
阅读全文
posted @ 2024-05-23 10:32 人不疯狂枉一生
阅读(203)
评论(0)
推荐(0)
2024年5月21日
Flink富函数
摘要: 富函数是DataStream API提供的函数接口,Flink的函数都有它的Rich版本,它与其他函数不同的是,富函数可以获取到运行环境上下文,初始化参数,拥有生命周期方法等,可通过它进行自定义复杂功能。我们常见的如RichMapFunction、RichFilterFunction等。 富函数的生
阅读全文
posted @ 2024-05-21 12:40 人不疯狂枉一生
阅读(197)
评论(0)
推荐(0)
2024年5月20日
Flink内存模型
摘要: 之前聊Flink的slot时简单提到过内存,Flink计算框架的内存大致分为Flink使用的内存、Jvm使用的内存。Flink为什么不全使用JVM内存的原因是显而易见的,作为实时计算框架,JVM内存依赖GC自动回收一旦稍微慢一点,就会对系统性能造成巨大影响,而且使用JVM内存容易内存溢出,所以Fli
阅读全文
posted @ 2024-05-20 14:41 人不疯狂枉一生
阅读(124)
评论(0)
推荐(0)
2024年5月19日
Flink精确消费一次
摘要: 在大数据计算里面,计算引擎是处于承上启下的作用,对上承接数据源,对下承接各种各种数据库,比如mysql、oracle。对于任何数据计算来说要想精确消费一次,就需要支持事务或者幂等,我们最常见的支持事务的就是单点的oracle、mysql数据库,那么Flink作为分布式计算引擎,是如何做到精确消费一次
阅读全文
posted @ 2024-05-19 18:23 人不疯狂枉一生
阅读(160)
评论(0)
推荐(0)
下一页
公告