摘要:
互联网从业必备技能-bash编程入门到精通教程 https://lqfarmer.blog.csdn.net/article/details/123958233 解决raw.githubusercontent.com无法访问的问题 https://blog.csdn.net/weixin_44293
阅读全文
posted @ 2022-06-10 23:48
风生水起
阅读(76)
推荐(0)
2025年10月21日
摘要:
Naive RAG,是试图让AI在没有地图的情况下,靠嗅觉找到宝藏。 Complex Agent,是试图训练一个没有地图的AI,学会使用各种交通工具。 而真正的出路,是Ontology RAG。它的核心,不是让AI更“能干”,而是让AI先“看懂世界”。 Ontology具体做了什么事情? 我们结合航
阅读全文
posted @ 2025-10-21 09:33
风生水起
阅读(2)
推荐(0)
2025年10月17日
摘要:
Github上有几个不错的文本切分相关的优秀项目,涵盖了不同技术方向和应用场景: AntSK-FileChunk 特点:基于语义理解的智能文本切片工具,支持PDF、Word、纯文本等多种格式,通过语义分析和向量计算确保切片的语义完整性和连贯性。 GitHub地址:https://github.com
阅读全文
posted @ 2025-10-17 05:54
风生水起
阅读(18)
推荐(0)
2025年10月16日
摘要:
设置 Firefox 在点击书签后在新标签页打开,可以通过修改浏览器的高级配置参数来实现。下面我给你详细说明操作方法。修改配置参数主要通过修改 about:config 中的两个参数来控制书签打开方式:参数名称 默认值 功能描述browser.tabs.loadBookmarksInTabs fal
阅读全文
posted @ 2025-10-16 15:52
风生水起
阅读(59)
推荐(0)
2025年10月15日
摘要:
赋能智能体:Palantir Foundry本体工程如何构建企业级AI的“可编程数字孪生” 摘要: 随着大语言模型(LLM)驱动的智能体(AI Agent)成为企业数字化的核心驱动力,传统的数据基础设施面临“可行动性”和“可信赖度”的挑战。Palantir Foundry的本体论(Ontology)
阅读全文
posted @ 2025-10-15 19:31
风生水起
阅读(78)
推荐(0)
摘要:
引言:为什么“本体工程”在当下越来越被强调? 在 AI+业务落地的浪潮中,很多团队一开始聚焦于模型(LLM、对话模型、检索模型等)、Prompt 设计、上下文检索(RAG)等技术维度。但在真实的企业环境里,落地 AI 的难点往往在于: 多源异构数据如何统一语义、对齐一致的业务视图 不同系统/流程/模
阅读全文
posted @ 2025-10-15 19:18
风生水起
阅读(113)
推荐(0)
2025年10月14日
摘要:
在我们过去一系列关于Palantir Ontology的文章中,我们已经深入剖析了其作为企业“数字孪生”的核心本质。我们反复强调,它的革命性之处在于,其设计理念彻底从传统的“以数据为中心”转向了“以决策为中心”。我们已经知道,它通过将构成决策的三大支柱:数据(信息基础)、逻辑(推理过程)和行动(执行
阅读全文
posted @ 2025-10-14 09:44
风生水起
阅读(97)
推荐(0)
2025年9月11日
摘要:
数据工程师:更多关心「基建」的问题,比如,数据链路如何构建、如何做技术选型、效率稳定性如何保障等等。 算法工程师:更多关心「模型」的问题,比如,具体某个算法是什么原理,如何调参等等。 数据分析师:运用工具解决「端到端」的问题,包括「问题抽象」、「业务洞见」、「讲故事」以及经济学、心理学的一些方法论和
阅读全文
posted @ 2025-09-11 16:45
风生水起
阅读(3)
推荐(0)
2025年9月4日
摘要:
https://mp.weixin.qq.com/s/hsalUdlx0KMtQh8U2gvnnw
阅读全文
posted @ 2025-09-04 09:19
风生水起
阅读(4)
推荐(0)
2025年9月2日
摘要:
如何衡量数据质量,如何衡量工作质量,如何让平台高效运转,以及如何了解frontier model所需要的数据类型和格式 你们现在天天搞Prompt工程,其实是在教AI‘怎么说’。而Palantir从始至终搞的本体工程,是在教AI‘怎么想’! 没教会它思考,你说得再花哨,它也只是在猜,在演。 将样本级
阅读全文
posted @ 2025-09-02 14:39
风生水起
阅读(9)
推荐(0)
2025年9月1日
摘要:
当然。将代码文本有效地切分成多个部分(Chunking)对于 RAG(检索增强生成)和大模型理解至关重要,因为它直接影响到检索的准确性和模型处理信息的质量。代码不同于自然语言,它有**严谨的结构**(语法、依赖关系、块状作用域)和**多种抽象层级**(项目、模块、类、函数、单行代码)。因此,不能简单
阅读全文
posted @ 2025-09-01 19:34
风生水起
阅读(37)
推荐(0)