2024 年 11月 20 日随笔档案 - bonelee

2024年11月20日

摘要：针对前面RAG测试的长文本问题，我又增加了长文本测试（代码同前）： context_test_documents = [ # 文档1: AI发展史 (约2500 tokens) """ 人工智能的发展历程可以追溯到20世纪50年代。1950年，图灵提出著名的"图灵测试"，这被认为是人工智能研究的开端阅读全文

posted @ 2024-11-20 15:52 bonelee 阅读(153) 评论(0) 推荐(0)

RAG中late chunking的实验效果测试（续）

摘要：前文使用了jina ai v2的模型，接下来我们看看v3版本late chunking的实际效果，为了快速，我直接使用官方的api！ # import requests # url = 'https://api.jina.ai/v1/embeddings' headers = { 'Content- 阅读全文

posted @ 2024-11-20 15:50 bonelee 阅读(165) 评论(0) 推荐(0)

RAG中late chunking的实验效果测试

摘要：代码： import os import json import torch import numpy as np import spacy from spacy.tokens import Doc from spacy.language import Language import transfo 阅读全文

posted @ 2024-11-20 11:58 bonelee 阅读(254) 评论(1) 推荐(0)

将者，智、信、仁、勇、严也。

Hi，我是李智华，华为-安全AI算法专家，欢迎来到安全攻防对抗的有趣世界。

公告